統計のウソ

2026-2-15

今年最初の1月1日付け#8で「計測」の話をしました。今回はそれにも関係すると思いますが、統計に関して考えて見たいと思います。
皆さん、「統計はウソをつかない」という言葉をどう思いますか?
筆者はそうは思いません。何故、そう思うのかを話したいと思います。

皆さんは、以下の言葉を聞いた事がありますか?
「統計はウソをつかないが、ウソつきは統計を使う」
「嘘、大嘘、そして統計(原文:There are three kinds of lies: lies, damned lies, and statistics)」
これらは、いずれもイギリス・ロンドン出身の政治家、小説家ベンジャミン・ディズレーリ(Benjamin Disraeli、1804-1881)が最初に述べたとされています。

「統計的な根拠がある」と言うと、客観的なものとして強い説得力を持ちます。しかしながら、ある意図を持って結論を導こうと、数字の見せ方やバイアス(偏り)を工夫する事で、自分の意見に合致した数字を表現する事が可能となってしまいます。

いくつかの事例を挙げて説明します。
1.平均値のウソ(データは正しいけれど、データの集め方に問題がある)
ある会社の給与平均値が400万円とありました。しかしながら内訳を見ると以下の様になっていました。
・社長(1人): 2,000万円
・役職(4人): 1,000万円
・一般社員(20人): 200万円
この会社の平均年収が400万円である事は事実ですが、平均値を聞いた時と受ける印象は違うのではないのでしょうか?
データの内容と集計手法の組合せを操作することで印象を変えることができるという事例です。
2.グラフのウソ(視覚的な印象操作)
「毎年右肩上がり」
次ページのグラフを見て下さい。両方とも同じデータを使用していますが、Y軸のスケールを変えています。左図は毎年売り上げが向上している様に見えますが、右図はY軸スケールを広く取ると実際はほぼ横ばいである事となります。
スケールの取り方により実態とは違う印象のグラフを作成する事が可能となる事例です。

(参考)
①中央値と最頻値
平均値以外に統計としての用語があります。上記第1項の場合は200万円が中央値、最頻値と言えると思います。
②シンプソンのパラドックス
調査の母集団に大きな偏り(バイアス)がある場合などに『全体と部分で一見すると矛盾したように見える結果が生じること』を、イギリスの統計学者エドワード・E・シンプソンにちなんで、「シンプソンのパラドックス」と言うそうです。
「シンプソンのパラドックス」では、「個々で成り立つことが、全体で成り立つとは限らない」とされます。

3.母集団の偏向(データは正しいけれど、解釈が間違っている)
面白い話ですが、少々長くなりますので、次回に記載します。ご期待下さい。
以上