要約|統計でウソをつく法【不正なデータに騙されない】

思考・考慮

「○○%の上昇」「△△割が支持」「平均××点」というように数値的に物事が示されると、それだけで正しく思えてきます。
しかしそんなに簡単に信じてしまっては相手にいいように騙されてしまいます。
「統計」と聞くと小難しい数式や理路整然した言葉の数々が並んで苦手だという人も多いでしょう。

―――読むのをやめておこうかなと思っても安心してください!

統計でウソをつく法 (ブルーバックス) [ ダレル・ハフ ]では数式などの小難しい内容は出てきません。

統計に騙されず正しい有益なデータを得るためには、どんな仕掛けがあるかを知り、統計操作が行われていないかを疑うクセをつける必要があります。
表面的ではなく、多角的な視点で物事を判断する能力を向上させましょう。

サンプリング

偏りがあったり、標本が小さいサンプリングから導き出された結論からは、その後ろに隠れてしまっている本質が見えていない部分が大きいです。
サンプルは可能な限り偏りなく抽出されるべきですが逆説的に考えると、偏りを発生させることで思い通りの結果を得ることも出来てしまいます

どのような標本からどの程度の規模のサンプル数を基準にしているかを冷静に判断することが大切です。

世論調査

世論調査と言うのは結局は偏りの原因に対する不毛な争いといえるようです。
例えば「70%のアメリカ人が反対している」といった結論も、数値だけを見ると過半数が反対してるという意識が強くなりますが、その70%というのはどういったアメリカ人なのかを知る必要があります。
10人中の7人なのか―――1億人中の7千人であるのか―――他にも性別、年代、集計エリア…etc

偏りがない世論調査はないという認識を持つべきなのかもしれません。

平均とは何か

「平均」と聞くと割合が多いイメージや一種の基準の意識が持ちやすくなります。
しかしある数字が平均値であると聞いた場合、それらがどういった種類の平均値なのかまでわからなければ意味がありません。

①平均値(算術平均)
②中央値(注意する)
③最頻値(並み数)

例えば以下のような5人のサラリーマンの平均年収は中央値と平均値で大きく違うことがわかります。
Aさん450万円/Bさん500万円/Cさん550万円/Dさん600万円/Eさん5,000万 と仮定した場合
平均値:1,420万(全員の年収足すことの人数割り)
中央値: 550万(5人の中で年収順で並べた真ん中の年収)

2つを比較すると一般的に平均と呼べるのは中央値の方が近いといえるのではないでしょうか。

ひと家族は何人が平均か?

過去にアメリカではひと家族あたり3.6人という統計上の平均的な家族が示され、その平均に合わせてアメリカの住宅は設計されたそうです。

しかし実際の分布幅では3人いなし4人家族が全体の45%に過ぎなかったことが明かされたのです。
内訳は35%が1人あるいは2人家族であり、4人以上の家族の割合は20%…?
つまり55%は3~4人家族ではなく、平均値をとっているはずなのに平均として想定した家族以外の割合の方が多くなってしまったのです。
統計からは3.6人が平均的な家族のはずなのに…これが統計の罠です。

こじつけの数字に注意

とある戦争の期間、米海軍の死亡率は1000人につき9人であった。
一方、同じ期間のニューヨーク市における死亡率は1000人につき16人であり、この数字を使って海軍に入隊した方が安全だと宣伝広告を打ち出したのです。
数字だけ見てしまうと海軍に入隊した方が安全なような気もしますが、この2つの死亡率はそもそも比較できないといえます。

理由は簡単で海軍は大部分は健康的で若い人々からなっているのに対し、ニューヨーク市民の中には、赤ん坊や年寄りや病人も含まれていることを想定できるかがポイントです。

理由がわかれば確実にニューヨーク市民の死亡率の方が高くなることは誰にでもわかるはずです。

大学に行けば高収入?!

「大学教育を受けた人たちは一般よりも収入が高い」「彼らの所得が高額なのは大学に行ったためである」ことは正しい仮説ではありません。
大学生になる学生は勉強が出来る学生か比較的に裕福な学生の2パターンだといえます。
(いまでは大学進学が一般的ですが本書が発行された1968年発刊された当初です。)
そもそも勉強が出来る学生と裕福な学生であって、当時の一般的な家庭との釣り合いが取れておらず、勉強が出来る頭の良い学生は大学で学ばなくても高所得になる力があるはずです。

裕福な学生はお金がお金を生むように大学に行こうが行くまいが、低所得層の中には入らないはずです。

統計のウソを見破る

これまで見てきたように統計は数値や仮説前提条件によりいくらでも私たちの印象操作を促す要因になります。
正しく役立つデータをいかにして見分けるかを5つのポイントに分けて説明します。

①誰がそう言っているのか → 統計の出所に注意をする
②どういった方法で分かったのか → 調査方法に注意する
③足りないデータはないか → 隠されている資料に注意する
④言っていることが間違っていないか → 問題のすり替えに注意する
⑤そもそも意味があるのか → どこかおかしくないか

まとめ

本書は具体例を用いて解説がされており、数字に苦手意識を持つ方にもわかりやすく読みやすい内容です。
思考を張り巡らせていないと私たちは物事を一つの視点からしか見れなくなってしまいます
意味がある数値なのか、問題定義自体が間違ってはいないのか、洗練された目を養うという点では現代にも十分通用する内容です。

今見えている視点以外の観点から物事見るくせをつけたい方に手に取っていただきたい一冊です。

created by Rinker
¥1,012 (2024/12/26 20:34:52時点 楽天市場調べ-詳細)

コメント

タイトルとURLをコピーしました