【簡単まとめ】統計をみそ汁の味見に例えた秀逸さ

 

 

 

勝手に他人と比較して落ち込むことってありますよね。

偏差値だとあなたの学力レベルは下位20%内です」とか、

「日本人の平均貯蓄○○万円」とか、

ニュースや身の回りの情報は必ずといっていいほど、数字で分かりやすく整理されています。

分かりやすい整理された、分母が大きい情報は必ずといって良いほど統計が使われているため、

統計を勉強すれば、いたずらにニュース記事の数字に不安を覚えたり、比較されることでの劣等感を感じづらくなるのではと思い、統計の本を手に取ってみました。

 

本を読み進める中で、

巷にあふれる統計数字の信頼性に対して、

疑いの目を持つことが普段の生活でも重要なのではと思い、

下記に統計の基礎知識をまとめてみましたので、ご参考にして頂ければ幸いです。

 

 

 

疑いの目

①分母へのまなざし

統計的な手法で算出された結果で、いわゆる「○○ランキング1位」とか「99%の人が満足!!」と書かれた商品があったら、使ったことがないものでも目がいってしまいますよね。この時によくよく確認しないといけないのが、このランキングや指標の元となっている分母の数字とのことです。

10人よりも1000人にアンケートを取ったランキングの方が信用できますし、

アンケート対象者がその企業の製品の愛用者だけに取った結果かもしれません。

また、統計的に正しくても購入者にとって、正しい選択材料となっていない場合もあります。

よーく、アンケート対象者の年齢を見たら、「30-40代女性」となっていて、

20代前半の女性がその商品を「ランキング1位だから良い商品のはず!」と思って買ってしまったら、後で後悔してまう可能性があります。

 

ランキングや○○%という数字を見たら、分母はどうなっているだろうと見てみる方がよさそうですね。

 

 

②信者の主張/背景

統計結果で出された数字は正確であるものの、統計結果を用いる発信者次第で、印象操作ができてしまう。

参考にした「統計的な?」の第4章で述べられていたEU離脱時に繰り返し議論された内容を引用し書かせていただきます。

離脱反対者も賛成者も同じ貿易統計の数字を基に、各々の立場が正しいことを主張しました。また、各々が使用した数字はどちらも正確であるが語られる内容が異なりました。

賛成・反対の主張を簡単にまとめて書きます。

 

離脱賛成者

主張:離脱しても有利な貿易協定結べる。

根拠:離脱しても、下記の構図が成り立つはず。

EU圏の国々→イギリスの消費者が必要  > イギリスの企業→EU諸国の企業が必要 

根拠を支える数字:EUがイギリスとの物品貿易で黒字を出しているから。

 

 

離脱反対者

主張:離脱したら不利な貿易協定となる。

根拠:離脱したら、下記の構図となる。

EU圏の国々→イギリスの消費者が必要  < イギリスの企業→EU諸国の企業が必要 

根拠を支える数字:全輸出品に占める割合を比べるとEUの方がイギリスを必要としないと読み取れるから。

イギリスの全輸出品の47%→EU諸国向け

EU諸国の全輸出品の16%→イギリス向け

 

どちらも正確な数字を基に話しをしているため、どちらが正しいという判断を数字上で行うことは難しく、この議論のなかで分かることは、数字か割合どちらを引用しているかで賛成論者か反対論者か分かるということのようです。

結局、数字を見て判断を下すのは人の役割ということですね。 

 

 

出口調査とみそ汁?

 数字をいくら並べても結局判断するのは、人だと書きましたが、

それでも統計って便利なんだなと思った例が、選挙の出口調査の話です。

「だから数字に~」の第6章に書いてあった選挙の当選確実がなぜ数%の開票率で判明するのかという説明が面白かったです。

(ツイッターでもよくリツイートされるみたいですね。)

 

Rさん
 
⛅
 
@moon_travel
 
立川志の輔のマクラ。 出口調査で選挙結果が分かるからつまらない。開票率5%で当確なんておかしいと数学者・秋山仁と話したら。 「それが統計学ですよ」 「まだ開票率5%なのに?」 「あなたね、味噌汁作って味見するのに丼鉢でグーッと飲む?」 「・・・小皿ですよね」 「それが5%よ」

 

ならば、選挙速報の番組を面白くしようと、

出口調査で嘘の回答をすれば、速報結果が誤ったものになるんじゃねとネットで盛り上がったとか。。笑

 

それにしても統計をみそ汁の味見に例えた話は、非常に分かりやすく、統計学に対する敷居がグッと下がった気がします。

 

平均って何?

冒頭に書いた「平均貯蓄○○円!」というよくあるニュース記事ですが、

よくよく考えると現実的な数字とちょっと違うんじゃ。。と感じる人も多いかと思います。平均値の場合、高額貯蓄者の金額が大きく影響し、平均額も実感より上がってしまってることも多いようです。

なぜ実感と乖離しているのかは、

そもそも平均の算出方法が以下の3つの方法があることと関係していました。

 

平均値:全ての数字を足して、数字の数で割る。

中央値:数字全てを並べた順番の中間に来る数字

最頻値:一番多くあらわれる数字。

 

例えば、30人いるクラスのテスト結果の代表の値を調べたければ、

 

平均値:クラス全員のテスト点数を足す→クラスの人数で割った数字が平均値

中央値:テスト結果をランキングにして掲示板に貼り出す→15番目の数字が中央値

最頻値:もし、クラスで66点を取る人が多ければ66点が最頻値。

 

ちなみに、参考までに貯蓄の話でいうと、

平均値:1327万円

中央値:792万円

最頻値:100万円未満

とのことです。

※2020年現在ではございません。数字の相場を知りたく載せました。

「2017年の勤労者世帯の貯蓄現在高」

引用記事:https://news.infoseek.co.jp/article/toushin1_8777/

 

この3つの代表となる平均の値を出しても読み取れることは多いですね。

ただ平均値の1327万円だけをみて、不安に感じる必要はないと思いました。

(100万円未満と答える人が多いから貯蓄しなくていいんだという訳ではないですけどね笑)

 

 

疑わしいAだからB

統計に関する本を読むと、相関関係と因果関係の話が良くでてきます。

ことわざだと、「風が吹けば、桶屋が儲かる」 が因果関係で結ばれてるのか、いや関係性が弱すぎるのではと議論の的になっているようです。

 

因果関係:片方の数字がもう片方の原因となっていることが証明されている関係

相関関係:片方に数字が上がれば、もう片方の数字が上がるなど、関係しているように思える関係。基本的に因果関係とは無関係とのこと。

 

例え、強い相関関係があっても、相関関係の強弱とは別に、原因となっていることを証明して初めて因果関係となるみたいです。

 

厳密に研究機関などで因果関係があると証明されるケースもそれほど多くないとすると、よく目にする調査結果で「綺麗な靴を履く人ほど、年収が高い」や「年収高い人ほどクルマ好きな人が多い」等、キャッチャーだけどその関係性どーなの?っていう調査結果は、相関関係があるけど、原因とまではなってないってことを念頭に読み解いていく必要ありということでしょうか。

 

 

 

ざっと、内容をまとめてみました。

よりシンプルで分かりやすい数字ほど、分母が隠されていたり、発信者自身の情報がなかったりするため、よく観察する必要があるということが分かりました。

それにしても統計の敷居を下げてくれたみそ汁のたとえ話は秀逸だなとシンプルに感じました。

 

 

参考書籍

以下に参考にした書籍をまとめさせて頂きます。

 

・「統計的な?数字に騙されないための10の視点 STATISTICAL」2019年12月 第1刷

    著者:アンソニー・ルーベン  発行所:株式会社すばる舎リンゲージ

 

→数字にダマされないための参考例として、イギリスの政治、経済、サッカーを用いて統計学の説明をしてくれている本。イギリス好きなら読んでみても面白いかもしれません。

 

 

・「手にとるように統計学がわかる本」2004年8月 第1刷発行

 著者:柳谷 晃  発行者:境 健一郎  発行所:かんき出版

 

→数学者の視点から、統計学を簡単な数式を用いて説明している本。パッと見は読みずらそうな本だが、内容を読んでみると本当に簡単な例を用いて書いてあり、学問上での統計学上の単語を理解するのに役立った。

 

・「だから数字にダマされる」2016年10月 第1刷発行

 著者:小林 直樹  発行:日経BP

 

→より身近な例が書かれており、数字を疑うための材料として役立つと思った。

 

 

ではでは。