2009年12月08日 02:00 [Edit]
統計思考力養成ギブス - #書評_ - 統計数字を読み解くセンス
化学同人竹内様より献本御礼。
こんな本を待っていた。
統計思考が重要なことは不透明な時代を見抜く「統計思考力」」を読めばいやでもわかるし、「統計数字を疑う」をよめば統計をそのまま信じようとはしなくなる。
しかしそれでは一体全体統計というものをどう扱えばいいのか。
本書には、それがある。
本書「統計数字を読み解くセンス」は、疫学という、統計を最も実践的に扱う学問の専門家が、統計のどこに目をつけ、どこに注意するのかを実際に統計を処理しながら学んでいく一冊。
目次 - KAGAKUDOJIN BOOKSHELLより
|
|
目次を見ての通り、本書に出てくるのは身近で、それだけにだまされやすく、そして実際多くの人がだまされている問題ばかりである。そう。多くの人。その中には、プロすら含まれる。
P. 148一九三六年の米国大統領の選挙において民主党のフランクリン・ルーズベルトと共和党のアルフレッド・ランドンのいずれが大統領になるかについて、リテラリー・ダイジェスト社は二五〇万人規模の世論調査を行い、ランドンが当選するだろうと予測しました。一方、ギャラップ社はわずか二〇〇〇人の調査から、ルーズベルトが再選されるという結果を出しました。選挙の結果はルーズベルトの再選でした。
統計学にとってのこの事件は、建築学にとってのタコマ・ナローズ・ブリッジに相当するほど有名なものなのだが、この事件を知らなかった人、理由はおわかりになるだろうか。
リテラリー・ダイジェスト社が使った方法は、電話。
え?まだわからない?
実は、当時はまだ電話というのは高級品で、電話という手法を取るだけで標本が富裕層側に傾いてしまったのだ。その結果の共和党優位。一方ギャラップの二千人は、本当にランダムに算出した二千人。二千が二百五十万に「勝った」理由が、ここにある。
このエピソード、現代においてはなおのこと意味がある。ネット調査というのは、現代においては当時の電話調査と同じバイアスがかかりはしないか。
しかしこのバイアスこそ、統計思考の最大の敵なのである。その中には、どんな分布を選択するのかという分布選択バイアスすらある。標準分布を何にでもあてはめてしまおうとするのもその一つ。それがどんな結果をもたらしうるかは、「ブラック・スワン」が指摘し、その後にリーマン・ショックが来たのは記憶に新しい。
しかし、それでめげてはいけない。統計には、そのバイアスを見抜く方法もきちんと用意されているのである。それがどんな方法か、本書でぜひご確認していただきたい。
本書に強いて問題が一つあるとすると、縦書きであるにも関わらず横書きの専門書なみに数字と式を詰め込んだこと。これがあるが故に「統計思考力」も「統計数字を疑う」も本書のレベルまで踏み込めなかったとも言え、そんな「常識」を華麗にスルーしてくれた化学同人に拍手を送りたい一方で、しかし読みにくいことは否めず、ここまでやるのであれば横書きも辞さない方がよかったのではないか。
冒頭に「一体全体」という言葉が出てきた。統計とは、まさに「一部を見て全部を知ろう」とする技術である。うまくやれば2,000が250万に勝ち、開票と同時に「当選なう」と自信をもってつぶやける。カミオカンデでニュートリノを見つけたのもまた、統計。微積分、線形代数、に続く、「道具としての数学三種の神器」の三番目にして最も強力なのが統計なのだ。
本書のレベルまで統計が読めれば、だまされることもなくなる、というよりだまされてもすぐに気がつくだろう。繰り返す。プロだってだまされるのが統計である。大事なのはだまされまいと身構えるのではなく、決断に至る前にそうと気がつくことなのだから。
Dan the Black Swan
この記事へのトラックバックURL
>え?まだわからない?
その前にギャラップ社が使った方法を書かなければ分かるわけが
ないのでは?
ないのでは?
ギャラップ社が勝った理由は確かにそれだけではわからないけど、
リテラリー・ダイジェスト社が負けた理由はそれでわかりますよ
こういう実例が多い本はテキストと連動して読む/学ぶのがいいと思います。
統計の見方だけを押し付けられても思考氷結に繋がると思うんで。
『ギャラップ社が使ったのは「割当法」という無作為選出に近い方法』
『リテラシーダイジェストが使ったのは電話帳、クラブ会員名簿、自社の購読者リスト』
二つの変数の間に関係があるといっても、それが、原因と結果であるとは限らず、別の第3の因子があることがある。
ドラッカー氏も統計学をかじったことがあるようです。
それゆえ、大半の社会学が中途半端な統計処理を使って”科学”の名を語るようになる。
目次を見るにつけ、本書には、その抜け落ちたプロセスがしっかりと埋まっているように見える。
たぶん知らない事は書いてないだろうけど、読んでみようかな。
同じ時の日本の電話の普及台数ってどの程度なのだろうか?
当時の両国の電話普及率の差がどの程度なのかわかりませんが
戦争に負けた理由の一つが見えるように思います。
>ワン」が指摘し、その後にリーマン・ショックが来たのは記憶に新
>しい。
統計数理研究所の赤池先生だか林先生だかの著作には、それよりずっと以前に同じ主旨の指摘がしてあったと思いますが。というより、サンプリングの手法による偏りを考慮するのは、この種の調査を行う際の前提として常識的なことですよね。まあ、アフェリエイトのポイントを稼ぐためかもしれませんが、自分の紹介した本、あるいは自分の知見が世の中のほんのすべてであるかのような書き方は止めておいたほうがいいのでは。
>介した本、あるいは自分の知見が世の中のほんのすべてであるかのような
>書き方は止めておいたほうがいいのでは。
wwwwwwwwwww
勘違い女
婚活
「2008年の登録失業者数は886万人で、失業率の実績は4.2%である」
失業率4.2%といえば、現在の日本と同レベルである。この数値を「思ったよりも良い」と思うか、「思ったよりも悪い」と思うかは人それぞれだと思う。だが、それ以前に、この文章を見た瞬間に「んん??」とピンとこなければ、その人は中国経済について語ることを差し控えておいたほうが無難である。
http://voiceplus-php.jp/web_serialization/china_economy/001/index.html
