無題以前本ブログでも紹介しました、米コーネル大学教授ダリル・ベム氏による超心理学実験が心理学の一流誌に掲載された件に関して、あの『Science』が最新号のニュース記事で取上げています。それによると、ベム博士の実験は、古くからある統計学の論争に再び火をつける結果となったようです。頻度主義統計学対ベイズ主義統計学の対立です。

頻度主義統計学は、測定値が測定誤差などの偶然によるばらつきの範囲内かどうかを問題にし、その範囲を超えた測定値があれば、それは偶然ではなく、意味のあ る差を検出したとします。どれだけ意味のある差なのかを示す指標がp値と呼ばれているものです。ベム博士は、実験結果を頻度主義統計学で処理し、0.01以下というp値を得ました。これは、実験結果が超能力の影響を仮定しなくても、100回に1回は、まったく偶然にも起こりうることを意味しています。

しかし、通常の科学実験では、100回に5回以下しか起こらないことは、偶然に起こったと考えるにはあまりに稀だとする立場を取ります。そのため、ベム博士の実験結果は、偶然ではなく、超能力の影響 を仮定しなくては説明できないと結論されるのです。科学者が一般的に用いている統計処理を使って、統計的に有意な結果を出せた以上、その結果がたとえ超能 力の存在という受け入れがたい内容であっても、科学論文として拒絶する理由には当たらない。これが、ベム博士の論文が一流科学雑誌に掲載された理由なので す。

しかし、頻度主義統計学では、実験の試行回数が増えるほど、現実的には非常にわずかな差に対し低いp値が与えられ、さらには、偶然か必然かのラインを100回に5回 とする、ある意味恣意的な絶対基準によって、それは偶然とは見なされなくなります。これに対しベイズ主義統計学では、そのような絶対的な基準を持ち出す代 わりに、実験結果の前後でその仮説、この場合超能力の存在、に対する信頼度がどれだけ変化したのかという相対的な基準で評価します。例えば、試験の点数 が、一定の合格ラインを超えたかどうかを問題にするか、前回の点数よりどれだけ上がったか、あるいは下がったかを問題にするのかの違いです。

そこで、統計学者らはベム博士の実験結果を、ベイズ主義統計学によって処理しました。すると、40というベイズ因子を得ました。これは、実験結果によって、超能力の存在に対する信頼度が40倍上昇したことを意味します。ただし、これは絶対的な信頼度ではないので、まあまあ1%くらいは超能力を信じていた人は、ベム博士の実験結果からその信頼度を40%にまで上げてもいいことになるけれど、最初から100万分の1程度しか信じていなかった超能力懐疑派の信頼度は、100万分の40になっただけとも言えます。従って、超能力懐疑派にとっては、今回の実験結果に十分な説得力があったとは言えないということになります。

結局どちらの統計処理法を採用するかで、微妙に結果の解釈が変ってきますよね。どっちを信じたらいいのやら。でも、これがある意味現代統計学の限界なのです。偶然という聞こえはいいがあいまいな基準を拠り所とするか、最初からあいまいな信頼度がどれだけ変化したかを拠り所とするか。実はこの二つの、発想を異にする統計処理法のどちらが優れているのかの決着は未だ着いていないと言います。さらにベイズ手法の中にも様々なやり方があり、今回の実験結果を別のベイズ手法で処理すると、超能力は存在しないという結論になったそうです。非常に微妙な差を、意味のある差だと言い切れる統計手法は未だ存在しないというのが実情のようです。

(本記事は、123日付でニュースサイト『スゴモリ』に掲載された記事を本ブログ用に改変したものです。)