January 07, 2012

読んでわかる心理統計:『本当にわかりやすいすごく大切なことが書いてあるごく初歩の統計の本』 4

本当にわかりやすいすごく大切なことが書いてあるごく初歩の統計の本
本当にわかりやすいすごく大切なことが書いてあるごく初歩の統計の本吉田 寿夫

北大路書房 1998-11
売り上げランキング : 136663


Amazonで詳しく見る by G-Tools
【オススメ対象者】統計について本腰を入れて学びなおしたい方、なぜ数値をまとめたり検定にかけるのかそもそものところでつまづいている方


 本書は、関西学院大学社会学部教授・吉田寿夫氏によって書かれた、心理学や社会学の分野で“統計”を実践的に利用するユーザー向けに、データのまとめ方や分析手法の基本的な考え方が数式や高度に数学的な解説を使わずに視覚的・感覚的に理解できるように書かれた統計法の本格的入門書です。

内容は以下の通りです。

序章 統計について学ぶにあたって
 1節 統計とは何か,そして,統計はなぜ必要か?
 2節 変数とデータ
 3節 Σの記号の意味
 序章のまとめ

1章 1つひとつの変数についての分析1:図表を用いた度数分布のまとめ
 1節 度数分布とは
 2節 量的変数における度数分布の表し方
 3節 質的変数における度数分布の表し方

2章 1つひとつの変数についての分析2:度数分布の特徴の数値要約
 1節 量的変数に関するデータの数値要約
 2節 質的変数に関するデータの数値要約
 2章のまとめ

3章 2つの変数の関係についての分析1:量的変数どうしの場合
 1節 相関図の作成
 2節 相関係数による数値要約
 3節 一方の変数の値によって分けた群間での他方の変数の代表値の比較
 3章のまとめ

4章 2つの変数の関係についての分析2:質的変数どうしの場合
 1節 クロス表の作成
 2節 連関係数による数値要約
 4章のまとめ

5章 変数の変換
 1節 線形変換
 2節 非線形変換
 5章のまとめ

6章 統計的検定の基礎
 1節 記述統計と推測統計
 2節 無作為標本抽出
 3節 推測統計の分類
 4節 統計的検定の意義
 5節 統計的検定の基本的考え方
 6節 統計的検定に関する基本用語と統計的検定の一般的手続き
 6章のまとめ

7章 適切な検定の選択
 1節 基本用語
 2節 適切な検定を選択する際の主な観点
 7章のまとめ

8章 統計的検定の実際
 1節 対応のない場合のt検定
 2節 対応のある場合のt検定
 3節 U検定
 4節 対応のない1要因の分散分析
 5節 2重クロス表についてのχ2検定
 6節 ともに対応のない2要因の分散分析
 7節 ピアソンの相関係数の有意性検定
 8章のまとめ

9章 統計的検定の問題点・適用上の留意点
 1節 問題点
 2節 適用上の留意点
 9章のまとめ

終章 統計に関する知識と日常の思考との関わり
(目次より)

 本書の特徴は、“間隔尺度”や“相関係数”、“t検定”など統計の勉強で目にすることが多い項目についてそれぞれ別個に解説をするのではなく、あくまで“統計”という1つの大枠の中で、「数値をまとめる手法の中に、代表値や相関係数があって…」というようにデータの分布や種類、検討したい内容によって扱う手法が異なるということがきちんとわかるようになっており、読みながらそれぞれの手法の役割を自学自習できるつくりになっている点です。

統計の解説書というと、個々の用語の解説が多かったり数式を駆使したりと、文系にはチンプンカンプンな解説が多いような気がしますが、本書では序章で統計を以下の通り3段階に分け、

“統計をとる”ということの第1段階は、検討したい事柄である、対象のなんらかの特性についてのデータを、実験や調査、検査、観察などを行って集めることです。(中略)私たちは、さまざまな原因によって事実を歪んで認識している可能性があり、世の中には実際に調べてみないと本当のことがわからない場合が多々あるのです。さらに、研究によっては、とりあえず試験的な調査や観察を行ない、その結果を手がかりにして理論や仮説を構築していくという探索的な方法をとることもあります。以上のようなさまざまな理由から、“実際にデータをとって調べてみる”ということが行なわれるのです。(pp.1-2)

“統計をとる”ということの第2段階は、得られたデータの特徴を、数値や図表に用いてまとめることです。(中略)なんらの分析も行なわずに得られた生のままのデータを眺めるだけで“○○条件の方が××条件よりも〜だ”といった特定の傾向が明確に見いだされることはめったにありません。また、ロー・データを眺めているだけでは“こういう結果になってほしい”とか“こういう結果になるはずだ”といった研究者の期待や仮説が一種の先入観として働いて(たとえば、期待や仮説にあったデータばかりに注目して)、せっかく客観的な判断をするためにデータをとったにもかかわらず、事実を歪んで認識してしまうことも起こりかねません。そこでそれぞれの研究の目的およびデータの性質にあった適切な分析を行うことによって、データに潜んでいるなんらかの傾向(有意味な情報)を的確に取り出そうとするのです。(後略)(pp.2-3)

(“統計をとる”ということの第3段階は、)統計的検定と呼ばれる分析です。統計的検定は、得られたデータからなんらかの事柄に関する条件間の差の有無などについて結論を下そうとする時の研究者間の共通の判断基準を設けることによって、データ解釈の主観性を抑える働きをするものです。つまり、“科学的な研究と呼べるものにおいては、データから理論や仮説が支持されたと判断するためには少なくともこの程度の基準を満たしている必要がありますよ”といったルールが決められており、統計的検定とは、データがその基準を満たしているか否かを吟味するための分析なのです。
(pp.5:括弧内筆者)

と、そもそも“統計”とは何をするためのものなのかというスタート地点を明確に示してくれています。

類書だと、「データの収集→データをまとめる(記述統計)→データから全体の傾向を推測する(推測統計)」というような手順でさっさと解説が進んでしまい、“記述統計”“推測統計”の役割とかが曖昧なままとりあえず流れでいろいろ覚えてお仕舞…という感じになるかと思います。

ですが、本書は上記の解説に見られるとおり基礎的な内容でも一切端折らずに、その手法の持つ意味や目的をわかりやすい文章で示してくれています。

そのため、ただでさえどこから勉強すれば良いか分からずに途方に暮れてしまいそうな統計の勉強について、最初の一歩を踏み出すための「あっこれなら分かるかも…」という大きな後押しをしてくれます。

上記の段階も、

 統計(法)というものは、検討したい事柄についてのデータを収集し、それが持っている有意味な情報を客観的・効率的に記述し、読みとるための道具です。(p.6)

とまとめられており、統計を学ぶのが初めての人でも、自分がこれから何を学ぶのかということがしっかりと分かる滑り出しとなっていますので読み進めやすいと思います。


 序章以降の内容をまとめると、1章が「度数分布を用いた視覚的なデータのまとめ方」で、2〜4章が「“代表値”や“相関係数”、“連関係数”などのデータを1つの指標にまとめる“数値要約”について」、5章が「“標準得点”や“偏差値”などのデータの変換について」、6〜9章が「“統計的検定”について」となっています。

これらの解説も、必要であれば図表など視覚的な題材も用いながら、1つ1つにその値や手法の目的や意味を丁寧に解説しています。

例えば、わざわざ得たデータを変換し“標準得点”にする理由についても「線形変換をしても分布の形は変わらない」ということを視覚的に示し、その特性を用いることで相対的な比較がしやすくなることを具体的な事例をもとに解説してあるため、「平均値を0、標準偏差を1になるように変換した得点をz得点という」などという解説をそのまま頭にぶち込むよりも遥かに分かりやすいと思います。

また、それぞれの項目ごとに練習問題と詳細な解説が用意されているため、自学自習しながら知識を“身につける”ことができるようにもなっています。

また、発展的な話は「ちょっと余分な話」というコラムとして載っているのですが、「相関係数の2乗和がなぜ“決定係数”と呼ばれているか」や、「“両側検定”と“片側検定”の違いと用い方」など今の今まで曖昧なままにしていた部分がきちっと解説されていて、とても助かりました。

特に参考になったのは、『データ数と有意差の得られやすさの関係』と、『優越率と同調率』のコラムです。

前者は、t検定やχ二乗検定でのデータ数と有意差の得られやすさの関係について説明してあるのですが、例えばt検定では、

・n=4の場合、2つの条件の平均値の間に各条件の標準偏差の2倍以上の差(ES=2)がないと有意にならない

・n=10000であれば、ES=0.03というような2つの分布がほとんど重なっているきわめて小さな差でも統計的には有意になる

ということが説明されており、“統計的に有意な差”=“実質的に意味がある差”ではないという解説がより分かりやすくなっています。

後者の内、優越率とは、「平均値に一定の差がある2つの条件から無作為に1つずつの値を取り出した際に、それらの2つの値の大小関係が平均値の大小関係(すなわち、全般的傾向)と一致する確率」のことで、

ES=1.0(2つの条件の平均値の間に各条件の標準偏差の1倍の差がある)場合、優越率は0.76で、すなわち4回に1回程度は個々の値の大小関係が平均値によって表される全般的傾向と矛盾することがある

と解説されており、

そして、同調率とは「一定の相関関係にある2つの変数の相関図の中から無作為に2点を取り出した時に、それらの2点を結ぶ直線の傾きの符号がXとYの間の関係の全般的傾向の指標である相関係数の符号と一致する確率」のことで、

r=0.5の場合、同調率は0.67となり、つまりr=0.5正の相関関係にある相関図の中から無作為に2点を取り出した時に、全般的傾向からXの値が大きい方がYの値も大きいと予測されるにもかかわらず、逆の関係になるケースが3回に1回はある

と解説されています。

これを読んで、いかに自分が“有意差”や“相関係数”をそのまま鵜呑みにしていたか思い知らされました。

相関係数が0.5以上というのはなかなか目にしない値だと思いますが、そのような場合でも1/3の確率で相関係数とは逆の関係となるデータを取り出す可能性があるということを思うと、単に「強い・弱い」という全般的傾向が個々の対象にも当てはまるように考えてしまうことは慎んだ方が良いということを痛感しました。

そういった意味では、統計の本でありますが臨床的にも有益なことが学べると思います。


そして、統計的検定についても、

 統計的検定は、データを評価する(データが示している傾向が一般にもあてはまるといえるか否かについて判断する)ための1つの基準でしかありません。そして、(中略)、統計の力のみを借りて一般化可能性について完全な推論をすることは現実には不可能なのです。

(中略)統計的検定は、本来、データの解釈の主観性を抑える(特に、研究者が、偶然によっても十分に起こり得る程度の差でしかないものを過度に一般化して、軽率に各自の理論や仮説が正しいと主張してしまうのを防ぐ)ためにあるのだと思います。そして、統計的検定は、ある程度は実際にそのような有効な働きをしているといえるでしょう。(p.247)

とその本来の目的と違った使われ方をされ誤解されている点を指摘して、データ数の少ない研究や有意差が出なかった研究は使えないと判断するのではなく、検定の結果からどのようなことが考察されるかをきちんと考え、いろいろな条件で研究を積み上げていくことの大切さを説いています。

それまでは、データ数が多くて有意差が出た研究の方がなんか良い、というぐらいの酷い認識をしていたのだと改めて気づかされました。


 以上のように、本書は統計を勉強するにあたって、まさにタイトルの通り『本当にわかりやすいすごく大切なことが書いてある』本であり、バラバラになってしまいがちな知識をきちんと“統計法”という大皿に乗せて丁寧に解説してくれる類書に代えがたい解説書であると思います。

本書の末尾で、

統計学の考え方の基本は、私たちが日常行っている思考の中の良識あるものを、少し洗練して定式化したものに過ぎません。(p.268)

と書かれているのが本当にそうだなと実感できる内容です。

ただし、“順序尺度”“量的変数”になって類書の分類と違ったり、公式が結構示されていたりと、まったくの初心者が本書を最初から最後まで通して理解するとなると本腰を入れて読まなくてはならないかもしれません。

何故か本書は大学院入試のバイブル的な扱いになっているようですが、本書でも難しいと思った方や、用語の解説が書ければそれで良い人は、『よくわかる心理統計』(投稿予定)や『ウォームアップ心理統計』を読んだ方が分かりやすいと思います。

逆に、本書よりも発展的な学習がしたい方は、『心理統計学の基礎―統合的理解のために』(投稿予定)や本書の発展的な姉妹本である『心理学のためのデータ解析テクニカルブック』に進まれると良いのではないかと思います。

丁寧さゆえの重厚な解説文に辟易してしまうかもしれませんが、時間をかけてじっくり本書に取り組めば統計を扱う上で大切な土台ができると思います。

自分は今になって読み返してみてまだまだ理解が足りないなと思いましたし、きちんと基礎的なことを理解していると臨床的な研究をする際にも活きてくるのだと実感ができて良かったです。



【関連文献】
●さらなる入門書をお探しの方は・・・
『よくわかる心理統計』(投稿予定)

『ウォームアップ心理統計』
(『よくわかる心理統計』の執筆者によって書かれた、心理統計を学ぶ際にその足がかりになる下地をつくることを目的とした心理統計の入門書です。『よくわかる〜』でも分からなかった方向けに書かれているので、本当に初歩の初歩を理解するには最適の本です。心理学の具体的な事例をもとに解説が書かれているため、興味深く読めるのも良い点です。)

●因子分析については…
『誰も教えてくれなかった因子分析―数式が絶対に出てこない因子分析入門』
(本書と同様に数式をほとんど使わずに因子分析について説明した解説書で、“因子分析を使った論文を読めるようになる”、“因子分析を使えるようになる”、“因子分析とその他の分析の違いが分かる”のようにそれぞれ到達段階を設けて、読者のニーズごとに解説を配置したものです。学び手の立場から躓きやすいポイントを重点的に解説し、SPSSやSASの扱い方まで教えてくれるので因子分析を用いる学生は必携です。)

この記事へのトラックバックURL

http://trackback.blogsys.jp/livedoor/youarethereasoniam/51763893 

この記事へのトラックバック

本当にわかりやすいすごく大切なことが書いてあるごく初歩の統計の本作者: 吉田 寿夫出版社/メーカー: 北大路書房発売日: 1998/11メディア: 単行本 統計学の初歩の教科書。 細かな数学的証明は省いているものの、数学に基づいた考え方がされているので、道具として使う前
統計学の二冊目:本当にわかりやすいすごく大切なことが書いてあるごく初歩の統計の本 - 本読みの記録 at January 09, 2016 23:14

コメントはまだありません。

コメントする。

絵文字
 
星  顔