.
ギルバート少年は、
イラクで、死亡した人の数を、数えようと思った。

アメリカが起こした、イラク戦争の前と、後で、
イラクで死亡した人の数を調べようと思った。

「増えたんだじゃないかな?」
と思った。

しかし、困った。
どうやって数えればいいのか?

・・・

とりあえず、
一つ一つの住宅(世帯)に、聞き込み調査をして、
「戦争の前と後で、死亡した人がどれだけ増えましたか?」
「それは、どんな原因でしたか?」
という質問をしよう、と思った。

しかし、
全世帯調査(センサス)を行えば確実な結果が得られるが、
そんなお金も、時間も、人手も、(政府も)無い。

次に考えられる
ランダム・サンプリングという方法を行うには
戸籍か住民票を用いて、(全国民の)リストを作り、
そのリストから、ランダムにピックアップしなければならない。

(原則として、ランダムサンプリングは、
 この全住民のリストがなければ
 行ってはいけない(信頼性が低い)ことになっている。)

ところが、
戦争が起きている国では、
戸籍や住民登録などがめちゃくちゃになっており、
調べることが困難だと予想された。

で、
しかたがないので、行った(次善の)方法が、
国際協力の現場で、もっとも頻用される
クラスターサンプリング
と呼ばれる方法だった。

注: cluster sampling
 ある広い地域の全てを調べるのが難しい場合、
 その中から30個以上の、一塊(ひとかたまり、クラスター)の
 人間の集団(市町村など)を選び出し、
 その中で調査を行い、全体を予想すること。

このクラスターサンプリングを行うため、
彼は、いろいろな準備をし、その実行をした。

・・・
・・・

1.イラク全土の地図の作成

GPS ( global positioning system )と呼ばれる
人口衛星を用いた、地球上での位置を特定する方法がある。

(カーナビなどに、使われている技術だ。)

これを用いて、イラクにある数百の市町村を
イラクの地図上に、まず、マッピングした。

2.50市町村の選定

数百ある市町村の中から、50の市町村(クラスター)を
ランダムに選出した。

(人口の比率に配慮した上で、サイコロをふって、決めた。)

(また、30以上という数字は、
 統計学における magic number と言われており
 この30を超えていれば、統計学上の信頼性が高いと言われている。)

3.特定された市町村の、それぞれの地図の作成

次に、選ばれた市町村に行き、自分で(または、現地の人に手伝ってもらって)、
全てのメインストリートの交差点で、GPS機能のある装置を押して、
それぞれの交差点の位置を特定し、記録した。
これにより、それぞれの町で、正確な
「碁盤の目」のような地図を作成していった。

4.それぞれの市町村における、40ブロックの選出

それぞれの市町村において、碁盤の目のような、
縦横に線(道)の走っている地図が作成できたら、
次に、その、縦の道と、横の道で囲まれた、
正方形のブロックを、端(はし)から数えていき、かつ、
番号を付けていく。
数十個であろうが、数百個であろうが、数千個であろうが、
数えて、番号をつける。
そうして、各市町村の「全ブロックのリスト」ができたら、
ランダム・サンプリングの原則のもと、
ランダムに、(各市町村それぞれから)40ずつのブロックを選ぶ。

(ここでも、30以上、という統計学情の magic number を採用している。)

5.サンプル数の計算

ここにおいて、
(既に、ブログで詳細に解説してきた)
サンプル数(必要な人数)の計算が必要になる。

簡単に書くと、サンプル数の計算には、以下の四つが必要であった。

(1)事前の情報などによる、おおよその割合の推測
    戦後18ヶ月で10万人死んだという以前の自力調査から推計

(2)効果の大きさ(戦前に比べて、戦後の死亡率が何%増えたか)
    戦後18ヶ月で10万人死んだという以前の自力調査から推計

(3)信頼区間(自分の立てた仮説を、何%の信頼性で証明したいか)
    95%

(4)パワー(自分の仮説と対極にある仮説も証明できる確立の保障)
    80%

(上記の詳細は、私のブログの、統計学その2、を参照)


計算結果は、12,000 (人)だった。
総計で、これだけの数の調査を、行わねばならなかった。


6.それぞれのブロックにおいて、

上記の計算結果に基づき、
クラスターたちの中で、それぞれどれだけの人数を
調べるか決定し、かつ調査した。

(実際には、町のブロックの中のある1点(一つの住宅)を
 ランダムに決めたら、そこを中心にして、
 必要となる人数に達するまで、シラミ潰しに調べる、
 という方法を行った。)

7.結果

1,849の住宅(世帯)を調べ、12,801の個人から、
629の死亡があった、という情報を得た。

イラク戦争の前の死亡率は、5.5/1000人/1年
だったのだが、
イラク戦争の後の死亡率は、13.3/1000人/1年
に増えていた。

この割合から、イラク全体の戦後の死亡増加を推計すると、
654,965人、増えたことになる。

・・・
・・・

この調査の中で、
もっとも大変だったのは、
各市町村の、40のブロック(クラスター)に行き、
各住宅をシラミ潰しに調査をしてくれる「スタッフたち」を
探すことだった。

(インタビューは、各ブロックにおいて、
 女性2名、男性2名、コーディネーター等、
 という編成で行った。)

ギルバートにはお金があまりなかった。
雇えるスタッフの数に、限りがあった。

おまけに、イラクは内戦中であり、
町を歩くだけでも、すごく危険だ。

そんな時、
そんな彼を救ってくれたのは
イラクに住む、イラク人のボランティアたちだった。

ギルバートの研究の主旨を理解し
彼の調査に協力してくれた人たちが、
イラクに、いてくれたのだ。

実は、この部分が、今回の調査の核心である。


(逆に、この「イラク人自身による統計調査」のために、
 調査結果が、実際よりも「誇張」されることを
 恐れたため、全ての調査のうちの1割を、
 後日、第三者が再調査し、
 誇張などがなかったことを、確認している。)

・・・

65万4965人。

アメリカのイラク侵攻のために、
(軍人ではない)なんの罪も無い一般市民たちが、大量に死亡した。

これが、医学会最高峰の雑誌、ランセットに載り、
世界に衝撃を与え、
アメリカのブッシュ大統領の片腕(ラムズフェルド国防長官)を
辞任に追い込んだ。

・・・

この、落ち着きの無い少年、ギルバートは、
今も、地球のどこかで、(多分GPSを片手に)動き回っており、
ちょっとずつ、少しずつ、世界を変えようとしている・・ようだ。

・・・
・・・

補足:
本当のクラスター・サンプリング、という方法は、
選び出された30以上のクラスターの中にある、
すべての住宅(など)を調査しなければならない。

ギルバート少年が行った統計学の手法は、
実際は、
クラスターサンプリングと、
ランダム・サンプリングを併用した方法である。

(繰り返すが、ランダム・サンプリングは、
 リストを作り、そこからランダムに選びだすこと。
 ところが、住民票などによるリストがなかったため、
 彼は、それぞれの市町村のなかで、
 GPSを使って、碁盤の目の地図をつくり、
 すべてのブロックに番号をつける、という方法で、
 全ブロックのリストを作った。
 これにより、ランダム・サンプリングが可能となり、
 今回の統計調査が可能となったのである。)

このような、クラスターサンプリングと
ランダム・サンプリングの併用手法は
戦争中などで調査をすることの多い、国際協力の世界では
一般的に認められており、信頼性に関しても問題ないと言われている。