九段新報

犯罪学オタク、新橋九段によるブログです。 日常の出来事から世間を騒がすニュースまで犯罪学のフィルターを通してみていきます。

その他の統計

欲しいものリストを公開しています。
https://www.amazon.co.jp/hz/wishlist/ls/1CJYO87ZW0UPM?&sort=default
詳しくは以下の記事をご覧ください。
http://blog.livedoor.jp/kudan9/archives/55214570.html

それは本当に「詐欺」グラフなのか グラフを見るときに真に注意すべきポイント

 たまたま、Twitterでこういう記事が流れているのを目にしました。
 僕は #詐欺グラフ が何よりの大好物で、ネットやテレビで変なグラフを見かけるたびにニヤニヤしながらフォルダに保存しています。保存先のフォルダ名はズバリ「#詐欺グラフ」。
 そんな詐欺グラフの世界を皆さんに共有したいと思い、筆をとりました。(このnoteは随時更新予定です)
(中略)
詐欺グラフとは
 詐欺グラフとは、一般的なグラフの作り方とは異なる「演出」を加えることによって意図的に錯誤を狙うグラフのことを指しています。本来、単なる羅列では直感的に理解しづらい数値等を分かりやすく表現するものがグラフであるわけですから、自分の主張を誇大に伝えるために読み手を誤解させる詐欺グラフはとても悪質なものと言えるでしょう。
 面白がって色々と集めるうちに、いくつかのパタンが存在することに気づいたのでパタンごとに順番にご紹介します。
(中略)
0から開始しない棒グラフ
 よく分かっていない人も多いですが、棒グラフはその面積で強い印象を与えるため、縦軸の一番下はゼロ。絶対にゼロ起点にしないといけません。
 これは法律でそう決まっているくらいに思った方がいいです。
 (一定以上の知識がある人にゼロ起点になっていない棒グラフを見せたら、舐められるので気をつけましょう!)
 あなたの知らない「詐欺グラフ」の世界(随時更新中)-note
 なるほど。確かに、報道や広告の中にはグラフの作り方が明らかに不適正なものがあります。しかし、記事に挙げられているものすべてを「詐欺」という風に表現してしまうのは違和感があります。

 元来、グラフは「強調」表現である
 そのことを考えるうえで押さえておくべきなのは、そもそもグラフというのはすべからく、数字を強調するための表現であるということです。
 棒グラフであれば複数の群間の数字の際を、折れ線グラフであれば時系列変化を、円グラフや帯グラフであれば割合を、それぞれ強調して表現するための手法です。

 記事では、詐欺グラフを『一般的なグラフの作り方とは異なる「演出」を加えることによって意図的に錯誤を狙うグラフ』と定義していることからもわかるように、グラフには「一般的な」演出というものがあり、それによって作成者は多かれ少なかれ読者に狙い通りの印象を、言い換えれば錯誤を与えようとしています。

 そして注意すべきなのは、どこまでが一般的な演出であるかという境界は実にあいまいであるという点です。記事はかなりこの境界を厳しく見ていますが、私は後述する理由で甘く見てもいい、むしろ甘く見るべきであると考えています。

 「棒グラフは必ず0起点」なんてルールはない
 その境界の最たる例が、引用でも示した『絶対にゼロ起点にしないといけません』です。筆者はかなり強調して表現していますが、こんなルールは別にどこにもありません。グラフが0起点であるべきかどうかは、扱うデータの性質と差の重要性によって異なります。

 例えば、ある作業時間が100秒から98秒に減少したというデータがあるとしましょう。この2秒の減少時間が極めて得難く、重要な意味を持つ差異であるならば、グラフは0起点にせず90秒くらいから始めてそのことを強調するのは決して不適切なグラフの作り方ではありません。むしろ、馬鹿正直に0から始めて微々たる差異であるかのように表現するほうが不適切です。
 一方、せいぜい誤差ぐらいの差でしかないならば、そもそもグラフを作ってまで強調する意味はありません。このように、どのようにグラフを作るべきなのかは扱うデータと得られた違いの重要性などによって異なってきます。

 確実に不適切なグラフ
 まぁ、それでも明らかに不適切なグラフの作り方というものもあります。
picture_pc_55773ef5bcacc49ac0edf3f64074692c
picture_pc_5ad5e38afcff003df6cf28d48571acae

 この、縦軸や横軸、円周の間隔が歪んでしまったグラフはどうあがいても適切とは言えないでしょう。上のグラフであれば、せめて0起点をやめて差異を強調すべきですし、下の円グラフであれば円周の間隔は歪めずに文字を大きくしたり空間をより目立つ色に変えたりすることで強調すべきです。軸の間隔を歪めてしまうと、その点が指す数字がなんなのかわからなくなってしまいます。
picture_pc_7705cc1fc3b334c9f124e793ff416013

 また、中心をずらした円グラフもご法度でしょう。記事の筆者のように必ず帯グラフを使えとは思いませんが、中心までずらしてしまうと面積が指し示す内容が意味を持たなくなってしまいます。

 本当に気を付けるべきことは何か
 私が、このようなグラフの強調に関して、そこまで厳しい立場をとらないのは、グラフがそもそも強調する表現であることと同時に、グラフがどう表現されているかは実はさほど問題ではないと考えているからです。記事で挙げられている詐欺グラフの大半は、実のところきちんと数字が表記してあって、それを読むと正しい解釈がわかります。気を付けていれば詐欺グラフの表現はさほど問題ではないのです。

 より問題なのは、「正しい」グラフを表示しながら「間違った」解釈を開陳するという場合です。グラフの形式的な表現ばかりに気を取られていると、正しいグラフの頓珍漢な解釈を真に受けるという滑稽なミスをやらかします。
DvbXYWPV4AAe_KU

 例えば、上に挙げたのは『池上彰「防犯カメラに犯罪抑止効果」のデタラメ』で扱ったグラフです。両側が違う数字を示す二軸のグラフですが、数字に恣意的なところはなく問題のないグラフです。というか、グラフ「は」問題がないというべきでしょう。池上彰はこのグラフをもとに「防犯カメラに犯罪抑止効果がある」と論じましたが、これは明らかな誤りです。

 詳しくは元の記事を参照してほしいのですが、防犯カメラの犯罪抑止効果が限定的であることはキャンベル共同計画のレビューですでに明らかになっていることです。
 また、それを抜きにしても、おおむね路上に設置される防犯カメラの犯罪抑止効果を、家庭内といったプライベートな空間での犯罪もカウントしているであろう認知件数で検討するのは誤りです。加えて、これはあくまで防犯カメラの設置台数と認知件数が連動している「っぽい」ことしかわからないので、せめて相関係数を出して2つの数字の関連の強さを検討する必要があります。
auto_iysDoi

 ついでにもう1つ。これは極右論壇で外国人犯罪を論じている坂東忠信が作成した円グラフで、このグラフも数字は正しく表現の問題もありません。
 では、彼がこのグラフを使って主張する「在日韓国・朝鮮人」の犯罪率が高くて危険というのは正しいでしょうか。もちろんそんなことはありません。

 このグラフはあくまで「外国人検挙件数・検挙者に占める国別の割合」であり、元々日本にいる人数によって補正がかけられていません。つまり、日本に大勢いる在日コリアンの検挙者数が多いのは当たり前なのです。犯罪率がどうあれ、人数が多ければ犯罪者の絶対数だって多くなるという道理です。
 また、このグラフはあくまで検挙という警察活動の記録であるため、これをそのまま市井の犯罪状況の反映とみることはできません。坂東のようなレイシストが活動できてしまうほど在日コリアンへの偏見にまみれた警察機構であれば、その分彼らへの視線が厳しくなり検挙率が上がるだろうと考えるのは妥当な解釈でしょう。アメリカで黒人の検挙人数が多いのと同じ理屈です。
 この辺の議論は『【書評】在日特権と犯罪』『坂東忠信がまたデマ本を出すようなので彼の過去のデマを蒸し返す』を参照してください。

 このように、いかに正しいグラフでもそれに伴う主張がでたらめであることは往々にしてあり、我々は詐欺グラフよりもむしろそちらを気を付けないといけないのです。

「父親は養育費を払わないんじゃない、払えないんだ」は本当か

 新聞に父親の養育費が8割不払いだと出ていて父親側をせめる論調でした。
 しかしその8割は払わないのか、払えないのかを見ないとダメだと思います。
 払えないのに払わせようとすると父親が困窮してしまいます。
 離婚裁判に詳しい弁護士さんに聞くと父親側で意図的に逃げているのは少数で大半は払いたくても払えない人たちだと言っていました。
 父親から無理やり取るのではなく国が助成するようにすればいいと思います。
 母親と養育費の取り決めをしたのに払わない母親は96パーセントにものぼります。
養育費-300x209

 DV被害などの新聞記事でもそうですが男性側を一方的に悪く書く記事はミスリードだと思います。
 養育費の不払いが8割。父親を悪く書く記事はおかしい。
 前回、『セックスワーカー支援の周りで蠢く怪しい人たち』で怪しげなNPO代表だいわりゅう氏を取り上げたとき、彼のブログ記事でこういうものを見つけました。 要するに、通俗的には養育費の未払いを父親側の責任だと言われることが多いけど、実は母親だって払っていないし、払わない父親も払えないだけだから悪くない、ということです。
 そして、取り立てビジネスに関わる駒崎氏を「ハイエナのよう」と言ったりしているのは前回指摘した通りです。

 その主張、本当か?
 しかし、私はこの記事を読んだ瞬間に怪しいと思いました。
 まずエビデンスとして提示されている表の出典が明記されていない点。普通なら書きます。
 また『養育費の取り決めをしたのに払わない母親は96パーセント』とありますが、そんなこと表のどこにも書いていない点もおかしいです。(うまくアップできず画質がひどくてわかりにくいですが、ちゃんとしたもののリンクは後で出します)表に書いてあるのはあくまで『養育費を受けたことがない』割合であり、素直に受け取ればここには養育費をもらうはずだったけどもらえていない人と、最初からもらう取り決めではない人の両方が含まれると考えるべきでしょう。ここの数字だけ取り出して『養育費の取り決めをしたのに払わない母親』と解釈するのは明らかに誤りです。
 そして『96パーセント』という数字もどこにもありません。ここにあるのは『養育費を受けたことがない』が89.7%、『受けたことがある』2.9%、『不詳』3.4%で、これをすべて足して96%となります。しかし、まだ『受けたことがある』を足すのはいいとして、養育費を受けているかわからないはずの『不詳』までも受けていないものとして考えるのはこれも明らかに誤りです。

 こう怪しさ満点の記事ですから、こちらでその真偽を検証してみました。

 表の元ネタは何か
 表の元ネタはすぐにわかりました。厚生労働省の『全国ひとり親世帯等調査結果報告』です。当該記事が書かれた時点ではすでに平成28年度のバージョンが出ているはずですが、なぜか記事は1つ前の平成23年度版に依拠しているので、ここでもそれに基づきましょう。大まかな傾向に大差はないようですし。

 元ネタの表は『平成23年度全国母子世帯等調査結果報告』の『17.養育費の状況』(PDFです)の7ページと8ページにあります。このPDFの表をわざわざ1つの画像に加工したようですね。そんな手間があるなら出典を明記したほうが早かろうに。

 「父親は払えないだけ」は本当か
 では、だいわりゅう氏の主張は正しいのでしょうか。まずは「父親はお金がなく払えないだけ」という主張から検討してみましょう。
 日本では、離婚後に父親が子どもの養育費を踏み倒し、それに泣き寝入りする母子世帯が非常に多い。厚生労働省が行った「全国母子世帯等調査2011」によると、6割の離婚母子世帯は、父親から養育費を一度も受け取ったことがない。また、離婚直後は養育費を受け取っていたものの、途中で支給が途絶えたケースも多く、実際に養育費を受け取っている離婚母子世帯は、全体の2割程度でしかない。母子世帯の相対的貧困率は50%を超えている中、養育費の確保は貧困解消の切り札となるのか。
 経済状況の悪い夫婦間で「離婚」は生じやすいものの、離婚父親の大半は養育費を全く支払えない経済状況ではない(周2012)。JILPT「第2回子育て世帯全国調査(2012)」に基づく筆者の再集計によると、年収(離婚時)は200万円未満で、養育費の支払いが困難だと考えられる離別父親は全体の2割(19.5%)に過ぎない。離別父親の5人に1人(22.2%)は平均的な世帯主よりも多く稼いでいる(年収500万円以上)。
 年収の高い父親ほど、養育費を払っている割合は確かに高い。同JILPT調査によると、離婚母子世帯の養育費の受取割合は、離別父親の年収が500万円以上の層では25.9%(注i)となっており、200万円未満層(4.7%)よりその割合は20ポイント以上高い。しかし一方、この数字の裏返しは、年収500万円以上の離別父親ですら、その74.1%は養育費を支払っていないというショッキングな事実である。
 なぜ離別父親から養育費を取れないのか-独立行政法人労働政策研究・研修機構
 ちょっと調べてみると以上の記事が見つかりました。あくまで筆者の再集計なので元のデータが出てきませんが、まぁそうだろうなという感じです。
スクリーンショット (19)

 第4回のデータですが、父子家庭と母子家庭を比べると、母子家庭の相対的貧困率が大差をつけて高くなっていることがわかります。相対的貧困が具体的に年収いくらなのかなのかはその年の年収の中央値や世帯人員によるのではっきりと示せませんが、年収の中央値が240万前後であることを考えれば、おおよそ120万を下回れば大抵は相対的貧困であろうと言えると思います。つまり、母子家庭はその程度の年収で暮らしている家庭が半数である一方、父子家庭では二人親世帯よりも低いことが分かります。
 このようなデータから考えても、父親は払えないだけという主張の妥当性に疑問があることがわかるでしょう。

 そもそも、養育費というのはたいていの場合、裁判所の提供する算定表に基づいて計算されるものですから、払えないほどの年収しかない父親からは養育費を請求できないとも考えられるでしょう。算定表によれば、14歳未満の子供1人の場合、養育費を払う側の年収が150万以下だと貰えない公算が高いようです。

 「母親も払ってない!」も怪しい
 もう1つ、母親も払ってないという主張も怪しいです。上掲の貧困率を見れば、そもそも父子家庭では養育費が必要ない場合が多いことが予想されますし、男女の年収の差も考えれば払えない年収の母親も多いでしょう。
スクリーンショット (20)

 また、先ほどの元ネタで引用した母子家庭世論調査の3ページには、父子家庭の父で養育費のとりきめをした者の割合が示されていますが、これによるとそもそも養育費の取り決めをしたものはたったの17.5%でした。この取り決めには「養育費を受け取らない」という取り決めも含まれるであろうことが予想されるので、養育費を貰うと決まっている父親はそれよりもさらに少ないだろうと思われます。

 というわけで、だいわりゅう氏の主張を検討しましたが、基本的に怪しいという結論になりました。まぁ、少し調べればわかることですが。

センター試験に見る統計学的な考え方

受験生の皆さんセンター試験お疲れ様です。雪が降ったりして大変だったでしょう。2次試験がある人も 多いでしょう、あと一息頑張ってください。
 さて今回は犯罪学から少し離れて、統計の話をします。まあ犯罪学だって統計を多用するので無関係ではありません。
 トピックは2つ。1つは倫理で登場した棒グラフ。これがグラフとして不適切かという話です。
 2つ目は韓国語。毎年この時期になると在日特権だなんだと騒がしいのが出てきますが、彼らの言うことは本当なのかという話です。

 棒グラフは必ずゼロから始めるべきか
 倫理の問題に登場した以下のようなグラフ。どこに物言いがついているかわかりますか?
 
201501center_barchart01
201501center_barchart02


 倫理 第1問-朝日新聞DIGITAL
 正解は……ゼロから始まっていないでした。具体的にはこんな感じで批判されています。
 棒グラフは、長さをもって量を示すグラフである。棒が長ければ長いほど量が多くなり、短ければ短いほど量が少なくなる。
 棒グラフを描く際に重要なことは、表したい量と棒の長さが比例していなくてはならないということである。例えば、10キログラムという量をグラフ上で1センチメートルの棒で示したとしよう。このとき、このグラフに、20キログラムの量を表したければ、2センチメートルの棒で、50キログラムの量を表したければ、5センチメートルの棒を描かなくてはならない。こうすると、10キログラム、20キログラム、50キログラムという1:2:5の関係が、棒グラフ上の棒の長さでも1:2:5になる。つまり、元々の分量の比が、グラフ上でも同じ比として示されるのが棒グラフの特徴なのだ。当たり前のように思われるかもしれないが、これが棒グラフを描くときに重要なことになる。
 平成27年度センター試験の倫理で問題のある棒グラフが出題-Colorless Green Ideas
 しかしどのような場面でも必ずゼロから始めなければならないのでしょうか。
 私はそうではないと考えています。例えば今回の試験問題ような、使用できる紙幅に限りのある場面では冗長な部分を省略するという手法を取るのは極めて合理的であると思います。
 特に今回の場合はそれ以外の操作がなされておらず、ましてや具体的な値まで添えてあります。このようなグラフを不適切だと断ずることはできないでしょう。
 上掲の記事では『上記のグラフの一番左側の「小学校5・6年生」のところは、棒しか見なければ、2004年から2009年にかけて、「不安や悩みを抱えている者」が倍増したように思えてしまう。』 と批判していますが、数字まで書いてあるこのグラフを見てそう読解する方のリテラシーのなさを批判すべきです。
 無論、論文などの正確さを重視する場面ではゼロから始めるのが望ましいでしょう。しかし常にゼロから始めなければならないというのは話が違うように思います。
 この辺の話は計量社会学者の金明秀氏も似たような話を過去にしています。素人の思いつきではないよということで念のため。
 統計に騙されない用心が暴走するとき-togetter 
 グラフというのは元々数字をわかりやすく示すための表現です。であれば冗長な部分をカットしよりわかりやすくする操作を全面的に否定するべきではないでしょう。もしそういう操作すら否定するのであれば、もう始めからグラフなんて作るなという話になりかねません。

 余談ですが、グラフでよく問題になりやすい増減の評価ですがこれには2種類あります。1つは有意差のように、統計学的な裏付けがあって主張できるものです。こちらはたいして問題になりません。
 問題になりやすいのは2つ目の主観的なものです。急増とか微減とかです。しかし具体的にどれくらい増減すれば急なのか、あるいは微妙なのかという基準は存在しません(だから主観的な評価なんだけど)。
 例えば交通事故が300件増加したとして、それを急増と見るか微増と見るかは読み手の主観によります。それ以前の上昇値よりも低いことをもって減少していると強弁することも不可能ではありません。
 故に社会学は解釈の学問だと表現されることもあるらしいです。調査して出てきた数字をどのように解釈するかという話ですね。

 追記(2015/01/19)
 そういえばどっかでこれ以外に似たようなグラフを見たなーとは思ってたんですが、発見しました。

 グラフ作成者の意図は明確でしょう。実際よりも変動を大きく見せ、軍事費が激増したと論じようとしています。
 しかし一方できちんと具体的な数字が示され、単位も明確にされています。これでもって例えば12年に比べて15年では軍事費が倍増していると解釈するのは単なる注意不足でしょう。
 上述のように、数字の変動をどのように解釈するかは人によります。この程度の変動でも急増と評価する人はするでしょうし。12年から15年にかけては実際に軍事費は増えているのですが、それ以前の年度の水準に戻っているだけだから増加とは言い難いとする人もいるでしょう。どの評価が適当かは、周辺の根拠を考慮して判断するしかありません。私は「元に戻った」と解釈しましたが、もっと前のデータを見れば評価が変わるかもしれません。
 ちなみに「悪意を取り除いたver.」なるものもありますが、これでは目を凝らさないと増減すらも読み取りづらいです。web上や紙面ではまだしも、恐らくパワーポイントで示されたらわからないでしょう。確かに厳密ですが、場面によっては適切ではないと考えられます。

 センター試験韓国語は「特権」か
 続いては韓国語の話。最もこの問題については脱「愛国カルト」のススメが去年とても詳しい記事を書いておりここでやるのはいささか蛇足な気もしますが……。
 今回は平均点の読解のみに目を向けて論じます。それ以外の論点は上の記事を読んでください。
 さてセンター試験の韓国語では毎年以下のようないちゃもんが噴出します。

 しかしその文句は的外れだという話をします。 
 さて、これらの文句はひとえに平均点が韓国語の方が高いという事実から立ち現われています。それは保守速報で示されている上のようなグラフでもわかります。
 ちなみに200点満点なのに平均点が100超えないの?と思った人もいるかもしれませんが、これは平均点をわざわざ2で割って何故か100点満点で算出されているからです。
 「韓国語が英語より平均点高い!韓国語の方が簡単なんだ!」と思った人は立ち止まってよく考えましょう。特に「どんな人が受けているか」という部分を。
 言うまでもなく、韓国語は「それなりに点数を取る自信があるやつ」が受けています。一方英語は誰もかれもが取り敢えず受けます。私の母校がそうだったように、学校によっては強制受験だったり期末試験の代わりだったりするのでできない奴も死ぬほど受けます。結果として英語の平均点は引き下げられ韓国語の平均点は引き上げられます。
 ちなみに英語の受験者数は53万を超えるのに対し韓国語は180人です。この人数を直接比べることにどれだけの意味があるでしょうか。
 蛇足にさらに付け足すとすれば、上のグラフにはもう1つ不可思議な点があります。それはどこでしょうか。上掲の記事を読めばわかります。ヒントは、このグラフが2014年の記事に登場していることです。ツイートで示されている保守速報の記事は2012年のものです。

 目の前のグラフをどう読むべきか
 2つの話題から統計の話をしました。最後に私がこのようなグラフを読む際に気をつけていることを纏めて締めましょう。
 ①グラフの数字は実数か割合か 割合なら母集団は何か 実数なら単位は何か
 家族間殺人は上昇しているのかで触れているように、割合は増えてるけど実数は減ってるみたいな話はいくらでもあります。また単位も違えば意味が変わってきます。 
  割合であれば母集団が何かも重要です。「原発に80%の人々が反対している」という話でも、有権者の80%か「渋谷の100人に聞きました」の80%で大きく意味が変わってきます。
 ②具体的な数字はあるか 出典はどこか
 グラフの読解以前の気はしますが重要です。
 ③不自然な省略、操作はないか
 倫理に登場した操作なら適切ですが、棒グラフでもまれに一部の棒だけ長さを省略したものをみます。これは明らかに不適切です。また円グラフの中心をずらしてみたりグループ分けが不自然なグラフもありました(ワンダー・グラフ・ジェネレイターなんてものもできてる)。

 これらのグラフの不自然さを見抜くには、実地訓練が一番です。とにかく沢山のグラフに触れて、その違いに注視してみてください。
 このブログでも「犯罪統計」のタグをぽちっと押せばそんなグラフを載せた記事が出てきます。結構地味な割に手間がかかった記事が多いので見ていただきたいところです。
犯罪心理学者(途上)、アマ小説家。カクヨム『アラフォー刑事と犯罪学者』『生徒会の相談役』『車椅子探偵とデスゲームな高校』犯罪学ブログ『九段新報』など。質問はhttps://t.co/jBpEHGhrd9へ
E-mailアドレス
kudan9newbridge@gmail.com
メッセージ

名前
メール
本文
記事検索
アクセスカウンター
  • 累計: