
年内最終日の今日は、数字の話。今日のエントリー担当・文系(?)の私が自分で納得できるように書いているので、理数系の方々などから「うーん、そこ、ちょっと違うんじゃ・・・」というツッコミが入りそうな箇所も多々有るとは思いますがおつきあいくださいませ。
さて、ここに請求書があるとします。

実はこの請求書には架空の請求額が存在します。いわゆる「水増し請求」の請求額が混ざっています。あなたが税務署員だとしたら、どの請求額が水増ししたものかわかりますか?
回答はこちら。赤枠の部分が不正請求です。

さて、なぜにそうなるのでしょうか?次に、この請求書に記載されている数字と、記載されている回数をグラフにしてみました。

1という数字と9という数字が多く記載されていて、あとはまちまち。そうです。不正請求はすべて、「9」の数字が記載されているものなのです。
結論から先に言ってしまうと、これが「ベンフォードの法則」というものです。
数字で一番多く使用されるのが、「1」。そして次が「2」以下、平均して回数が減っていくわけです。
つまり、この請求書には確率的に言ってあまり出るはずのない「9」がやたらと多く出てくるわけです。「1」の次に多い。これはおかしい・・・ということでここから調べていくのです。実際に米国の税務署ではこの方法を応用しているという例もあるそうです。
「1」が一番多いというのは、数字を順番にちょっと書いてみるとすぐにわかります。
1、2、3、4・・・・・・99、100、101・・・・110、111、112・・・
確かに「1」は一番使用されています。こうして数えると、数字は「1」と「2」だけで50%を占めるのです!
この「数字の不公平」。ちょっと興味深いと思いませんか?先日のDTSのミーティングでは他にも様々な「確率」のおもしろい話が挙ったので、また来年のブログでご紹介したいと思います。
DTSブログの次回エントリーは2010年1月4日よりスタート。それでは、みなさまどうか良い2010年をお迎えください!