水曜日のティータイム

好きなことや日々の雑感などを書いてます。関西在住です。最近はインコと編み物にはまっています。

世の中の数字に表れる謎の規則性「ベンフォードの法則」について調べてみた


<広告>


本日学んだ、おもしろい雑学は「ベンフォードの法則」です。

雑学というかちゃんとした数学ですけど、掛け算すらろくにできない私ははじめて耳にし、その内容に驚きました。

 

 

「ベンフォードの法則」とは

f:id:anemoneko:20170214183436j:plain

例えば買い物をした時のレシート。

様々な商品の価格がランダムに並びますが、1から9までの数字で最も上一桁になることが多い数字はなんでしょう?

 

410円だと「4」、84円だと「8」です。

 

 

なんとなくで考えると、1から9までの9個の数字が存在するので、単純に「1」ではじまる数字が全体の9分の1を占め、他の数字もそれぞれ9分の1づつ、つまり、どの数字も同じ割合で1桁目になる様に思われます。

 

 

しかし実際は、1桁目の数字が「1」になる確率は30.1%もあるのです!

 

f:id:anemoneko:20170214183029p:plain

 

レシート1枚ではわからないけど、何百枚も集めて統計を取ると「1」からはじまる数字が3割はあるということです。「2」からはじまる確率は17.6%なので、集めた数字の約半分は「1」か「2」が1桁目にくるということになります。

 

これがベンフォードの法則です。

 

 

 

どんな数字にも当てはまるのか?

f:id:anemoneko:20170213192422j:plain

新聞の株式欄に並んでいる数字も上一桁が「1」からはじまる数字が3割。

川の長さや、人口の統計、世界中の地震の死者数、素数の出現パターンまでもこの法則に当てはまるらしいです。

 

逆に当てはまらないものは、電話番号や車のナンバーなど、人為的に作成された数字はベンフォードの法則に当てはまらないそうです。

 

 

 

日常でどの様に使われているか

人が手を加えた数字には当てはまらないという特性をいかして、会計データの改ざんや脱税、選挙の不正発見に応用されているそうです。

 

実際にアメリカのある企業で、各種支払額の最初の桁を「ベンフォードの法則」に当てはめてチェックしたところ、 不正な伝票が見つかったという。

 

選挙の不正を発見した事例もあるとか。

 

他にもないか探してみると、AKB総選挙の投票数が「ベンフォードの法則」に当てはまるか検証している記事がありました。

 

統計的には、ベンフォードの法則が総選挙の得票数にも成り立つ可能性があることを示せた。しかし、得票数の詳細は40位までのメンバーまでしか公表されていないため、標本数が少なすぎる。このため、本当にこの法則が成り立つかどうかは不明だ。

(出典:AKB48 総選挙の得票数はベンフォードの法則(Benford's law)およびべき乗則に従うか検証してみた - 細橋龍一のブログ

 

上記の記事では、40位までしか発表されていない第2回と第3回の総選挙の結果で検証されていたので、100位まで発表されている第8回総選挙ならどうなるか、気になったのでやってみました。

 

 

 

第8回AKB総選挙がベンフォードの法則になっているかやってみた

f:id:anemoneko:20170213190731p:plain

【計測方法】

得票数はwiki(AKB48 45thシングル選抜総選挙 - Wikipedia)を参照しました。

1位の指原さんは243011票なので「2」、2位の渡辺さんは175613票なので「1」、それぞれの得票数の上1桁の数字を数えてグラフにしてみます。

 

f:id:anemoneko:20170213184837p:plain

 

「7」までは少しづつ減っていてまぁまぁいい感じの推移だけど、少なくなるはずの「8」と「9」が増えてしまいました。

 

とはいえ、272人いた候補者の上位100位までしか反映できなかったので、やはり正確な結果とは言えないですよね…。272位の得票数まで数えられたらキレイなグラフになるのかも。

 

 

【結果】

ベンフォードの法則っぽくなったけど、不正があるかはわからない。

 

 

 

まとめ

おそらく、正確に検証するためには膨大な数のデータがいるのでしょうね。それを補うためには、複雑な計算式が必要だったりするのでしょうか?

 

私の足りない頭では、ざっくりとしか理解できてないですが、数字はおもしろいですね。

 

 黄金比の勉強をするためにこの本を読んでいて「ベンフォードの法則」と出会いました。私には少し難しかったけど、数の起源など興味深い話がたくさん載っていました。

 

 

 

広告を非表示にする