はじめに
あるデータから一意の値を取得する際に、よくハッシュ値を取る方法が使われる。
その際、衝突する確率がどのくらいなのか気になったので調べてみた。
今回考えること
SHA256 によってハッシュ値を取ることを想定する。この際、 SHA256 が取る値は一様にランダムとする。
ある特定の SHA256 のハッシュ値になる確率(1/2256)がどのくらいかを他の確率的な事象で比較する。
確率の比較
事象 |
2の累乗表記 |
10の累乗表記 |
%表示 |
ロイヤルストレートフラッシュ |
1/216.0 |
1/104.83 |
1.48∗10−3 % |
天和 |
1/218.3 |
1/105.52 |
3.03∗10−4 % |
2択20問のテストででたらめ回答で0点 |
1/220.0 |
1/106.02 |
9.54∗10−5 % |
宝くじ一等 |
1/223.2 |
1/107.00 |
1.00∗10−5 % |
何もせず6Vが生まれる(ポケモンの話) |
1/230.0 |
1/109.03 |
9.31∗10−8 % |
天和四暗刻大四喜字一色 |
1/249.7 |
1/1015.0 |
1.08∗10−13 % |
センター国語(2020)で適当回答で満点 |
1/279.6 |
1/1024.0 |
1.12∗10−22 % |
40人クラスの席替えが席替えにならない |
1/2159 |
1/1047.9 |
1.23∗10−46 % |
54枚のトランプが購入時の並び順になる |
1/2237 |
1/1071.4 |
4.33∗10−70 % |
100個のサイコロ振ってゾロ目 |
1/2255.911 |
1/1077.0 |
9.18∗10−76 % |
SHA256 が衝突する |
1/2256 |
1/1077.1 |
8.64∗10−76 % |
※もしかすると間違っているかもしれないが悪しからず |
|
|
|
上記の計算結果から、衝突する確率は100個のサイコロを振ってゾロ目が出る確率とほぼ同じと言うことがわかった。
実際にサイコロ100個振ってみた
100個のサイコロを準備した。

それを手にもって振る!

その結果...
↓
↓
↓
↓
↓
↓
↓
↓
↓
↓
↓
↓
↓
↓
↓
↓
↓
↓
↓
↓
↓
↓
↓
↓
↓
↓
↓
↓
↓
↓
↓
↓
↓
↓
↓
↓

全部ピンじゃねぇかっ・・・!
.
.
.
.
.
.
.
.
.
.
.
まぁ、そんなわけないよね。

あとがき
サイコロ100個振りたかっただけ。
Discussion
面白い記事をありがとうございます!ハッシュ値の衝突が話題になる時って、あるハッシュ値が次に生成したハッシュ値と衝突する確率(1/2^256)の他に、沢山ハッシュ値を生成した場合にその中に衝突している組が存在する確率(誕生日のパラドックスで直感よりも高い値になる)を考える場合が多いので、この記事で触れていただくとどのあたりになるのかなーと気になりました!(母数によって確率は変わるので簡単には表に載せにくいとは思うのですが、、)
めちゃくちゃ返信遅くてすみません。ここのところ忙しくて、昨日気づきました orz...。
僕も気になりましたので、追加で記事書きました。
これってトリビアになりませんか?(ネタが古い)