💡

間隔の期待値問題

に公開

前書き(非本質情報)

この記事はZennと統計の勉強を始めたばかりの著者が自身の理解を記録する第1歩として書いたものです。

動機

『プログラミングのための確率統計』(平岡 和幸・堀 玄 共著) を読み進める上で コラム:事故間隔の期待値(p112) の問題に悩み、自分なりに答えを出した。しかし正答らしきものが調べても見当たらなかったため、ここに類題への考えを示し、正答への礎としようと思った。
どうやらこの問題はインスペクション・パラドックスと呼ばれたり待ち時間のパラドックスと呼ばれるものの類題であるらしい。

問題

(※この問題は上記の著作及びInformation Theory, Inference, and Learning Algorithms(David J.C. MacKay 著)を参考にした上で独自に作成したものです。)

数直線上の整数値の点全てに1つずつランプが置かれている。これらのランプは0.1の確率で点灯しており0.9の確率で点灯していない。
(1) 0.5から見て数直線正方向で1つ目の点灯したランプから負方向で1つ目の点灯したランプまでの距離の期待値はいくつか。
(2) 隣合う点灯したランプ間の距離の期待値はいくつか。
(3) (1)と(2)の答えが異なる・または同じとなるその理由を述べなさい。

自身の回答

(1) tから数直線正方向で1つ目の点灯したランプまでの距離の期待値は、ランプは確率0.1で点灯するので10-0.5=9.5
対称性より0.5から負方向1つ目までの期待値も9.5
期待値の線型性より答えは9.5×2=19

ちょっと厳密に

0.5から数直線正方向で1つ目の点灯したランプまでの距離がk-0.5となる確率は0.1×(0.9)^{(k-1)}
よって0.5から数直線正方向で1つ目の点灯したランプまでの距離の期待値は

\sum_{n=1}^\infty 0.1(k-0.5)(0.9)^{(k-1)}=9.5

以下略

(2) 確率0.1で点灯するので10

ちょっと厳密に

ある点灯しているランプに着目する。そのランプから正方向で1つ目の点灯しているランプまでの距離がkである確率は0.1(0.9)^{(k-1)}なので、その距離の期待値は

\sum_{n=1}^\infty 0.1k(0.9)^{(k-1)}=10

ひとつも点灯していない場合を考える。
\lim_{n\to \infty} 0.1k(0.9)^{(k-1)}=0

(上記の無限級数が収束していることより自明)
より無視できる。

(3) 異なる理由を述べる。
(1)で求めたのはある値(0.5)が間にある隣合った点灯したランプ間の距離の期待値。
(2)で求めたのは点灯したランプ間の距離の期待値であり、求めているものが異なるからである。

より細かくどう異なるのかを見ていく。
(1)においては確率変数は、点灯させた時0.5を間に挟む隣合う点灯したランプ間の距離である。サンプリングする様子を想像すると、最終的なランプ間の距離が3であってもランプの位置は3通り考えられることが分かるだろう。よってランプ間の距離が3になる確率は

3\cdot (0.9)^2(0.1)^2

一方でランプ間距離が2であるようなランプの位置は2通りであり、確率は
2\cdot (0.9)^1(0.1)^2

(2)においては確率変数はある点灯したランプと次の点灯したランプ間の距離である。サンプリングする様子を想像するとランプ間の距離が3の時ランプの位置は「ある点灯したランプ」が固定されているため1通りであろう。
ランプ間の距離が3になる確率は
1\cdot (0.9)^2(0.1)^1

一方でランプ間距離が2であるようなランプの位置も1通りであり、確率は
1\cdot (0.9)^1(0.1)^1

このように事象のカウント方法が異なることが分かる。

また有限個の場合から大数の法則で考えてみる。
-n/2以上n/2未満の座標のランプを考える。点灯しているランプの個数の期待値は0.1nである。
隣合う点灯したランプ間の距離の集合を考える。点灯しているランプの個数をMとするとa_1,a_2,a_3 ...a_{(M-1)}と要素が書ける。
この時、これらの平均は
\frac{a_1+a_2+a_3 ...+a_{(M-1)}}{M-1}
この平均の期待値は\frac{n-10}{0.1n}
これのnの極限は(2)の答えであり10である。
(1)について考える。a_1,a_2,a_3 ...a_{(M-1)}をサンプリングした後点灯したランプ間の距離の集合の要素が実際にどのように数直線上に並んでいるかは分からないがどの並び方も同様に確からしい。並び替えを考えた時0.5が上記の集合のa_lの部分にある確率は\frac{a_l}{a_1+a_2+a_3 ...+a_{(M-1)}}
なので求める期待値は
\sum_{l=1}^{M-1} \frac{(a_l)^2}{a_1+a_2+a_3 ...+a_{(M-1)}}
これは二乗の平均を平均で割ったものと等しい。これのnの極限は分母は(2)の場合より10。分子は(2)の"ちょっと厳密に"の所での無限級数のkk^2とすればよく、

\sum_{n=1}^\infty 0.1k^2(0.9)^{(k-1)}=190

よって\frac{190}{10}=19
と求まった。

感想

変に分かりづらいかもしれない。

Discussion