Open11

確率不等式の勉強ノート

pokapoka-jigokupokapoka-jigoku
  • Markov(マルコフ)の不等式
  • Chebyshev(チェビシェフ)の不等式
  • Chernoff(チェルノフ)境界
  • Hoefdding(ヘフディング)の不等式
  • Bennet(ベネット)の不等式
  • Bernstein(ベルンシュタイン)の不等式
pokapoka-jigokupokapoka-jigoku

Canteli(カンテリ)の不等式

片側評価ならチェビシェフより優秀:

Xは実数値, \lambda > 0

Pr( X - E[X] \ge \lambda) \le \frac{\sigma^2}{\lambda^2 + \sigma^2}

https://en.m.wikipedia.org/wiki/Cantelli's_inequality

pokapoka-jigokupokapoka-jigoku

片側評価だとチェビシェフより優れているが、両側評価だとチェビシェフのがマシらしい

なんやそれは

pokapoka-jigokupokapoka-jigoku

たとえ片側でも、\lambda=k\sigmaとすると、チェビシェフと比較して \frac{k^2}{k^2+1} 倍とかなので、近傍だとそこそこ改善するが遠方になるとチェビシェフとほぼ変わらんね。

pokapoka-jigokupokapoka-jigoku

Chebyshevの不等式

定番。期待値・分散が有限なら使えるが、使うほどでもないぐらいには粗い

Pr(|X-E[X]| \ge \lambda \sigma) \le \frac{1}{\lambda^2}
pokapoka-jigokupokapoka-jigoku

Markovの不等式

X>0, a>0で、

Pr(X \ge a) \le \frac{E[X]}{a}

Chernoff境界

Markovの不等式の改善(?)版。Xは負値まで拡張できているのがミソ。

t > 0

Pr(X \ge a) \le \frac{E[e^{tX}]}{e^{ta}}
pokapoka-jigokupokapoka-jigoku

互いに独立な確率変数の和に関する不等式

Bernsteinの不等式

一番大事そうなので、まずこれだけでも。

X_1, ..., X_nを独立な確率変数とし、E[X_i]=0とする。各X_iに対して、ほとんど確実に|X_i| \le Mを満たすとき、すべての t>0で以下が成り立つ:

Pr(|S_n| \ge t) \le \exp \left( - \frac{t^2}{2 (V_n + \frac{Mt}{3})} \right)

ただし、

\begin{split} S_n &:= \sum_{i=1}^n X_i \\ V_n &:= \sum_{i=1}^n E[X^2_i] = \sum_{i=1}^n Var[X_i] \end{split}

期待値が非ゼロな X_i については、Z_i = X_i - E[X_i] と中心化して上記の式を適用すればよく:

X_1, ..., X_nを独立な確率変数とし、ほとんど確実に|X_i - E[X_i]| \le Mを満たすとき、すべての t>0で以下が成り立つ:

Pr(|S_n - E_n| \ge t) \le 2\exp \left( - \frac{t^2}{2 (V_n + \frac{Mt}{3})} \right)

ただし、

\begin{split} S_n &:= \sum_{i=1}^n X_i \\ E_n &:= \sum_{i=1}^n E[X_i] \\ V_n &:= \sum_{i=1}^n E[(X_i - E[X_i])^2] = \sum_{i=1}^n Var[X_i] \end{split}
pokapoka-jigokupokapoka-jigoku

特にX_iたちが独立同分布だった場合、E[X_i]=\mu,~Var[X_i]=\sigma^2として、

Pr(|S_n - n \mu| \ge t) \le 2\exp \left( - \frac{t^2}{2 (n \sigma^2 + \frac{Mt}{3})} \right)

よって、

Pr(|\bar{X} - \mu| \ge t) \le 2\exp \left( - \frac{n t^2}{2 (\sigma^2 + \frac{Mt}{3})} \right)