Zenn
Open11

確率不等式の勉強ノート

pokapoka-jigokupokapoka-jigoku
  • Markov(マルコフ)の不等式
  • Chebyshev(チェビシェフ)の不等式
  • Chernoff(チェルノフ)境界
  • Hoefdding(ヘフディング)の不等式
  • Bennet(ベネット)の不等式
  • Bernstein(ベルンシュタイン)の不等式
pokapoka-jigokupokapoka-jigoku

Canteli(カンテリ)の不等式

片側評価ならチェビシェフより優秀:

XXは実数値, λ>0\lambda > 0

Pr(XE[X]λ)σ2λ2+σ2 Pr( X - E[X] \ge \lambda) \le \frac{\sigma^2}{\lambda^2 + \sigma^2}

https://en.m.wikipedia.org/wiki/Cantelli's_inequality

pokapoka-jigokupokapoka-jigoku

片側評価だとチェビシェフより優れているが、両側評価だとチェビシェフのがマシらしい

なんやそれは

pokapoka-jigokupokapoka-jigoku

たとえ片側でも、λ=kσ\lambda=k\sigmaとすると、チェビシェフと比較して k2k2+1\frac{k^2}{k^2+1} 倍とかなので、近傍だとそこそこ改善するが遠方になるとチェビシェフとほぼ変わらんね。

pokapoka-jigokupokapoka-jigoku

Vysochanskij-Petuninの不等式

読み方がわからん。単峰性を仮定することでチェビシェフより大幅に改善(約半減):

λ>83=1.63299.....\lambda > \sqrt{\frac{8}{3}} = 1.63299..... のとき、

Pr(XE[X]λσ)49λ2 Pr(|X-E[X]| \ge \lambda \sigma) \le \frac{4}{9\lambda^2}

https://en.m.wikipedia.org/wiki/Vysochanskij–Petunin_inequality

https://note.com/utaka233/n/n9ba31bf26049

pokapoka-jigokupokapoka-jigoku

Chebyshevの不等式

定番。期待値・分散が有限なら使えるが、使うほどでもないぐらいには粗い

Pr(XE[X]λσ)1λ2 Pr(|X-E[X]| \ge \lambda \sigma) \le \frac{1}{\lambda^2}
pokapoka-jigokupokapoka-jigoku

Markovの不等式

X>0,a>0X>0, a>0で、

Pr(Xa)E[X]a Pr(X \ge a) \le \frac{E[X]}{a}

Chernoff境界

Markovの不等式の改善(?)版。XXは負値まで拡張できているのがミソ。

t>0t > 0

Pr(Xa)E[etX]eta Pr(X \ge a) \le \frac{E[e^{tX}]}{e^{ta}}
pokapoka-jigokupokapoka-jigoku

互いに独立な確率変数の和に関する不等式

Bernsteinの不等式

一番大事そうなので、まずこれだけでも。

X1,...,XnX_1, ..., X_nを独立な確率変数とし、E[Xi]=0E[X_i]=0とする。各XiX_iに対して、ほとんど確実にXiM|X_i| \le Mを満たすとき、すべての t>0t>0で以下が成り立つ:

Pr(Snt)exp(t22(Vn+Mt3)) Pr(|S_n| \ge t) \le \exp \left( - \frac{t^2}{2 (V_n + \frac{Mt}{3})} \right)

ただし、

Sn:=i=1nXiVn:=i=1nE[Xi2]=i=1nVar[Xi] \begin{split} S_n &:= \sum_{i=1}^n X_i \\ V_n &:= \sum_{i=1}^n E[X^2_i] = \sum_{i=1}^n Var[X_i] \end{split}

期待値が非ゼロな XiX_i については、Zi=XiE[Xi]Z_i = X_i - E[X_i] と中心化して上記の式を適用すればよく:

X1,...,XnX_1, ..., X_nを独立な確率変数とし、ほとんど確実にXiE[Xi]M|X_i - E[X_i]| \le Mを満たすとき、すべての t>0t>0で以下が成り立つ:

Pr(SnEnt)2exp(t22(Vn+Mt3)) Pr(|S_n - E_n| \ge t) \le 2\exp \left( - \frac{t^2}{2 (V_n + \frac{Mt}{3})} \right)

ただし、

Sn:=i=1nXiEn:=i=1nE[Xi]Vn:=i=1nE[(XiE[Xi])2]=i=1nVar[Xi] \begin{split} S_n &:= \sum_{i=1}^n X_i \\ E_n &:= \sum_{i=1}^n E[X_i] \\ V_n &:= \sum_{i=1}^n E[(X_i - E[X_i])^2] = \sum_{i=1}^n Var[X_i] \end{split}
pokapoka-jigokupokapoka-jigoku

特にXiX_iたちが独立同分布だった場合、E[Xi]=μ, Var[Xi]=σ2E[X_i]=\mu,~Var[X_i]=\sigma^2として、

Pr(Snnμt)2exp(t22(nσ2+Mt3)) Pr(|S_n - n \mu| \ge t) \le 2\exp \left( - \frac{t^2}{2 (n \sigma^2 + \frac{Mt}{3})} \right)

よって、

Pr(Xˉμt)2exp(nt22(σ2+Mt3)) Pr(|\bar{X} - \mu| \ge t) \le 2\exp \left( - \frac{n t^2}{2 (\sigma^2 + \frac{Mt}{3})} \right)
ログインするとコメントできます