📔

Botter自主ゼミノート 3.1, 3.2 確率変数列の収束

2023/01/01に公開

やること

https://www.amazon.co.jp/dp/4254209444
を読んで、確率微分方程式による最適化問題を解けるようになることです。

これまでのBotter自主ゼミノート

Botter自主ゼミノート 1.2 確定システムの制御の回顧
Botter自主ゼミノート 2.1 確率過程とは?, 2.2 確率過程の数学的表現
Botter自主ゼミノート 1.2 数式導出
Botter自主ゼミノート 2.3 確率モーメント
Botter自主ゼミノート 2.4 確率過程の分類
Botter自主ゼミノート 2.5 エルゴード性
Botter自主ゼミノート 2.6 確率過程の周波数表現
Botter自主ゼミノート 2.7 マルコフ過程
Botter自主ゼミノート 2.8 正規型確率過程
Botter自主ゼミノート 2.9 ウィーナ過程(1)
Botter自主ゼミノート 2.9 ウィーナ過程(2)
Botter自主ゼミノート 2.10 白色雑音

3.1 数学的準備

二次確率変数について

教科書によると、確率変数x_1, x_2, \cdotsがそれぞれ有限な二次モーメント\mathcal{E}\{x_1^2\}, \mathcal{E}\{x_2^2\}, \cdots \:(\mathcal{E}\{x_i^2\} < \infty, i = 1, 2, \cdots)を持つ場合、それらは二次確率変数と呼ばれるそうです。

シュヴァルツの不等式より

\left[\mathcal{E}\{|x_1 x_2|\}\right]^2 \le \mathcal{E}\{x_1^2\}\mathcal{E}\{x_2^2\} < \infty \tag{3.1}

であるので、cを実定数とすると、

\mathcal{E}\{(x_1+x_2)^2\} < \infty, \quad \mathcal{E}\{(cx_1)^2\} = c^2 \mathcal{E}\{x_1^2\} < \infty \tag{3.2}

が成立します。したがって、二次確率変数は、確率空間上で線形ベクトル空間を構成します。

確率過程\{x(t), t \in T\}は、\mathcal{E}\{|x(t)|^2\} < \infty \: (t \in T)であるなら、二次確率過程と呼ばれます。

前章で触れた白色雑音は、無限大の分散を持つので二次確率過程ではありません。

3.2 確率変数列の収束

三種類の収束

\{x_n(\omega), n=1,2,\cdots\}を(スカラー)確率変数列とします。この時、_nがある値xに収束する仕方には、主として次の三つがあるそうです。

  1. 変数列\{x_n(\omega)\}が、もしすべての\omega \in \Omegaに対して
\lim_{n \to \infty} x_n(\omega) = x \tag{3.3}

となるならば、変数列\{x_n(\omega)\}は確率1xに収束するといい、

\lim_{n \to \infty} x_n = x \: (\text{w.p.1}) \tag{3.4}

と表記します。この収束を概収束と呼びます。

  1. \{x_n(\omega)\}が、すべての\epsilon > 0に対して
\lim_{n \to \infty} \Pr\{|x_n(\omega)-x| \ge \epsilon \} = 0 \tag{3.5}

となるならば、\{x_n(\omega)\}は確率的にxに収束するといい

\underset{n \to \infty}{p\text{-lim}}\:x_n = x \tag{3.6}

と表記します。この収束を確率収束と呼びます。

  1. \{x_n(\omega)\}が、すべてのnに対して\mathcal{E}\{|x_n|^2\} < \inftyで、かつ\mathcal{E}\{|x|^2\} < \infty に対して
\lim_{n \to \infty} \mathcal{E}\{|x_n - x|^2\} = 0 \tag{3.7}

となるなら、\{x_n(\omega)\}は二乗平均でxに収束するといい、

\underset{n \to \infty}{\text{l.i.m.}}\:x_n = x \tag{3.8}

と表記します。この収束を二乗平均収束と呼びます。また、収束値xを${x_n}の二乗平均収束値と呼びます。

これらの間の成立関係については、概収束するのであれば確率収束する、二乗平均収束するのであれば確率収束するということはできますが、概収束と二乗平均収束の間の関係は一般的には何も言えません。

二乗平均収束するのであれば確率収束することは、チェビシェフの不等式を用いて証明します。

有限のモーメントを持つ確率変数xに対して、\epsilon > 0とすると、以下が成立します。

\Pr\{|x| \ge \epsilon\} \le \frac{\mathcal{E}\{|x|^2\}}{\epsilon^2}

ここでxx_n(\omega) - xを代入して

\Pr\{|x(\omega) - x| \ge \epsilon\} \le \frac{\mathcal{E}\{|x(\omega) - x|^2\}}{\epsilon^2}

二乗平均収束が成立する場合、n \to \inftyの時、右辺は0となるので以下の式が成立し、二乗平均収束するのであれば確率収束することがわかります。

\Pr\{|x(\omega) - x| \ge \epsilon\} \le \frac{\mathcal{E}\{|x(\omega) - x|^2\}}{\epsilon^2} \to 0 \: (n \to \infty) \tag{3.9}

教科書によると、概収束と確率収束は二乗平均収束に比べるとその証明は難しいのだそうです。そして、以後教科書では二乗平均収束を用いるとのことです。

二乗平均収束の性質

教科書では、二乗平均収束に関する性質が4つ説明されています。x = \{x_n(\omega)\}, y = \{y_n(\omega)\}, z = \{z_n(\omega)\}\:(\omega \in \Omega)を確率変数列とし、さらにx = \underset{n \to \infty}{\text{l.i.m.}}\:x_n, \: y = \underset{n \to \infty}{\text{l.i.m.}}\:y_n, \: z = \underset{n \to \infty}{\text{l.i.m.}}\:z_nとし、a, bを定数としたとき

  1. \underset{n \to \infty}{\text{l.i.m.}}\:(a x_n + b y_n) = a \cdot \underset{n \to \infty}{\text{l.i.m.}}\: x_n + b \cdot \underset{n \to \infty}{\text{l.i.m.}}\: y_n
  1. \lim_{n \to \infty} \mathcal{E}\{x_n\} = \mathcal{E}\left\{ \underset{n \to \infty}{\text{l.i.m.}}\: x_n \right\}
  1. \lim_{n,m \to \infty} \mathcal{E}\{x_n y_m\} = \mathcal{E}\left\{ \underset{n \to \infty}{\text{l.i.m.}}\: x_n \underset{n \to \infty}{\text{l.i.m.}}\: y_n \right\}。また、特別な場合として\lim_{n \to \infty} \mathcal{E}\{x_n^2\} = \mathcal{E}\left\{ \underset{n \to \infty}{\text{l.i.m.}}\: x_n^2 \right\}
  1. \mathcal{E}\{x_n y_n\} = \mathcal{E}\{z_n\}ならば、\mathcal{E} \left\{ \underset{n \to \infty}{\text{l.i.m.}}\: x_n \underset{n \to \infty}{\text{l.i.m.}}\: y_n \right\} = \mathcal{E}\left\{\underset{n \to \infty}{\text{l.i.m.}}\: z_n \right\}となる

二乗平均の極限値について

二乗平均の極限値は唯一のものになります。すなわち、\{x_n\}yまたはzに二乗平均収束する場合、yzは確率的に等価、つまり\Pr\{y = z\} = 1となります。この時、y = \text{l.i.m.}\:x_n, \: z = \text{l.i.m.}\:z_nであるので

\begin{aligned} \mathcal{E}\{|y-z|\} &= \mathcal{E}\{|(y-x_n)-(z-x_n)|^2\}\\ &= \mathcal{E}\{|(y-x_n)+(x_n-z)|^2\}\\ & \le 2 \mathcal{E}\{|y-x_n|^2\} + 2 \mathcal{E}\{|x_n-z|^2\} \end{aligned}

となり、右辺のn \to \inftyの極限を取ると、\mathcal{E}\{|y - z|^2\} = 0であることがわかる。

ここで、チェビシェフの不等式を用いて確率変数y-xの二次モーメントから確率を求めると

\Pr\{|y-z| > \epsilon\} \le \frac{1}{\epsilon^2} \mathcal{E}\{|y-z|^2\}

上式が任意の\epsilonに対して成り立つので、\Pr\{y = z\} = 1であることが分かります。

Discussion