㊙️

確率微分方程式の基礎

2023/11/17に公開

直観的理解

確率微分方程式の書籍の多くはwiener過程の定義を唐突に書き始め、これがwiener過程だよと押し付けてきます。これはまるでユークリッド空間の話をすっ飛ばして位相空間の定義をいきなり書き始めるようなものです。なぜこのような導入を多くの数学書が行っているのか。これはネタバレになってしまいますが、Wiener過程の"素"の話には数学的には扱えないものが現れるので不親切な導入になってしまうのはしかたがないことなのです。本記事ではその素について解説していきます。


そもそもwiener過程のモチベーションは何だったのかというと、brawn運動をモデル化したいというものでした。なのでbrawn運動がどんなものだったのか思い返してみましょう。
brawn運動とは、以下の画像みたいなやつのことです。

質量M,mの質点の衝突後の速さの比は(2質点の重心から見れば) m:M なので、水分子がbrawn粒子に比べて非常に軽いことを考えると水分子の速さはbrawn粒子のそれに比べて非常に大きい(M/m倍)と考えられます。これはwiener過程(brawn運動の数理モデル)を理解する上で非常に重要な事実です。

brawn粒子の運動方程式として、水の粘性抵抗(第一項)に水分子の衝突による時刻tにおけるランダムなノイズW_tを加えたものを考えると以下の式が表れます。(brawn粒子の質量は省略)

\frac{dV_t}{dt}=-\gamma V_t + W_t

重要なことなのでもう一度言いますが、これはbrawn粒子と水分子が衝突したことによる、brawn粒子の運動方程式です。あくまでも時間スケールはbrawn粒子の視点から考えます。何が言いたいのかというと、brawn粒子と水分子の速度比は桁違いなわけですからbrawn粒子がdt秒かけてdV_t進んでいる間に水分子はめちゃくちゃ動いているということです。このdtはbrawn粒子にとっては微小時間ですが水分子にとっては微小(距離進むのにかかる)時間ではないということです。
そして、この式のWは水分子によって生じるものですが、その添え字tの刻み幅はbrawn粒子から見た微小時間です。


以上のことを踏まえるとW_tW_{t+\Delta t}は無相関だとモデル化するのが妥当ではないでしょうか。これを簡単に数式で表すと次のように考えられます。ちなみにW_tは様々な方向から衝突してくる水分子によるものなので平均は0の定常過程と考えます。

Cov\{W_t, W_s\} = E\{W_tW_s\}=\begin{cases} \sigma_0 & (t=s) \\ 0 & (t\ne s) \end{cases}

しかし、このモデル化では意味のある結果は得られません。なぜなら上記のような共分散を持つ確率過程W_tのパワースペクトルSは定常的に0である確率過程のそれと同じだからです。実際、

\begin{aligned} S(\omega) &= \int_{-\infty}^{\infty}e^{i\omega\tau}Cov\{W_t,W_{t+\tau}\}d\tau \\ &= \lim_{t \to 0}\int_{-t}^{+t}e^{i\omega\tau}\sigma_0d\tau\\ &= \lim_{t \to 0}\left[\frac{1}{i\omega}\sigma_0e^{i\omega\tau}\right]_{-t}^{+t}\\ &= \lim_{t \to 0}\frac{2\sigma_0}{\omega}\frac{e^{i\omega\tau}-e^{-i\omega\tau}}{2i}\\ &= \lim_{t \to 0}\frac{2\sigma_0}{\omega}\sin{\omega t}\\ &=0 \end{aligned}

実は、①相関時間極小②揺らいでほしい(パワースペクトル非零)を同時に達成するような確率過程W_tとして次のようなものが考えられます。

Cov\{W_t, W_s\} = E\{W_tW_s\}=\sigma_0\delta(t-s)\qquad\cdots \star

このとき、パワースペクトルは以下のように計算でき、②を達成しています。

\begin{aligned} S(\omega) &= \int_{-\infty}^{\infty}e^{i\omega\tau}Cov\{W_t,W_{t+\tau}\}d\tau \\ &= \lim_{t \to 0}\int_{-t}^{t}e^{i\omega\tau}\sigma_0\delta(\tau)d\tau\\ &= \sigma_0 \end{aligned}

パワースペクトルが、元の関数に周波数\omegaの波がどれだけ含まれているかを表しているということを思い出すと、(\star)を満たす確率過程はそのパワースペクトルが\omegaに依らない定数\sigma_0であることから、あらゆる周波数の波を同じ量だけ含んでいるということになります。これを光に置き換えると、白色光になります。そうです、白色ノイズと呼ばれる所以はここにあります。

さて、①と②をともに満たす確率過程W_tを見つけることができましたが、δ関数が出てきてしまったので数学的には扱えません。白色雑音W_tはδ関数を要素に含んでしまうので数学的には扱えませんがWiener過程の発想の原点はここにあります。

すごい話

W_tは数学的に扱えない(見本関数が有界変動でも微分可能でもない)存在しない幽霊みたいなものですが、その形式的な時間積分B_tが仮に存在するとしてそれがどんな性質を持つのかを考えてみます。

B_t = \int_{0}^{t}W_{t'}dt'

ちなみに、このB_tが存在すると数学的に扱えないW_tを含む運動方程式を以下のように同値な積分方程式として数学的に扱えるようになるので嬉しいです。

\begin{aligned} &\frac{dV_t}{dt}=-\gamma V_t + W_t\\ \rightarrow&V_t=V_0-\gamma\int_{0}^{t}V_tdt+B_t \end{aligned}



さて、B_tの定義式の右辺について考察してみましょう。W_tは水分子の衝突によるものだったので、その時間積分は大量の水分子の衝突の総和を意味することになります。W_tの個々の形を追うことはできませんが、中心極限定理からそのavogadro数個オーダーの総和はガウス分布に従うことがわかります。なのでもしB_tが存在するならば、それはガウス過程であると考えられます。ガウス過程は平均と共分散からそのすべての挙動が決まるのでB_tの平均と共分散について考えてみます。
※以下の計算では、各tでW_tの平均は0なので期待値と積分を交換できるとおおざっぱに見積もっています。

E[B_t] = E[\int_{0}^{t}W_{t'}dt']=\int_{0}^{t}E[W_{t'}]dt'=0
\begin{aligned} Cov[B_t,B_s]&=E[B_tB_s]\\ &=E[\int_{0}^{t}W_{t'}dt'\int_{0}^{s}W_{s'}ds']\\ &=\int_{0}^{t}\int_{0}^{s}E[W_{t'}W_{s'}]dt'ds'\\ &=\int_{0}^{t}\int_{0}^{s}\sigma_0\delta(t-s)dt'ds'\\ &=\sigma_0\int_{0}^{t}\int_{0}^{s}\delta(t-s)dt'ds'\\ &=\begin{cases} \sigma_0 s& (t>s) \\ \sigma_0 t& (s>t) \end{cases} \end{aligned}

平均と分散が求まったので、ガウス過程B_tの確率的性質はすべて判明しました。
これまでの話をまとめると、存在しないW_tの時間積分B_tが仮に存在するとしたら上記のようなガウス過程になるということです。


さて、今までの話はすべて忘れて次のような性質を満たす確率過程B_tを考えます。
1.B_tはガウス過程
2.E[B_t] = 0
3.

Cov[B_t,B_s] =\begin{cases} \sigma_0 s& (t>s) \\ \sigma_0 t& (s>t) \end{cases}

このような確率過程は数学的に存在しますよね?このB_tを使って積分方程式

V_t=V_0-\gamma\int_{0}^{t}V_tdt+B_t

を考えましょうというのが、(駆動雑音がガウス過程の)確率微分方程式です。
確率微分方程式の書籍に"確率微分方程式は数学的に意味がなく確率積分方程式にしか意味がない"というフレーズがよく現れますが、その真意はこういうことです。


B_tが自動的に満たす性質

B_tは独立増分性をもつことが前節でB_tに課した条件1,2,3から導かれます。つまり、重ならない時間区間の増分は互いに独立になります。
増分を次のようにおきます。

t_1 < t_2 < t_3 < t_4 \\ \Delta B_1 = B_{t_2} - B_{t_1}, \Delta B_2 = B_{t_4} - B_{t_3}

このとき、

E[\Delta B_1] = E[B_{t_2} - B_{t_1}]=E[B_{t_2}]-E[B_{t_1}]=0\\ E[\Delta B_2] = E[B_{t_4} - B_{t_3}]=E[B_{t_4}]-E[B_{t_3}]=0
\begin{aligned} Cov[\Delta B_1,\Delta B_2]&=E[\Delta B_1\Delta B_2]\\ &=E[(B_{t_2} - B_{t_1})(B_{t_4} - B_{t_3})]\\ &=E[B_{t_2}B_{t_4} - B_{t_1}B_{t_4} - B_{t_2}B_{t_3} + B_{t_1}B_{t_3}]\\ &=\sigma_0 t_2-\sigma_0 t_1-\sigma_0 t_2+\sigma_0 t_1\\ &=0 \end{aligned}

このように重ならない時間区間の増分は無相関になります。増分はそれぞれ正規分布に従います。確率変数が正規分布に従う場合、無相関と独立は同値なのでB_tは独立増分性をもつといえます。

Wiener過程

これまで、W_tに①相関時間極小②揺らいでほしい(パワースペクトル非零)という条件を課したうえで、その時間積分B_tが満たすべき性質を見てきました。このB_tこそがWiener過程の素です。Wiener過程はB_tが満たす性質を参考に構成します。開集合の性質を位相空間の定義に落とし込むような感じです。

wiener過程

次の(1)~(4)を満たす確率過程B=\{B_t|t\in T\}をWiener過程という。

  1. B_0=0 (a.s.)
  2. Bは独立増分をもつ
  3. t>sに対し、B_t-B_s \sim \mathcal N(0, t-s)
  4. Bは連続確率過程

    条件3は、前節におけるB_tにおいて\sigma_0=1としたものであることに注意してください。また、定義はしたもののこれら(とくに条件4)をすべて同時に満たす確率過程が存在するかどうかはまだわかりません。この確率過程の存在は、Kolmogorovの連続変形定理を使って示すことができます。

wiener過程の性質(おまけ)

wiener過程の定義から、次の性質が導かれます。

1.E[B_t]=0, Cov[B_t, B_s]=\min(t,s)
2.B\{\mathcal F_t^B\}に関してマルチンゲール
3.[B,B]_t=t
4.Bはほとんどいたるところ有界変動でない

今後追加予定

ガウス分布に従う確率変数が無相関なら独立である理由(おまけ)

Discussion