🌎
統計力学の基礎的な問題の発展

2024/12/16に公開
統計学
 はじめに統計力学の基礎的な問題から関数論などがなぜ考えられるのかまとめてみようと思います。

この基礎的な問題から、機械学習の数理なども考えられるようです。

自分自身勉強中なので、今後内容が修正されたり、追加されることがあると思います。

(間違いなどのご指摘などありましたら、教えていただけると幸いです。)

また、細かい計算は、今後追加していこうと思います。

 統計力学からランダム行列理論、関数論へ
 統計力学の基礎的な問題統計力学では熱力学的極限(Thermodynamic Limit)や流体力学的極限(Hydrodynamic Limit)を考えてミクロとマクロの関係をミクロの立場から考えることがこの学問の一つの大きな仕事です。

そのため、この熱力学極限と流体力学極限の存在、一意性、厳密解にはとても興味があります。

NNN個の粒子のハミルトニアンHN\mathcal{H}_NHN​について、相互作用する系では直感的には以下のようなものがすぐに思いつくと思います。
HN(pj,qk)=∑i=1Npi22m+∑1≤j+k≤NV(pj,qk)
\mathcal{H}_N(\bm{p}_j, \bm{q}_k) = \sum_{i=1}^{N} \dfrac{\bm{p}_i^2}{2m} + \sum_{1 \leq j+k \leq N} V(\bm{p}_j, \bm{q}_k)
HN​(pj​,qk​)=i=1∑N​2mpi2​​+1≤j+k≤N∑​V(pj​,qk​)ここで、p\bm{p}pは運動量であり、q\bm{q}qは一般化座標、VVVはポテンシャルです。

これについてN→∞N \rightarrow \inftyN→∞の極限を考えると、ほとんどの場合、∞\infty∞または−∞-\infty−∞となるので意味のない極限となってしまいます。

また、統計力学でよく登場するGibbs measure(直積測度)を考えても、
e−βHN(p,q)ZN∏j=1Ndpjdqj
\dfrac{e^{-\beta \mathcal{H}_N(\bm{p}, \bm{q})}}{Z_N} \prod_{j = 1}^{N} \mathrm{d}\bm{p}_j\mathrm{d}\bm{q}_j
ZN​e−βHN​(p,q)​j=1∏N​dpj​dqj​となるので、やはり発散してしまって、あまり嬉しくない結果となってしまいます。

 DLR方程式発散を解消するために、Dobrushin Lanford Ruelle方程式 (DLR方程式) を考えます。ここでは、厳密な数学ではなく、流れを意識して書きたいので、この方程式をなぜ考えるのかなどの概要を書こうと思います。(そのうち、詳しい内容について書こうと思います。)
まず、設定は以下のようなことを考えます。
状態空間

領域Λ\LambdaΛ上で、粒子が存在するとします。
ハミルトニアン

系のエネルギー関数をH(σ)\mathcal{H}(\sigma)H(σ)として、σ=(σx)x∈Λ\sigma = (\sigma_x)_{x \in \Lambda}σ=(σx​)x∈Λ​は粒子の大きさや状態を表すパラメーターとします。
確率分布

領域全体 (Λ\LambdaΛ) の状態について定義されるGibbs測度μ\muμは以下のような形式を持ちます。(β\betaβは逆温度と呼ばれます。)
μ(σ)∝exp⁡(−βH(σ))(β=1/kBT)
\mu(\sigma) \propto \exp(-\beta \mathcal{H}(\sigma)) \quad (\beta = 1/k_B T)
μ(σ)∝exp(−βH(σ))(β=1/kB​T)このような設定の下でDLR方程式はGibbs測度μ\muμが局所的に以下のような条件を満たすことを要求します。
任意の部分領域Λ0⊂Λ\Lambda_0 \subset \LambdaΛ0​⊂Λに対して、Λ∖Λ0\Lambda \setminus \Lambda_0Λ∖Λ0​上の状態σΛ∖Λ0\sigma_{\Lambda \setminus \Lambda_0}σΛ∖Λ0​​が固定された時の条件付き分布は、以下の形式になる。
μ(σΛ0∣σΛ∖Λ0)∝exp⁡(−βHΛ0(σΛ0∣σΛ∖Λ0))
\mu(\sigma_{\Lambda_0}|_{\sigma \Lambda \setminus \Lambda_0}) \propto \exp \left(-\beta \mathcal{H}_{\Lambda_0}(\sigma_{\Lambda_0}|_{\sigma \Lambda \setminus \Lambda_0}) \right)
μ(σΛ0​​∣σΛ∖Λ0​​)∝exp(−βHΛ0​​(σΛ0​​∣σΛ∖Λ0​​))ここで、HΛ0\mathcal{H}_{\Lambda_0}HΛ0​​は領域Λ0\Lambda_0Λ0​に制限された局所ハミルトニアンを指す。
この条件付き確率分布がいかなる領域においても安定している場合、言い換えると任意の領域で定数である場合、先ほど考えたかった熱力学極限(流体力学極限)が発散せずに意味のある計算になるということです。
このように書かれると少し難しく感じますが、以下のようなことを考えるとイメージしやすいかもしれません。

上のような円盤Λ\LambdaΛの上に粒子が分布している状況を考えます。

内側の円盤上Λ0\Lambda_0Λ0​で粒子が分布しており、内側の円盤以外の部分Λ∖Λ0\Lambda \setminus \Lambda_0Λ∖Λ0​は、固定されている、つまり、熱浴となっています。この時の内側の粒子の分布がこの領域の取り方に寄らないとき、N→∞N \rightarrow \inftyN→∞の極限を考えることができるということです。

 DLS方程式の適用範囲とSwell class potential上で紹介したDLR方程式はうまく無限大の問題を回避していますが、すべての状況でwell-difinedなわけではなく、ポテンシャルVVVがSwell class potentialである場合のみです。

Swell class potentialは以下のような性質を持つポテンシャル関数V(r)V(r)V(r)です。
短距離性(short-range interaction)
V(r)→0asr→∞
    V(r) \rightarrow 0 \quad \text{as} \quad r \rightarrow \infty
    V(r)→0asr→∞ポテンシャルV(r)V(r)V(r)は粒子間の距離rrrが大きくなると急速にゼロに収束します。つまり、相互作用は粒子が接近している場合にのみ顕著に現れるようになります。関数形としては、V(r)∝e−αrV(r) \propto e^{-\alpha r}V(r)∝e−αrであったり、V(r)∝r−nV(r) \propto r^{-n}V(r)∝r−nのような形になります。
有界性(Bounded below)と安定性(Stability)
V(r)≥−C,C>0
    V(r) \geq -C, \quad C>0 
    V(r)≥−C,C>0ポテンシャル関数は、系が物理的に意味を持つように、下に有界である必要があります。

また、系全体のエネルギーを考えた時に負の無限大に発散しないように以下の条件も必要です。
∑1≤i≤j≤NV(∣xi−xj∣)≥−CN
    \sum_{1 \leq i \leq j \leq N} V(|x_i - x_j|) \geq -CN
    1≤i≤j≤N∑​V(∣xi​−xj​∣)≥−CN
適切なエネルギー収束性と可積分性
∫Rd∣V(r)∣dr<∞
    \int_{\mathbb{R}^d} |V(r)| \mathrm{d}r < \infty
    ∫Rd​∣V(r)∣dr<∞熱力学極限や流体力学極限が有限に収束するために、ポテンシャルの強さが制限されています。
このようなSwell class potentialの例としてLennard-Jones potentialなどが挙げられます。
短距離相互作用ではなく、長距離作用を考えるにはどうしたら良いでしょうか？ここで、登場するのが、ランダム行列理論です。

 長距離相互作用する有限の粒子系長距離相互作用する無限粒子系を考えるために、新しい理論が必要でした。

ここでは、ランダム行列の理論と、なぜこれで長距離相互作用する無限粒子系を考えることができるのか紹介したいと思います。

分布(密度関数)とポテンシャルの関係は、ボルツマン分布に従う場合、
p∝e−βV(r)
p \propto e^{-\beta V(r)}
p∝e−βV(r)となるので、この形でかつ、ポテンシャルの形が、
V(r)∝log⁡r
\begin{align}
    V(r) \propto \log r
\end{align}
V(r)∝logr​​となる場合を目指してみようと思います。

 準備:エルミート行列今回は、エルミートなランダム行列について考えていきます。(非エルミート行列については勉強中です。)

エルミート行列H=(Hjk)1≤j,k≤NH = (H_{jk})_{1 \leq j,k \leq N}H=(Hjk​)1≤j,k≤N​は以下のような性質を持つ行列です。
H=H†
H = H^{\dagger}
H=H†各成分について考えると、以下のようなことがわかります。
{Hjj=HjjR∈RHjk=HjkR+iHjkI∈CHkj=HjkR−iHjkI∈C
\begin{align}
    \begin{cases}
        H_{jj} = H_{jj}^{\mathrm{R}} \in \mathbb{R}\\
        H_{jk} = H_{jk}^{\mathrm{R}} + iH_{jk}^{\mathrm{I}} \in \mathbb{C}\\
        H_{kj} = H_{jk}^{\mathrm{R}} - iH_{jk}^{\mathrm{I}} \in \mathbb{C} 
    \end{cases}
\end{align}
⎩⎨⎧​Hjj​=HjjR​∈RHjk​=HjkR​+iHjkI​∈CHkj​=HjkR​−iHjkI​∈C​​​ここで、†^{\dagger}†は随伴を取るという記号です。ここで、少し天下りではありますが、このエルミート行列HHHの2乗のトレースtrH2\mathrm{tr}H^2trH2について考えていきます。
trH2=∑j=1N(H2)jj=∑j=1N(∑k=1NHjkHkj)
\begin{align*}
\mathrm{tr}H^2 &= \sum_{j = 1}^{N} (H^2)_{jj}\\
               &= \sum_{j = 1}^{N}\left( \sum_{k = 1}^{N} H_{jk} H_{kj} \right) 
\end{align*}
trH2​=j=1∑N​(H2)jj​=j=1∑N​(k=1∑N​Hjk​Hkj​)​ここで,

(2)式の結果を代入して、
(RHS)=∑j=1N(HjjR)2+2∑j<k{(HjkR)2+(HjkI)2}
  (\text{RHS}) = \sum_{j = 1}^{N} (H_{jj}^{\mathrm{R}})^2 
    + 2\sum_{j<k} \left\{ (H_{jk}^{\mathrm{R}})^2 + (H_{jk}^{\mathrm{I}})^2 \right\} 
(RHS)=j=1∑N​(HjjR​)2+2j<k∑​{(HjkR​)2+(HjkI​)2}ここで、以下のような変形を考えます。
HjjR=XjjHjkR=12XjkRHjkI=12XjkI
\begin{align*}
H_{jj}^{\mathrm{R}} = X_{jj} \\
H_{jk}^{\mathrm{R}} = \frac{1}{\sqrt{2}} X_{jk}^{\mathrm{R}}\\
H_{jk}^{\mathrm{I}} = \frac{1}{\sqrt{2}} X_{jk}^{\mathrm{I}}
\end{align*} 
HjjR​=Xjj​HjkR​=2​1​XjkR​HjkI​=2​1​XjkI​​これより、
trH2=∑j=1N(XjjR)2+∑j<k(XjkR)2+∑j<k(XjkI)2
\begin{align}
\mathrm{tr}H^2 = \sum_{j = 1}^{N} (X_{jj}^{\mathrm{R}})^2 
    + \sum_{j<k} (X_{jk}^{\mathrm{R}})^2 + \sum_{j<k} (X_{jk}^{\mathrm{I}})^2 
\end{align}
trH2=j=1∑N​(XjjR​)2+j<k∑​(XjkR​)2+j<k∑​(XjkI​)2​​となります。
(3)式を見てみると、これはn2n^2n2次元のユークリッド距離の2乗に等しいことがわかります。つまり、N2N^2N2次元のベクトル
X=(X11,⋯ ,XNN,X12R,⋯ ,XN−1 NR,X12I,⋯ ,XN−1 NI)∈RN2
\bm{X} = (X_{11}, \cdots , X_{NN}, X_{12}^{\mathrm{R}}, \cdots , X_{N-1 \, N}^{\mathrm{R}},  X_{12}^{\mathrm{I}}, \cdots , X_{N-1\, N}^{\mathrm{I}}) \in \mathbb{R}^{N^2}
X=(X11​,⋯,XNN​,X12R​,⋯,XN−1NR​,X12I​,⋯,XN−1NI​)∈RN2を考えれば、X\bm{X}Xと原点との距離がtrH2\mathrm{tr}H^2trH2となるということです。

この考察から、
{Hjk}≃{H}
\left\{ H_{jk} \right\} \simeq \left\{ \bm{H} \right\}
{Hjk​}≃{H}であり、行列の成分の振る舞いが幾何的な問題として考えられることがわかりました。

 エルミートなランダム行列と有限な粒子系
 粒子の位置の同時密度関数ここから、上で紹介したエルミート行列を用いて、N2N^2N2個の粒子の分布について考えていこうと思います。

一旦、今どんな行列を考えているのか見てみましょう。
H=(X1112(X12R+iX12I)⋯12(X1NR+iX1NI)12(X21R+iX21I)X22⋯12(X2NR+iX2NI)⋮⋮⋱⋮12(XN1R−iXN1I)12(X2NR−iX2NI)⋯XNN)
H = 
\begin{pmatrix}
   X_{11} & \dfrac{1}{\sqrt{2}}\left(X_{12}^\mathrm{R} + i X_{12}^\mathrm{I}\right) & \cdots & \dfrac{1}{\sqrt{2}}\left(X_{1N}^\mathrm{R} + i X_{1N}^\mathrm{I}\right)\\
   \dfrac{1}{\sqrt{2}}\left(X_{21}^\mathrm{R} + i X_{21}^\mathrm{I}\right) & X_{22} & \cdots & \dfrac{1}{\sqrt{2}}\left(X_{2N}^\mathrm{R} + i X_{2N}^\mathrm{I}\right)\\
   \vdots & \vdots & \ddots & \vdots\\
   \dfrac{1}{\sqrt{2}}\left(X_{N1}^\mathrm{R} - i X_{N1}^\mathrm{I}\right)  & \dfrac{1}{\sqrt{2}}\left(X_{2N}^\mathrm{R} - i X_{2N}^\mathrm{I}\right) & \cdots & X_{NN}
\end{pmatrix}
H=​X11​2​1​(X21R​+iX21I​)⋮2​1​(XN1R​−iXN1I​)​2​1​(X12R​+iX12I​)X22​⋮2​1​(X2NR​−iX2NI​)​⋯⋯⋱⋯​2​1​(X1NR​+iX1NI​)2​1​(X2NR​+iX2NI​)⋮XNN​​​この行列の各成分が粒子の位置に対応します。そして、Xjk#∼i.i.dN(0,σ2)X_{jk}^{\#} \overset{i.i.d}{\sim} \mathcal{N(0, \sigma^2)}Xjk#​∼i.i.dN(0,σ2)であるとします。このように行列の成分が確率変数となるのが、ランダム行列と呼ばれる理由です。
ここでは行列の各成分が正規分布に従うことを考えましたが、従う分布をブラウン運動にしたのが、Dyson modelです。
密度関数は、以下のように表されます。
fXjk#(xjk#)=12πσ2e−(xjk#)22σ2
f_{X_{jk}^{\#}}(x_{jk}^{\#}) = \frac{1}{\sqrt{2\pi\sigma^2}}e^{-\frac{(x_{jk}^{\#})^2}{2\sigma^2}} 
fXjk#​​(xjk#​)=2πσ2​1​e−2σ2(xjk#​)2​今、全体の様子を考えたいので、
X=(X11,⋯ ,XNN,X12R,⋯ ,XN−1 NR,X12I,⋯ ,XN−1 NI)
\bm{X} = (X_{11}, \cdots , X_{NN}, X_{12}^{\mathrm{R}}, \cdots , X_{N-1 \, N}^{\mathrm{R}},  X_{12}^{\mathrm{I}}, \cdots , X_{N-1\, N}^{\mathrm{I}}) 
X=(X11​,⋯,XNN​,X12R​,⋯,XN−1NR​,X12I​,⋯,XN−1NI​)に対して、同時密度関数fX(x)f_{\bm{X}}(\bm{x})fX​(x)を考えると、
fX(x)dx∝e−2∑j=1N(xjjR)2+∑j<k(xjkR)2+∑j<k(xjkI)2∏j=1Ndxjj∏j<kdxjkR∏j<kdxjkI
f_{\bm{X}}(\bm{x})\mathrm{d}\bm{x} \propto e^{-2  \sum_{j = 1}^{N} (x_{jj}^{\mathrm{R}})^2 
    + \sum_{j<k} (x_{jk}^{\mathrm{R}})^2 + \sum_{j<k} (x_{jk}^{\mathrm{I}})^2 } \prod_{j = 1}^{N}\mathrm{d}x_{jj}\prod_{j<k}\mathrm{d}x_{jk}^\mathrm{R}\prod_{j<k}\mathrm{d}x_{jk}^\mathrm{I}
fX​(x)dx∝e−2∑j=1N​(xjjR​)2+∑j<k​(xjkR​)2+∑j<k​(xjkI​)2j=1∏N​dxjj​j<k∏​dxjkR​j<k∏​dxjkI​式(2)と微小量の部分をまとめてdx‾\mathrm{d}\underline{x}dx​と書くことにして、
fX(x)∝e−2trH2dx‾
\begin{align}
    f_{\bm{X}}(\bm{x}) \propto e^{-2\mathrm{tr}H^2} \mathrm{d}\underline{x}
\end{align}
fX​(x)∝e−2trH2dx​​​となります。ここで、指数の方の係数2はのちに都合がいいのでつけているので、今のところで特に意味はありません。

 ユニタリ行列による変数変換さらに計算を進めるために、trH2\mathrm{tr}H^2trH2の部分に着目していきます。

エルミート行列はユニタリ行列UUUを用いて対角化できるため、以下のように書くことができます。
U†HU=Λ=diag(λ1,λ2,⋯ ,λN)
U^{\dagger}HU = \Lambda = \mathrm{diag}(\lambda_1, \lambda_2, \cdots, \lambda_N)\\ 
U†HU=Λ=diag(λ1​,λ2​,⋯,λN​)逆に対角行列Λ\LambdaΛは以下のように書けます。
H=UΛU†
H = U\Lambda U^{\dagger}
H=UΛU†また、ユニタリ行列は逆行列と随伴行列が一致します。
UU†=U†U=I
UU^{\dagger} = U^{\dagger}U = I
UU†=U†U=Iこれより、trH2\mathrm{tr}H^2trH2は以下のように計算ができます。
trH2=tr UU†H2=tr U†H2U(∵trAB=trBA)=tr U†HUU†HU=trΛ2=∑j=1Nλj2
\begin{align}
\mathrm{tr}H^2 &= \mathrm{tr} \, UU^{\dagger}H^2 \notag \\
               &= \mathrm{tr} \, U^{\dagger}H^2U \quad (\because \mathrm{tr}AB = \mathrm{tr}BA) \notag \\
               &= \mathrm{tr} \, U^{\dagger}HUU^{\dagger}HU \notag \\
               &= \mathrm{tr} \Lambda^2 \notag \\
               &= \sum_{j=1}^{N}\lambda_j^2
\end{align}
trH2​=trUU†H2=trU†H2U(∵trAB=trBA)=trU†HUU†HU=trΛ2=j=1∑N​λj2​​​これより、式(4)の指数の肩の部分については計算が出来ました。

 粒子の分布から固有値の分布へ変数変換をしたため、dx‾\mathrm{d}\underline{x}dx​も変換が必要です。ここから、ヤコビアンJJJについて考えていきます。

計算の途中過程は今後追加する予定です。
dx‾=∣∂x‾∂(λ,U)∣dλdU
\mathrm{d}\underline{x} = \left| \frac{\partial \underline{x}}{\partial(\lambda, U)} \right| \mathrm{d}\lambda\mathrm{d}U
dx​=​∂(λ,U)∂x​​​dλdUこのdλdU\mathrm{d}\lambda\mathrm{d}UdλdUの前についているものがヤコビアンです。ヤコビアンは以下のように計算されます。
J=∣∂x‾∂(λ,U)∣=∏j<k(λk−λj)2g(U)
\begin{align}
    J = \left| \frac{\partial \underline{x}}{\partial(\lambda, U)} \right| = \prod_{j<k}(\lambda_k - \lambda_j)^2 g(U)
\end{align}
J=​∂(λ,U)∂x​​​=j<k∏​(λk​−λj​)2g(U)​​これより、式(4)は式(5),(6)から以下のように書き直すことができます。
fX(x)dx∝e−2∑j=1Nλj2∏j<k(λk−λj)2g(U)dλdU
\begin{align}
    f_{\bm{X}}(\bm{x}) \mathrm{d}\bm{x}\propto e^{-2\sum_{j=1}^{N}\lambda_j^2} \prod_{j<k}(\lambda_k - \lambda_j)^2 g(U)\mathrm{d}\lambda\mathrm{d}U
\end{align}
fX​(x)dx∝e−2∑j=1N​λj2​j<k∏​(λk​−λj​)2g(U)dλdU​​UUUの成分については積分すると定数になるので、規格化定数をZZZとして、式(7)は以下の形式になります。
p(N)(λ‾)=∫fX(x)dU=1Z′e−2∑j=1Nλj2∏j<k(λk−λj)2∫g(U)dU=1Ze−2∑j=1Nλj2∏j<k(λk−λj)2=1Ze−2∑j=1Nλj2e2∑j<klog⁡(λk−λj)
\begin{align*}
    p^{(N)}(\underline{\lambda}) &= \int f_{\bm{X}}(\bm{x})\mathrm{d}U\\
    &= \frac{1}{Z'}e^{-2\sum_{j=1}^{N}\lambda_j^2} \prod_{j<k}(\lambda_k - \lambda_j)^2 \int g(U) \mathrm{d}U\\
    &= \frac{1}{Z}e^{-2\sum_{j=1}^{N}\lambda_j^2} \prod_{j<k}(\lambda_k - \lambda_j)^2\\
    &= \frac{1}{Z}e^{-2\sum_{j=1}^{N}\lambda_j^2} e^{2\sum_{j<k}\log (\lambda_k- \lambda_j)}
\end{align*}
p(N)(λ​)​=∫fX​(x)dU=Z′1​e−2∑j=1N​λj2​j<k∏​(λk​−λj​)2∫g(U)dU=Z1​e−2∑j=1N​λj2​j<k∏​(λk​−λj​)2=Z1​e−2∑j=1N​λj2​e2∑j<k​log(λk​−λj​)​これより、
p(N)(λ‾)=1Ze−βH(λ‾)
p^{(N)}(\underline{\lambda}) = \frac{1}{Z} e^{-\beta \mathcal{H}(\underline{\lambda})}
p(N)(λ​)=Z1​e−βH(λ​)ただし、
β=2, H(λ‾)=∑j=1Nλj2−∑j<kNlog⁡(λj−λk)
\beta= 2 , \, \mathcal{H}(\underline{\lambda}) = \sum_{j = 1}^{N} \lambda_j^2 - \sum_{j < k}^{N}\log (\lambda_j - \lambda_k) 
β=2,H(λ​)=j=1∑N​λj2​−j<k∑N​log(λj​−λk​)より、変数変換によって粒子の分布から固有値の分布に変化しましたが、求めたかった式(1)の形のモデルを作ることに成功しました。

いよいよここからが本番です。無限粒子系にするために、N→∞N \rightarrow \inftyN→∞の極限を考えます。

 無限粒子系へここからは、現在執筆中です。年内には完成させようと思います。

 参考文献ランダム行列の数理, 木村太郎, 森北出版株式会社, 2021.05
Discussion

ログインするとコメントできます