拡散モデルの発想の一端になったJarzynski等式は2つの平衡状態間の自由エネルギーの差ΔFeqその間の遷移させる仕事Wの経路に関する平均の間の等式
<exp(−βW)>=exp(−ΔFeq)
として書かれます。
この式のゆらぎのある力学系の従うLangevin式からの導出、局所詳細釣り合いとの関係、さらに拡散モデルとの関係について書きます。
「非平衡統計力学 ゆらぎの熱力学から情報熱力学まで」の主に3章とのAppendix Bに書かれている内容です。拡散モデルとの関係以外はほとんどそのままの内容になってしまいました。
https://www.kyoritsu-pub.co.jp/book/b10012378.html
https://prompton.io/works/DkvFVrLFN5rqEDndSLKgo
ゆらぎのある粒子系
overdumped Langevin方程式
γxt˙=F(x,t)+gξt
(g=2γkBT,<ξt,ξt′>=δ(t−t′))
に従って動く微粒子を考える。
ただし時間を間隔Δtで離散的に取った場合
ΔW=ξΔt
は平均0,分散Δtの正規分布
P(xt+Δt∣xt)=2πΔt1exp(−2ΔΔW2)
に従うとする
そのxtからxt+Δtへの遷移確率は離散化したLangevin方程式から
P(xt+Δt∣xt)∝exp(−4kBTΔtγ(xt+Δt−xt−γFtΔt)2)
(積分系で P(xt∣x0)∝exp(−4kBTγ∫0tdtdxt−γF(xt,t))2dt)
と書かれる。
https://prompton.io/works/1QRdVjuHV3u_Ociw0O4FR
伊藤形式とFocker-Plank方程式
ウィーナー過程Wtに対する伊藤形式の微分の公式
(dWt)2=dt
を用いると物理量A(x,t)に対して
dA=∂t∂Adt+∂x∂Adx+1/2∂x2∂2Adx2
=∂t∂Adt+∂x∂A(γFdt+γ2kTdW)+1/2∂x∂A2γ2kTdt
=(∂t∂A+γF∂x∂A+∂x∂A2γkT)dt+γ2kT∂x∂AdW
その平均値はdWが消えるため
dtd<A>=<∂t∂A+γF∂x∂A+γkT∂x∂A2)>
と書ける。
これからoverdumped Langevin方程式に対する系の確率分布関数P(x,t)に対応するFocker-Plank方程式は
∂t∂P=(−∂x∂γF+γkT∂x∂2)P(x,t)
とかける。ここで確率の流れ
J(x,t):=γFP(x,t)−γkT∂x∂P(x,t)
を定義し、流れの式
∂t∂P=−∂x∂J(x,t)
の形にする。また
v(x,t):=J/P=F/γ−γkT∂xP
と定義する。
ポテンシャル関数V(x)で力が書かれる場合F=dxdV(x)を考えると平衡状態の確率分布は平衡自由エネルギーFeq:=−β1log∫dxe−βV(x)を使って
P(x)=exp(Feq−V(x))
とかける。
ストラトノビッチ形式
ここで微小な時間における系内外の熱や仕事のやり取りを記述するためにストラトノビッチ形式の微分
dA(xt)∘dW:=limΔt−>02A(xt+Δt+A(xt))ΔW
(A(x)は物理量)を導入する。これによってoverdumped Langevin系は
dA(xt)∘dx=(γFA+γkT∂x∂A)dt+γ2kTAdW
となることからその分布平均は
<dA(xt)∘dx>=∫dxJA
と書くことができる。
非平衡な状況での熱、仕事の定義
ポテンシャルV(x)を動かして行った時のエネルギーE(t)の時間変化は
dE/dt=∫∂t∂PE+∫P∂t∂E
となるがここから非平衡な状態での熱,仕事の変化を
Q˙:=−∫dxJ(x,t)F(=−∫dx∂x∂JV=−∫dx∂x∂JE=∫dx∂t∂PE(t))
W˙:=∫dxP(x,t)∂t∂V+∫dxJf
と定義することができる。
一方シャノンエントロピーのS(t)の時間変化は
dtdS=−∫dx∂t∂PlogP=−∫dxJP∂x∂P=∫dxJ(γβJ/P−βF)
となることからエントロピー全体の変化は
σ˙:=dtdS−βQ˙=γβ∫dxPJ2=γβ∫dxPv2>=0
となり熱力学第2法則が再現される。(非平衡な系ではσ˙=σex˙+σhk˙(過剰エントロピー生成+維持エントロピー生成)と分解される。)
局所詳細釣り合い、ゆらぎの定理、Jarzynski等式の導出
確率的な熱の変化Q^˙dtはストラトノビッチ形式のところで示した式
<∂x∂V∘dx/dt>=∫dxJ∂x∂V=Q
から
Q^˙dt=∂V∂x∘dx/dt
外力fがある場合にも一般化すると
Q^˙dt=∂V∂x∘dx/dt+fdx
とかける。一方で系に対するV、外力fによる操作を介した仕事は
W^˙dt:=∂V∂tdt+fdx
と書かれる。これらから
経路レベルでの熱力学第一法則が
dtdV=Q^˙+W^˙
と書かれる。
xn→xn+1の遷移とその逆の遷移xn+1→xnの遷移確率
P(xn∣xn+1)∝exp(4Δtβγ(xn+1−xn−γFnΔt)2)
P(xn+1∣xn)∝exp(4Δtβγ(xn−xn−1−γFnΔt)2)
の比を取った形
P(xn+1∣xn)P(xn∣xn+1)=−e−(Fn+1−Fn)2xn+1−xn→e−F(xn)∘dxn=eβQ^n(xn+1,xn)
をxの変化する経路に対して積分したものとして局所詳細釣り合いは
P[xt∣x0,λt]P[xt†∣x0,λt†]=eβQ[xt,λt]
と書かれる。ただし[]は経路に関する引数の意味でλtは制御パラメーター、xt†,λt†はxt,λtの逆向きの操作を表す。MCMCで分布が定常に収束する条件としてでてくる詳細釣り合いを非平衡の場合に一般化した形と言える。
詳細ゆらぎの定理
まず確率的なシャノンエントロピーs^(x,t):=−logP(x,t)を定義する。経路に対するアンサンブル平均は<s^(x,t)>=−∑xlogP(x,t)と普通のシャノンエントロピーになるので妥当な定義である。
順過程x0 →xtとその逆過程xt →x0の終状態での確率が始状態での確率各々P(x0,0),PB(x0†,0)を用いて
P[xt∣λt]=P[xt∣x0,λt]P(x0,0)
P[xt†∣λt†]=P[xt†∣x0†,λt†]PB(x0,0)
と書かれること、
また時刻0の始状態から時刻tの終状態のエントロピー生成を
σ^[xt,λt]:=s^(xt,t)−s^(x0,0)−βQ(xt,λt)
と定義するとすると
P[xt∣λt]P[xt†∣λt†]=e−σ^[xt,λt]
となりこれを詳細ゆらぎの定理と呼ぶ
また
P(σ^=a):=∫DxtP[xt∣λt]δ(σ^(xt,λt)−a)
PB(σ^=a):=∫Dxt†P[xt†∣λt†]δ(σ^(xt†,λt†)−a)
に対しては
P(σ^=−a)P(σ^=a)=ea
となりCrooksのゆらぎの定理とよばれる。さらに
∫daP(σ^=a)e−a=∫daPB(σ^=−a)
を積分した
<e−σ^>=1
は積分型ゆらぎの定理と呼ばれる
Jarzynski等式
順過程、逆過程の始点の分布がカノニカルであるすなわち、その分布が
P(xt,t)=eβ(Feq(λ)−Ex(λ)
PB(xt†,t)=eβ(Feq(λ)−Ex(λ)
とするとこのエントロピー生成は
σ^w[xt,λt]:=−logP(x0†,0)+logP(x0,0)−βQ^[xt,λt]=β(W^[xt,λt]−ΔFeq)
ΔFeq:=Feq(λt)−Feq(λ0)
となり、積分型ゆらぎの定理<e−σ^>=1から
上記のように始状態はカノニカル分布としたが終状態もカノニカルであるとすればσ^w=σ^となり詳細ゆらぎの定理は
P[xt∣λt]P[xt†∣λt†]=e−σw^[xt,λt]
積分型ゆらぎの定理は
<e−βW^>=exp(−ΔFeq)
となりこれがJarzynski等式である。
拡散モデルとの関係
Jarzynski等式は拡散モデルのアルゴリズムのアイデアの出発点ではあるが出発点と終点がカノニカル分布であれば成立する。
拡散過程で徐々に温度を上げていき高温で簡単な計算可能な形の分布関数で表すというのがAnealed Importance Sampling(AIS)のアイデアである。 仕事Wに相当するtransition kernelも正
規分布となり、とともに目的関数が解析的に計算できるのも利点となる。
Jarzynski等式が等式であることからも拡散過程、逆拡散過程は可逆であり拡散過程で増えたエントロピーは逆拡散過程ではscore関数が影響することによって減少する。ただし変分近似による誤差の分すなわちKLダイバージェンスの分だけ余計なエントロピーが残り性能限界に対応する。
https://booth.pm/ja/items/4757397
展望?
非平衡定常状態での不確定性関係、速度限界などについて拡散モデルで対応することが何か言えるかも知れない。
ためになるリンク
https://rikunora.hatenablog.com/entry/20101201
https://segfault11.hatenablog.jp/entry/2019/12/02/000000
https://repository.kulib.kyoto-u.ac.jp/dspace/bitstream/2433/189515/1/bussei_el_033204.pdf
というのも、非平衡統計力学はこの 15 年ほどで面目を一新したからであり、その意味で以前の教科書は「古典的」になって いると考えられるからである。
「非平衡統計力学 ゆらぎの熱力学から情報熱力学まで」では局所詳細釣り合い、ゆらぎの定理から平衡状態から少しだけ離れた系の物理量の関係(線形応答理論)を導出しています。
Fluctuation Theoremによる生体モーターの駆動力測定
https://www.jstage.jst.go.jp/article/biophys/51/4/51_4_188/_pdf
Nonequilibrium Physics : 非平衡科学
http://sosuke110.com/noneq-phys.pdf
熱力学的系におけるスピードの原理限界
http://ithems-stamp-wg.riken.jp/workshop/noneq-workshop-2018/slides/Noneq2018-Shiraishi.pdf
速度限界に関しては生物進化に適応した研究
https://journals.aps.org/prresearch/abstract/10.1103/PhysRevResearch.5.023127
https://twitter.com/ito_sosuke/status/1662219132446838785?s=20
もある。
微小系における熱力学
確率熱力学について
https://www.gavo.t.u-tokyo.ac.jp/~mine/japanese/IT/2017/hasegawa2.pdf
熱力学的不確定性関係と統計学のCramers-Raoの関係式の関係については
数理科学2020年11月号 情報幾何学の探求
https://www.saiensu.co.jp/search/?isbn=4910054691108&y=2020
でも簡単に触れられている。
https://xiangze.hatenablog.com/entry/2022/11/14/010440
Discussion