Open6

スターリング近似を用いた多項係数評価(その3)

pokapoka-jigokupokapoka-jigoku

https://zenn.dev/pokapoka_jigoku/scraps/79838b3ef21738

\begin{split} \ln W &= - N\sum_i^r q_i \ln q_i - \frac{r_p - 1}{2} \ln 2\pi N + \frac{1}{2} Q_1 + \frac{1}{12N} Q_2 - \frac{r_0}{2} \ln {2 \pi e^{- \frac{11}{6} }} \end{split}

F[q] = \frac{1}{2} Q_1 + \frac{1}{12N} Q_2

を評価しようというスクラップになります。ここで、

Q_1 = - \sum_{i\in \Lambda} \ln q_i
Q_2 = 1-\sum_{i\in \Lambda} \frac{1}{q_i}
\Lambda = \{i~|~k_i \ge 1\}

です。Q_1, Q_2の総和は、正値のk_iに対して取ります。

pokapoka-jigokupokapoka-jigoku

\sum_i q_i = 1 という制約条件があるので、ラグランジュ未定乗数法を使って

U(q_i) = F[q] + \lambda ( \sum_i q_i -1)

の一階導関数のゼロ点を求めようという話になる。q_i同士の交差項はないので、結局:

q_i = \frac{1}{r}

、つまり、(正値項において)一様分布が最小値となる。よって、

\min F[q] = \frac{r \ln r}{2} + \frac{1 - r^2}{12N}
pokapoka-jigokupokapoka-jigoku

(補足)「本当に最小値か?」

仰る通り、ラグランジュ未定乗数法では極値がわかるだけでそれが極大か極小かは分からない。

一様分布の点をq^o=\frac{1}{r}とおいて、その周囲の1階および2階の方向微分を見てみよう。

方向ベクトルを h = (h_i)_i とする。ただし、\sum_i h_i = 0 である。

まず、1階の方向微分は:

\nabla_h F = \nabla F \cdot h =\left( -\frac{1}{2q_i} + \frac{1}{12Nq_i^2} \right)_i \cdot h = \sum_i \left( -\frac{1}{2q_i} + \frac{1}{12Nq_i^2} \right) h_i

q^o = \frac{1}{r}では、各h_iの係数が等しくなるので、:

\nabla_h F[q^o] = a \sum_i h_i = 0

であり、確かに任意の方向微分がゼロになっている。

2階の方向微分は:

\nabla_h^2 F = \nabla_h (\nabla_h F) = \left( \left[ \frac{1}{2q_i^2} - \frac{1}{6Nq_i^3} \right] h_i \right)_i \cdot h = \sum_i \left( \frac{1}{2q_i^2} - \frac{1}{6Nq_i^3} \right) h_i^2

であるので、q=q^o=\frac{1}{r} では:

\nabla_h^2 F[q^o] = \sum_i \left( \frac{r^2}{2} - \frac{r^3}{6N} \right) h_i^2 = \sum_i \left( 1 - \frac{r}{3N} \right) \frac{r^2 h_i^2}{2} = \frac{r^2}{2} \left( 1 - \frac{r}{3N} \right) \sum_i h_i^2 >0

となるため、一様分布点から任意の方向に対して2階の方向微分は正値となるため、確かにこの点は極小値である。(以上の議論でも最小値であることは示せていないが、許してください)。

pokapoka-jigokupokapoka-jigoku

最大値は極値ではなさそうなので、極小値を中心として外側に向いて1階微分を調べる。特定のインデックスi=sについて:

\begin{split} q_s &= \frac{1}{r} + s \\ q_j &= \frac{1}{r} - \frac{s}{r-1}~~(j \ne s) \end{split}

とし、方向ベクトルの成分が

\begin{split} h_s &= 1 \\ h_j &= -\frac{1}{r-1} \end{split}

であるような h に対する方向微分を考えると:

\nabla_h F = \left( - \frac{1}{2q_s} + \frac{1}{12Nq_s^2} \right) - \left( - \frac{1}{2q_j} + \frac{1}{12Nq_j^2} \right)

詳細は補足に書くとして、各項は正値を取る必要があることを考えると

\frac{1}{N} \le q_i \le \frac{N-(r-1)}{N} = 1 - \frac{r-1}{N}

であり、この範囲内において、上記の方向微分は常に正であることから、最大値は

\begin{split} q_i &= 1 - \frac{r-1}{N}~~(i = s) \\ &= \frac{1}{N}~~(i\ne s) \end{split}

のときで、

\max F[q] = -\frac{1}{2} \left( \ln\frac{N-(r-1)}{N} - (r-1) \ln N \right) + \frac{1}{12N} \left( 1 - \frac{N}{N- (r-1)} - (r-1) N \right)
pokapoka-jigokupokapoka-jigoku

N \gg 1 のとき、

\min F[q] \le \frac{r \ln r}{2}
\max F[q] \ge \frac{1}{2} \left( (r-1) \ln N + \frac{r-1}{N} \right) - \frac{r-1}{12N} \left( N + \frac{1}{N} \right) \ge \frac{r-1}{2} \left( \ln N - \frac{1}{6} \right)