スターリング近似を用いた多項係数評価

このアカウントは事あるごとに多項係数を評価しようとしている:

過去の記事では

ただ我に返ると:
であっても、
-
条件下での、スターリング近似を用いた多項係数の評価k_i \ge 1 -
を含む場合の処理k_i = 0 - (発展)連続分布への対応
である。

1. について
散々やり尽くした計算なので結果だけ書きたい。
ここで、
さて、
とおけば、

- 第1項(エントロピー)は正
- 第2項は負
- Q1項は正
- Q2項は負

確率分布の偏差に対する法線ベクトル
に対するエントロピーの方向微分は、
さらにこの方向微分は、
であるから、
である。

補足)
確率分布の偏差、

余談)
確率の制約から、確率分布
このように

小括
よって、
となり、多項係数の対数値はエントロピーの関数であることが分かった。

2について
今後のため、多項係数ではなく多項分布で考える。多項分布は
である。結論からいうと、0となるkを式から除いても結果は変わらない。
なる集合を考えると、先の式は:
であり、定義より
。よって:
である。
以上の結果から、当該の問題を考える際は、対象となる確率分布のうち、実現回数が非ゼロの項目だけに絞って計算してよい。

補足)
ただし、当然ながら:
であり、より単純な別の同型な確率問題に読み替えられるわけではないことに注意する。ただし、
のときは、

3.について
今後の宿題とする。一方で、上記の小括の式がそのまま成り立つような気もする。

-1. 補遺: 多項分布
せっかくなので多項分布についても求めておこう。多項係数は上述の通りであるから、確率部分だけ計算する。これはこの記事で論じる必要のないぐらい単純な計算で:
である。ここで
よって、全体として:

-2. 方向微分項の範囲評価
下記によれば、多項分布の対数値はKL情報量+
要するに、
- qが一様分布(エントロピー最大)のときに最小/最大
- qが最も急峻(エントロピー最小)のときに最大/最小
であることが簡単な計算を通じて分かる(割愛)。

最小値は、
最大値は、


最大値は、qが一様分布のときで
最小値は、qが最も急峻なときで


上記以上の確実なバウンドを思いつかないので、少々大げさにはなるが、以上の結果を使って範囲を評価する。すなわち、

下限は:

上限は:
