🤖

【選考チューニング】あるプロンプトをLLMに与えたときに、ある出力が得られる確率を求める

2025/03/22に公開

選考チューニングのDPOを勉強していて、理論は理解できたのですが、どうしてもπϕ(y1∣x)\pi_\phi(y^1|x)πϕ​(y1∣x)をどうやってLLMから算出するかがわからないままでした。

そんなこと知らなくても、ライブラリを使えば簡単に学習できるわけですが...ライブラリがあるから理論を知らなくていいということは決してないのでちゃんと調べてみました。
調べたことをメモがてら書いておきます（間違ってる可能性もありますが）。

 定義LLM: πϕ\pi_\phiπϕ​

入力プロンプト: xxx

任意の出力: y=w1,w2,…,wNy = w_1, w_2, \dots, w_Ny=w1​,w2​,…,wN​

狙った出力: y1=w11,w21,…,wN1y^1 = w_1^1, w_2^1, \dots, w_N^1y1=w11​,w21​,…,wN1​
語彙: VVV

語彙数: ∣V∣|V|∣V∣

LLMモデルの出力: logitsと呼ぶ(入力のトークン数×∣V∣\times|V|×∣V∣ のテンソル)

logitをsoftmaxしたもの: Probabilitiesと呼ぶ(入力のトークン数×∣V∣\times|V|×∣V∣ のテンソル)

 本題
 プロンプトxxxをLLMに与えたときに出力yyyを得る確率パラメータϕ\phiϕを持つLLMπϕ\pi_\phiπϕ​にプロンプトxxxを渡したときに、出力y=w1,w2,…,wNy = w_1, w_2, \dots, w_Ny=w1​,w2​,…,wN​を得られる確率は下記の式で表されます。
P(y∣x,ϕ)=πϕ(y∣x)=∏i=1Nπϕ(wi∣x,w<i)
P(y|x, \phi) = \pi_\phi(y|x) = \prod_{i=1}^N \pi_\phi (w_i | x, w_{<i})
P(y∣x,ϕ)=πϕ​(y∣x)=i=1∏N​πϕ​(wi​∣x,w<i​)これを求めるだけなら、行けそうですね。
まずはπϕ(w1∣x)\pi_\phi (w_1 | x)πϕ​(w1​∣x)の確率を求める。

これは、LLMに入力xxxを渡したときの出力(logit)にsoftmax変換をさせたProbabilitiesの最後の要素から確率を求められますね。Python風に書くとProbabilities[-1][出力トークンID]でしょうか。
πϕ(w2∣x,wq)\pi_\phi (w_2 | x, w_q)πϕ​(w2​∣x,wq​)の確率を求める。

これは、LLMに入力x,w1x, w_1x,w1​を結合して渡したときの、Probabilities[-1][出力トークンID]です。
と言うように、順にトークンwiw_iwi​を出力させて、その確率を使えばP(y∣x,ϕ)P(y|x, \phi)P(y∣x,ϕ)を計算することができますね。

 プロンプトxxxをLLMに与えたときに、狙った出力y1y^1y1を得る確率上記のように任意の出力yyyを得る確率P(y∣x,ϕ)P(y|x, \phi)P(y∣x,ϕ)は簡単に求められることがわかりました。

これはLLMを自然に実行したときに得られるProbabilitiesを使えば簡単に求められました。

では、狙った出力y1y^1y1を出力する確率P(y1∣x,ϕ)P(y^1|x, \phi)P(y1∣x,ϕ)を得るにはどうしたらよいでしょう。
結論、このように算出しているみたいです。
まず、LLMにx,yx, yx,yを結合させたものを入力し、Probabilitiesを得ます。

言葉でうまく説明できないので、ところどころPythonコード風になりますが、

Probabilities[len(x)-1][y^1の1トークン目のトークンID]

Probabilities[len(x)][y^1の2トークン目のトークンID]

Probabilities[len(x)+1][y^1の3トークン目のトークンID]

...

Probabilities[len(x)+len(y)-2][y^1のlen(y)トークン目のトークンID]

がそれぞれ、πϕ(w11∣x),πϕ(w21∣x,w11),πϕ(w31∣x,w11,w21),…,πϕ(wN∣x,w<N)\pi_\phi (w_1^1 | x), \pi_\phi (w_2^1 | x, w_1^1), \pi_\phi (w_3^1 | x, w_1^1, w_2^1), \dots, \pi_\phi (w_N | x, w_{<N})πϕ​(w11​∣x),πϕ​(w21​∣x,w11​),πϕ​(w31​∣x,w11​,w21​),…,πϕ​(wN​∣x,w<N​)に対応します。
さて、なぜx,y1x, y^1x,y1を結合させたものを入力とした出力が、P(y1∣x,ϕ)P(y^1|x, \phi)P(y1∣x,ϕ)となるのでしょう？

未来の情報が入ってしまって大丈夫でしょうか？
じつは、大丈夫なのです。

LLMにはCausal Attentionという、未来の情報をマスクするAttentionが使われてます。このことから、上記のようにx,y1x, y^1x,y1を入力として確率を計算しても問題のです。
調査終わり。

Discussion

ログインするとコメントできます

【選考チューニング】あるプロンプトをLLMに与えたときに、ある出力が得られる確率を求める

定義

本題

プロンプト $x$ をLLMに与えたときに出力 $y$ を得る確率

プロンプト $x$ をLLMに与えたときに、狙った出力 $y^1$ を得る確率

Discussion