Open10
Theory of Mind


そもそも Theory of Mind って?
- 他人の心の状態(例えば、信念、願望、意図、感情など)を理解し、それをもとにその人の行動を予測する能力のこと
この能力があることによって次のような行動が生まれる
- 他人が特定の情報を持っていないことを認識し、その人に対して情報を提供する
- 他人が特定の感情を持っていると推測し、その感情に合わせて行動を変える
この概念は心理学、特に発達心理学や社会心理学、さらには哲学や神経科学の分野で研究されている。特に子どもの発達において重要で、幼少期から青年期にかけてこの能力が発達することが知られている。また、自閉症スペクトラム障害の人々がこの能力に苦手意識を持つことが知られており、その理解とサポートに役立てられている。

初学者文献

LLM Agent においては、交流してる他者の心情を予測することによって行動を変えられるようにできるので重要、みたいな話っぽい

ToM Test なるものがあるらしい

- MIT の研究者が他者の感情を予測するモデルを作った
- 囚人のジレンマのシチュエーションにおいて
- モデルに影響する特徴量
- 人の欲望
- 特定の状況に対する予測・期待
- 誰かがその人の行動を見ているか
- 実際のイベントが起きる前に感情を予測する能力が大事
- 3つのモジュールから作った
- 人の好みや信念を行動から推論するモジュール、このモジュールのプロセスは inverse planning と呼ばれる
- 二つ目はゲームの結果をプレイヤーが望んでいたものと起こると予測していたものと比べる
- 3つ目は結果に対してどんな感情になっているかを予測する
https://mcgovern.mit.edu/2023/06/05/computational-model-mimics-humans-ability-to-predict-emotions/
https://royalsocietypublishing.org/doi/10.1098/rsta.2022.0047

左の a で紹介していること
- πが信念で欲求がω
- 行動に基づいて信念と欲求が変わる
- 信念と欲求に基づき appraisal に影響を与えて、それが感情を生み出す
- こういった変化が行動に変化をもたらす
右のb
- プレイヤーの好みと信念に関する事前の確率分布(P(ω,π))
- プレイヤーの行動をシミュレートし、その行動からプレイヤーの好みと信念を逆算する(3つ目のやつ)
- a1(プレイヤーのアクション)と a2(敵のアクション)から評価を計算して(4つ目のやつ)
- 最後に感情を予測

ゲームの中という状況下での感情予測なのでもっと色んな環境への対応というのがネクストステップなのかもしれん

Inverse Bayesian model は行動の理解によく使われているらしい