💔

数理最適化に基づく合理的な恋愛市場の悲劇【ゲーム理論】

2022/07/07に公開

概要

以前こんな記事を投稿しました。

私の執筆した記事にしては多くの方からご好評いただきとてもありがたく思いました。ご好評につきまして続編を書きたいな、というのが本記事の趣旨です。

以前は鈴木さんたった一人が、告白してくる相手を受け入れるか受け入れないかという意思決定を行うモデルを見ていました。しかし実際には鈴木さんは「見定める側」でありつつも「見定められる側」でもあります。そこで今回は「恋愛市場に参加している人々が全員合理的に相手を見定めあった場合、一体どんな状況が成立することが予想されるのか」といった点について、ゲーム理論の枠組みを通じて考察してみたいと思います。本記事を通じて、多少数学の勉強になったり、ゲーム理論という面白いフレームワークがあることが伝われば嬉しいなぁと、著者は思っています。

わかりやすさの都合上男性・女性という表現を用います。特段の意図はございませんのでご理解いただけますと幸いです。

物語の設定

とある合理的な男女から構成された世界があります。この世界には数えきれないほど男女が存在していて、毎週それぞれの男女（以下ゲーム理論の言葉にあやかってプレイヤーと呼びます）が確率 $\alpha$ でランダムに、かつ多くとも一人とマッチングします。マッチングが発生したとき、各プレイヤーはマッチした相手の魅力度 $\theta$ を確認し、その魅力度に応じて受け入れるかどうかを意思決定(以下ゲーム理論の言葉にあやかってアクションと呼びます)します。魅力度 $\theta$ の相手とお付き合いしている場合は毎週 $\theta$ だけ幸福度を得ることができ、そうでない場合は毎週 $b$ の幸福度を得るとします。また、この魅力度 $\theta$ について非常に重要な前提を置きます。

以前の鈴木さんの物語と決定的に異なるのは、「見定める側の自分自身も魅力度を持っており、見定められる側である点」にあります。アクションをするプレイヤー自身の魅力度を $\varphi$ と置くことにしましょう。各プレイヤーは自分に与えられた魅力度 $\varphi$ を所与として、最適なアクションを模索することになります。

以下でこの物語におけるパラメータの一覧をまとめておきます。

パラメータの一覧

$\alpha$ : 各プレイヤーが毎週マッチングする確率
$\theta \in [\underline{\theta}, \bar{\theta}]$ : マッチングした相手の魅力度を表す。それぞれの分布は男女で完全に対称であり、確率密度関数 $f(\theta)$ , 累積型分布関数を $F(\theta)$ と表す。
$b \in (\underline{\theta}, \bar{\theta})$ : 恋人がいない場合の基礎的な幸福度
$\delta$ : 各プレイヤーが毎週死亡してしまう確率
$\varphi \in (\underline{\theta}, \bar{\theta})$ : プレイヤー自身の魅力度

この条件の元、各プレイヤーは自らの生涯の幸福度の期待値を最大化するようなアクションを行うと仮定しましょう。このとき、その目的関数（ゲーム理論の言葉では利得関数と呼びます）は以下のように定義できます。

\begin{aligned} V_0 &= \sum_{t=0}^{\infty}(1-\delta)^t \mathbb{E}[x_t] \\ s.t.\ x_t &= \left\{ \begin{array}{cc} \theta & \small{ \theta\ の魅力度の恋人と付き合っている場合} \\ b & \small{誰とも付き合っていない場合} \end{array} \right. \end{aligned}

物語の本編

戦略的相互依存とナッシュ均衡について

さて、この物語を解き進めていきましょう。今回最も難しいのは「自分にとっての最適な行動が、相手の行動によって変わってしまう」ということです。「誰からも受け入れられる」ことがわかっている人と、「ほとんどの人が受け入れてくれない」人では意思決定が変わるのは当然ですよね。こうした「相手の行動によって自分にとっての最適な行動が変わってしまう」状態のことをゲーム理論の言葉で戦略的相互依存と呼びます。

この戦略的相互依存が存在する場合は 「何を解とするか」 をきちんと定める必要があります。これが何故必要かを説明するためにじゃんけんを例にあげましょう。じゃんけんは相手の行動によって自分にとっての最適な行動が変わる戦略的相互依存関係にあります。相手がグーを出すならパーを出したいですし、チョキを出すならグーを出したいですよね。ただ実際には後出しでじゃんけんをすることはできないので、戦略的相互依存の関係においては相手が「何を選択するか」を予想しながら自分の出す手を決めることになります。逆に言えば「予想次第で各プレイヤーの最適な行動はどの手も合理化できる」 ことになってしまうので、これで結論としてしまっては示唆としては弱いですよね。

そのため以下ではこのゲームの解、すなわち物語の帰結は以下の２つの条件を満たすものとして解を求めることとしましょう。

この２つの条件を満たす解概念をナッシュ均衡^[1]といいます。以下ではこのナッシュ均衡を求めることにより、この物語の帰結を眺めていきましょう。以下のステップで導出を行います。

ナッシュ均衡の解としての妥当性について

本当にナッシュ均衡は物語の結論として妥当か？特に2の条件は適切か？など様々な考えを持たれる方が多いと思います。これについてはこの記事で触れるにはあまりにも深遠なトピックですが、一般的にゲーム理論においては広く受け入れられた考え方となっています。もし深く興味がある方がいらっしゃれば以下記事などが参考になるかと思います。

Step1. 各プレイヤーの予想を想像し、仮定する

ここでは各プレイヤーが他のプレイヤーの行動について予想した結果、以下の状況が実現すると予想していると仮定してみましょう。

この予想は「魅力度の高い人ほど魅力度の高い人からも受け入れられる」「ある魅力度の人から受け入れられるならば、それより低い魅力度の人からも必ず受け入れられる」ということを意味しており、自然な予想です。とはいえ必ず成立するかどうかは各プレイヤーのアクションを分析してみないことにはわからないため、この予想の元各プレイヤーのアクションを分析していきましょう。

Step2. 各プレイヤーの最適なアクションを導出する

Step1 で仮定された予想に基づくと、魅力度 $\varphi$ のプレイヤーの第 $t$ 週時点の利得関数は魅力度 $\theta$ の恋人がいる場合を $V_t(\theta|\varphi)$ , 恋人がいる場合を $V_t(b|\varphi)$ と表現することにより、以下のように表現できます：

\begin{aligned} V_t(\theta|\varphi) &= \theta + (1-\delta)V_{t+1}(\theta|\varphi) \\ V_t(b|\varphi) &= b + (1-\delta)\alpha\biggl[ \underbrace{\int_{\bar{\theta}(\varphi)}^{\bar{\theta}}V_{t+1}(b|\varphi)f(\theta)d\theta}_{\tiny{確実に振られる}} +\underbrace{\int_{\underline{\theta}}^{\bar{\theta}(\varphi)}\max\{V_{t+1}(\theta|\varphi), V_{t+1}(b|\varphi)\}f(\theta)d\theta}_{\tiny{少なくとも相手は確実に受け入れてくれる}} \biggr] \\ &\ \ \ \ \ \ \ + (1-\delta)(1-\alpha)V_{t+1}(b|\varphi) \end{aligned}

ここで、このモデルにおいては以前と同じで時間それ自体に影響を受ける構造が一切存在しないので、 $t$ の添え字をとって以下のように表現できます。

\begin{aligned} V(\theta|\varphi) &= \theta + (1-\delta)V(\theta|\varphi) \\ V(b|\varphi) &= b + (1-\delta)\alpha\biggl[ \int_{\bar{\theta}(\varphi)}^{\bar{\theta}}V(b|\varphi)f(\theta)d\theta \int_{\underline{\theta}}^{\bar{\theta}(\varphi)}\max\{V(\theta|\varphi), V(b|\varphi)\}f(\theta)d\theta \biggr] \\ &\ \ \ \ \ \ \ + (1-\delta)(1-\alpha)V(b|\varphi) \end{aligned}

$V(\theta|\varphi)$ の式より

\begin{aligned} V(\theta|\varphi) = \frac{\theta}{\delta} \tag{1} \end{aligned}

$V(b|\varphi)$ の式より

\begin{aligned} \delta V(b|\varphi) &= b + (1-\delta)\alpha\biggl[ \int_{\bar{\theta}(\varphi)}^{\bar{\theta}}[V(b|\varphi)-V(b|\varphi)]f(\theta)d\theta + \int_{\underline{\theta}}^{\bar{\theta}(\varphi)}\max\{V(\theta|\varphi)-V(b|\varphi), V(b|\varphi)-V(b|\varphi)\}f(\theta)d\theta \biggr] \end{aligned}

よって $(1)$ を代入しつつもう少し整理すると以下を得ることができます。

\begin{aligned} \delta V(b|\varphi)&= b + (1-\delta)\alpha\biggl[ \int_{\underline{\theta}}^{\bar{\theta}(\varphi)}\max\{\frac{\theta}{\delta}-V(b|\varphi),0\}f(\theta)d\theta \biggr] \tag{2} \end{aligned}

ここで $\varphi < b$ の魅力度のプレイヤーは誰からも受け入れられないことがわかります。どのプレイヤーからも受け入れられないことがわかります。なぜならば $(2)$ より

\begin{aligned} \delta V(b|\varphi)&= b + (1-\delta)\alpha\biggl[ \int_{\underline{\theta}}^{\bar{\theta}(\varphi)}\max\{\frac{\theta}{\delta}-V(b|\varphi),0\}f(\theta)d\theta\biggr] \\ & \geq b \end{aligned}

となるため $V(b|\varphi) \geq b/\delta$ が成立し、 $(2)$ の $\max$ オペレータで相手を受け入れるアクションが選択されるためには、少なくとも $\theta \geq b$ が成立している必要があるためです。

誰からも受け入れられないプレイヤーのアクションはいったん気にする必要がないため、少なくとも誰かからは受け入れられるプレイヤー、すなわち $\bar{\theta}(\varphi) > b$ のプレイヤー(少なくとも $\varphi \geq b$ が満たされるプレイヤー)についての意思決定を検討しましょう。

まず、ある $\theta^*_{\varphi} \in [b, \bar{\theta}(\varphi))$ が存在して

\begin{aligned} \frac{\theta^*_{\varphi}}{\delta} = V(b|\varphi) \tag{3} \end{aligned}

が成立することを証明します。

上記の証明

まず $\bar{\theta}(\varphi)/\delta - V(b|\varphi)$ を以下のように計算できます。

\begin{aligned} \frac{\bar{\theta}(\varphi)}{\delta} - V(b|\varphi) &= \frac{1}{\delta}\biggl[\bar{\theta}(\varphi) - b -(1-\delta)\alpha\int_{\underline{\theta}}^{\bar{\theta}(\varphi)}\max\{\frac{\theta}{\delta}-V(b|\varphi),0\}f(\theta)d\theta\biggr] \\ &\geq \frac{1}{\delta}\biggl[\bar{\theta}(\varphi) - b -(1-\delta)\alpha\int_{\underline{\theta}}^{\bar{\theta}(\varphi)}\max\{\frac{\bar{\theta}(\varphi)}{\delta}-V(b|\varphi),0\}f(\theta)d\theta\biggr] \end{aligned}

ここで $k \in [0,1)$ として

\begin{aligned} \frac{\bar{\theta}(\varphi)}{\delta} - V(b|\varphi) &\geq \frac{1}{\delta}\biggl[\bar{\theta}(\varphi) - b -(1-\delta)\alpha k[\frac{\bar{\theta}(\varphi)}{\delta}-V(b|\varphi)]\biggr] \\ \Leftrightarrow \biggl[1+\frac{(1-\delta)\alpha k}{\delta}\biggr]\biggl[\frac{\bar{\theta}(\varphi)}{\delta} - V(b|\varphi)\biggr] &\geq \underbrace{\frac{1}{\delta}\biggl[\bar{\theta}(\varphi) - b\biggr]}_{>0}>0 \end{aligned}

したがって、少なくとも $\theta = \bar{\theta}(\varphi)$ の相手についてはその告白を受け入れるはずです。また、先ほど $\theta < b$ のプレイヤーはだれからも受け入れられないことを示しました。さらに $\theta/\delta$ は $\theta$ の増加関数であることから、ある $\theta^*_{\varphi} \in [b, \bar{\theta}(\varphi))$ が存在して

\begin{aligned} \frac{\theta^*_{\varphi}}{\delta} = V(b|\varphi) \tag{3} \end{aligned}

が成立します。

$(2)$ 式にこの結果を代入すると

\begin{aligned} \theta^*_{\varphi}&= b + (1-\delta)\alpha\biggl[ \int_{\theta^*_{\varphi}}^{\bar{\theta}(\varphi)}\biggl[\frac{\theta}{\delta}-V(b|\varphi)\biggr]f(\theta)d\theta \biggr] \\ &= b + \frac{(1-\delta)\alpha}{\delta}\biggl[ \int_{\theta^*_{\varphi}}^{\bar{\theta}(\varphi)}(\theta - \theta^*_{\varphi})f(\theta)d\theta \biggr] \end{aligned}

この式に部分積分を適用することにより以下を得ます。

\begin{aligned} \theta^*_{\varphi} &= b + \frac{(1-\delta)\alpha}{\delta}\biggl[ \int_{\theta^*_{\varphi}}^{\bar{\theta}(\varphi)}[F(\bar{\theta}(\varphi))-F(\theta)]d\theta \biggr] \equiv G(\theta^*_\varphi) \tag{4} \end{aligned}

したがって $\theta^*_\varphi$ は $G(\theta^*_\varphi)$ の不動点として表現されることになります。 $G(\cdot)$ の概形は鈴木さんの物語で求めたものと同じなので、 $\theta^*_\varphi \in (b, \bar{\theta}(\varphi))$ は一意に定まることがわかります。さらに、容易に以下を確かめることができます。

\begin{aligned} \frac{\partial \theta^*_{\varphi}}{\partial \bar{\theta}(\varphi)} > 0 \tag{5} \end{aligned}

つまり、魅力的な異性から受け入れてもらえる人ほどその人の理想自体も高くなります。

ここで求められた結論をまとめると以下のようになります。

では、各プレイヤーの合理的なアクションについて分析することができたため、これらのプレイヤーの意思決定の総和として、どのような状況が実現するか分析してまいりましょう。

Step3. プレイヤーのアクションの総和として誕生する状況の導出と予想の整合性の確認

プレイヤーのアクションの総和として誕生する状況の導出

さて、まず出発点として、最も魅力度の高い男女である $\varphi = \bar{\theta}$ の人々について考えてみましょう。

まず、最高の魅力度の男女が誰からも拒否されないことを証明します。

最高の魅力度の男女が誰からも拒否されないことの証明

Step2で示したように、 $\bar{\theta}(\varphi)$ が高ければ高いほど理想が高くなるため、このゲームにおいて最も理想が高いプレイヤーは $\bar{\theta}(\varphi) = \bar{\theta}$ が成立するプレイヤーです。このプレイヤーについて $\theta^*_{\varphi}$ は以下を満たします：

\begin{aligned} \theta^*_{\varphi} &= b + \frac{(1-\delta)\alpha}{\delta}\biggl[ \int_{\theta^*_{\varphi}}^{\bar{\theta}}[1-F(\theta)]d\theta \biggr] \end{aligned}

ここで、仮に $\theta^*_\varphi = \bar{\theta}$ が解(つまり理想が最も高いプレイヤーは最高の魅力度の男女をも拒否することがあり得ることを意味)であると仮定すると積分区間がなくなるため

\begin{aligned} \bar{\theta}= b \end{aligned}

が成立することになるがこれはパラメータの条件 $b \in (\underline{\theta}, \bar{\theta})$ より、矛盾である。したがって、すべてのプレイヤーについて $\theta^*_\varphi<\bar{\theta}$ が成立するため誰も最高の魅力度の男女を拒否しない。

したがって、 $\varphi = \bar{\theta}$ の男女については $\bar{\theta}(\varphi) = \bar{\theta}$ が成立します。したがってその理想のラインを $\theta^*_\varphi \equiv C_1$ と定義すれば以下のように求められます。

\begin{aligned} C_1 &= b + \frac{(1-\delta)\alpha}{\delta}\biggl[ \int_{C_1}^{\bar{\theta}}[1-F(\theta)]d\theta \biggr] \tag{6} \end{aligned}

つまり最高の魅力度を持った男女が抱く理想が $(6)$ の式として求められました。続いて、この男女の理想がこの世界において最も高いわけですから、その男女に受け入れられる $\theta \in (\bar{\theta}, C_1]$ の男女たちは同じようにだれからも拒否されません。つまりこれらの魅力度の男女の理想も

\begin{aligned} \theta^*_{\varphi} &= b + \frac{(1-\delta)\alpha}{\delta}\biggl[ \int_{\theta^*_\varphi}^{\bar{\theta}}[1-F(\theta)]d\theta \biggr] \tag{7} \end{aligned}

という形に $(6)$ 式と全く同じ方程式により求められることになります。すなわち以下が成立します。

以下に図を示します。

今回男性と女性は完全に対称な状況を仮定していたため、このように黄色で示された範囲の方々は全員受け入れあいます。逆に言えば $C_1$ より下の人についてはこの範囲の人々は全員拒否することになります。

そこで、今度は拒否された人々 $\varphi \in [b, C_1)$ について考えていきましょう。しかし勘のいい方は「上の議論が全く同じように適用できること」に気づくことでしょう。つまり、残された男女における最大の魅力度は $C_1$ となるわけですが、この男女がまず理想を $C_2$ と定めます。すると $\varphi \in (C_1, C_2]$ の男女の理想は同じ議論から $C_2$ となります。つまり、図にすると以下のようです。

この図の緑色の範囲で示された $\varphi \in [C_2, C_1)$ の範囲の男女はお互いがお互いを受け入れ合います。この男女たちは黄色の範囲に存在している魅力度が高い人たちをも受け入れたい気持ちはありますが、相手に拒否されます（まさに高嶺の花です）。また、緑色の範囲よりも低い魅力度の人たちは拒否されます。

もうお分かりでしょうか。つまりこの世界では上から「受け入れあえる男女」がだんだんとブロック化されていきます。そのブロック化された男女の中でのみ、マッチングが成立するのです。同じことが、 $C_3$ , $C_4$ ... と $b$ に収束するまで続いていきます。図示すると以下のようです。

誕生した状況と元々前提としていた予想の整合性の確認

さて最後のステップとして、各プレイヤーが Step1 で予想していた予想が現在誕生した状況に矛盾していないか確認していきましょう。もし整合的であればナッシュ均衡であるとみなすことができるのでした。予想をまずは再掲します。

まず1についてですが、各プレイヤーを受け入れてくれる異性には上限が存在しましたね（最上位のブロックであれば $\theta = \bar{\theta}$ , 2番目のブロックであれば $\theta = C_1$ ...）。したがってこの前提は満たされています。

次に2についてですが、この上限未満の人は全員受け入れてくれることが状況として成立しています（上手緑色の区間の人は黄色の区間の人を受け入れたとしても結局相手に拒否されてはしまいますが...）。

最後に3についてですが、魅力度が高い人ほど上のブロックにはいれるため、その人を受け入れてくれる魅力度の上限は少なくとも小さくなることはありませんね。

以上のことから最初に想定した各プレイヤーの予想は、その予想に基づく最適なアクションの結果として実現するため、ナッシュ均衡を求めることができたことになります。

物語の結論

この物語における結論は以下のようになります。

図示すれば以下のようになります。

高嶺の花同士が高嶺の花同士でマッチングしあうという世界。つまり著者のような凡庸な人間には高嶺の花はノーチャンスである、という悲劇的な結論が得られてしまいました。身の程を知って恋愛しましょうという、そんな正論を数学的に突き付けられた悲しい気持ちになりました。笑

ちなみに $\alpha$ が大きくなる（つまりマッチングの機会が増える）ほどにすべての男女の理想が高くなるため、最高の魅力度の相手から拒否される魅力度の異性がどんどん増えます。マッチングアプリなどの普及を通じてどんどんマッチングが活性化するほど、実のところ高嶺の花はどんどんノーチャンスになっていくということです。

$b$ の増大（恋人がいない状態での幸福度の増大）が引き起こす結果については、ここでは敢えて深く語らないこととします。未婚率の上昇などというキーワードをたびたび目にしますが、実はこういう風に原因が説明できるのかもしれないですね。一昔前に比べて娯楽や幸せも多様化したように思われます。

最後に、あくまでこの結論は「好みの差が存在しない」という前提の下導き出された結論であることをご指摘させていただきます。これは言うまでもなく非現実的ですので、得られた結論の解釈にはご注意いただけますと幸いです。

本記事はこちらで以上となります。長文でしたが最後までお読みいただき（といいつつ、数学的な展開を追った人が一人でもいるのか甚だ疑問ではありますが笑）有難うございました！

脚注

ナッシュ均衡という名前はジョン・ナッシュというノーベル経済学賞を受賞した数学者から名づけられています。ビューティフル・マインドというアカデミー作品賞を受賞した映画で取り上げられたことがあるほど有名な人物です。 ↩︎