📜

エド・ソープ:「市場を打ち破る思考法」

に公開

以下の記事を見つけてAI駆使して書いてみました。
https://www.aqr.com/Research-Archive/Research/Interviews/Words-from-the-Wise-Ed-Thorp

はじめに:コードを書く前に知るべき「クオンツの父」の思考

私たちエンジニアやデータサイエンティストが金融の世界、特にクオンティブ・トレーディング(クオンツ)に足を踏み入れるとき、高度な数学や機械学習モデル、そして膨大なデータ処理技術に目が行きがちです。しかし、その根底にあるべき「思考」とは何でしょうか?

その答えの多くは、「クオンツの父」エドワード・ソープ のキャリアに隠されています。

彼は数学者として、まずカジノのブラックジャックを攻略し、その思考法をウォール街に持ち込み、37年間一度も年間のリターンがマイナスになることのない という驚異的な記録を打ち立てました。これは単なる伝説ではありません。市場に潜む非効率性を数学のメスで切り出し、鉄の規律で実行し続けた結果です。

この記事では、AQRによるソープへの貴重なインタビューを基に、彼の思考の核心を技術的な視点から深掘りします。オプション価格理論の独力での発見から、現代ファクター投資の原型、そして鉄壁のリスク管理まで。コードを書くその前に、市場とどう向き合うべきかの哲学を学びましょう。

💬 私の幸運でもあり、不運でもあったのは、金融について何も知らなかったことだ。

この逆説的な言葉にこそ、常識に囚われず、第一原理で世界を捉え直すハッカー精神の原点があります。


1. オプション価格理論の再発明 💻: ブラック=ショールズ以前の発見

現代金融工学の根幹をなすブラック=ショールズ・モデル。しかしソープは、その数年前に独力で本質的に同じ理論に到達していました。そのプロセスは、まさに天才プログラマーがフレームワークなしで問題を解決する姿そのものです。

問題:誰も解けなかった価格決定の壁

1960年代、ソープは株式ワラント(現在のコール・オプション)に着目しました。彼は、株式とワラントを組み合わせることで、価格変動リスクをヘッジできると考えました。

しかし、当時の研究は壁に突き当たっていました。価格を計算するには、どうしても2つの未知数が必要だったのです。

  1. 原資産の期待成長率 (\mu): 将来、株がどれくらい上がるか?
  2. ペイオフの割引率 (r_d): 将来の不確実な利益を、今いくらと評価するか?

これらは市場参加者の主観(リスク選好)に依存するため、誰も客観的な答えを出せずにいました。

発見:「リスク中立」という魔法の思考実験 ✨

ここでソープの思考は飛躍します。

💬 もし、誰もがリスクを気にしない「リスク中立世界」だったらどうなるだろう?...その世界では、あらゆる資産の期待リターンは、安全な無リスク金利と等しくなるはずだ。この仮定を式に代入すると、2つの未知数が見事に相殺され、驚くほどシンプルで美しい公式が現れた。まさにビンゴだった。

これは、後に「リスク中立評価」として知られる概念の独立発見でした。ヘッジによってリスクを消せるなら、そのポートフォリオのリターンは無リスク金利と一致しなければならない。そうでなければ、無限に儲かる機会(裁定取引)が生まれてしまうからです。

📜 ブラック=ショールズ偏微分方程式の核心

この直感は、後にブラックとショールズが導出した偏微分方程式によって数学的に裏付けられます。
オプション価格を C、株価を S、時間を t とすると、彼らの導いた方程式は以下のようになります。

\frac{\partial C}{\partial t} + rS\frac{\partial C}{\partial S} + \frac{1}{2}\sigma^2 S^2 \frac{\partial^2 C}{\partial S^2} - rC = 0

この方程式の最も重要な点は、株式の期待成長率 \mu が式から消えていることです。これが、ソープが直感的に見抜いた「相殺」の正体であり、デリバティブ価格評価の根幹をなす発見でした。

独自実装:「再帰的後方積分法」という名の動的計画法

さらに驚くべきは、ソープが解析解のない問題にも対処していたことです。彼が 「再帰的後方積分法 (Recursive Backward Integration)」 と呼んだ手法は、現代の我々が知る 動的計画法 (Dynamic Programming) そのものです。

これは、満期 (T) から時間を遡って(後方に)現在 (t=0) の価値を再帰的に求めていくアプローチで、彼はこれを用いて アメリカン・オプションの早期行使問題 を解決しました。

title=アメリカン・プット評価の概念的コード
# これは概念的な実装であり、完全なコードではありません

def price_american_put(S0, K, r, T, sigma, steps):
    dt = T / steps
    # ... 格子(ツリー)の生成 ...

    # 満期(T)でのペイオフを計算
    # payoffs = max(K - S_T, 0)

    # 時間を遡って計算 (Backward Induction)
    for i in range(steps - 1, -1, -1):
        for j in range(i + 1):
            # 継続保有価値 (Continuation Value)
            # continuation_value = exp(-r*dt) * (p * option_value[j+1] + (1-p) * option_value[j])
            
            # 早期行使価値 (Early Exercise Value)
            # exercise_value = K - S_at_node(i, j)
            
            # 2つの価値の大きい方を選択
            # option_value[j] = max(continuation_value, exercise_value)

    return option_value[0]

これは、現代の 二項モデル有限差分法 の基本的なアルゴリズムと同じです。ソープがこれを1960年代に独自開発していたことは、彼の思考がいかに時代を先取りしていたかを物語っています。


2. ファクター投資の夜明け 🌅: "Indicators Project"

1980年代、ソープのチームは「インディケーター・プロジェクト」に着手しました。これは、現代のファクター投資やスマートベータの紛れもない原型です。

発見:「Most Up, Most Down」戦略

彼らの最も有名な発見の一つが、短期的な価格リバーサル効果です。

💬 直近数週間で最も価格が上昇した株は、次の数週間でアンダーパフォームし、最も下落した株はアウトパフォームする傾向がある。

これは、投資家の**過剰反応(オーバーリアクション)**という行動バイアスを収益源とする、現代の統計的裁定取引(スタット・アーブ)の核心的なアイデアでした。

革新:業種内中性化によるリスク制御 🛡️

この戦略は、ジェリー・バンバーガーの参加によって劇的に進化します。彼の天才的なアイデアは、 同一業種内でロング・ショートのペアを組む ことでした。

📜 業種内中性化のリスク削減効果

一般的な多因子モデルで、銘柄リターン R_i は以下のように表せます。

R_i = \alpha_i + \beta_{i,m} F_m + \beta_{i,s} F_s + \epsilon_i
  • F_m : 市場全体のリスク
  • F_s: 業種共通のリスク(例: 原油価格の変動)
  • \alpha_i: 銘柄固有のリターン(我々が狙うアルファ)

業種内でロング・ショートを同額組むことで、ポートフォリオの業種ファクターへの感応度 \beta_{i,s} が相殺され、業種特有のリスクをヘッジできます。これにより、純粋な \alpha_i だけを狙う、よりシャープな戦略が実現しました。

さらなる高度化:主成分分析(PCA)によるリスク管理

競争が激化すると、彼らはリスク管理をさらに洗練させました。事前に定義された経済ファクターではなく、主成分分析(PCA) を使い、データ自身から 抽象的なリスクファクター を抽出したのです。

💬 最大のファクターは明らかに市場だった。しかし、次に大きいものは何かは判断が難しかった。それは経済ファクターの何らかの線形結合だった。

これは、特定の経済モデルに依存せず、データ駆動型で未知のリスクを管理しようとするアプローチであり、今日のクオンツ・リスクモデルの基礎となっています。


3. 資金管理の極意 💰: ケリー基準と金融危機の教訓

ソープの成功を支えた最後の、そして最も重要な柱は、鉄壁のリスク・資金管理です。

金融プロの盲点:ケリー基準の数学

有利な確率のゲームでさえ、人は合理的に行動できません。長期的な資産成長率を最大化する最適戦略は 「ケリー基準」 で与えられます。

📜 ケリー基準の公式

勝率 p、敗率 q=1-p、オッズ b(賭け金が b 倍になって返ってくる)のゲームにおいて、資産の対数成長率を最大化する最適賭け率 f^* は以下の式で与えられます。

f^* = \frac{pb-q}{b}

例えば、勝率60%(p=0.6)、オッズ1倍(b=1)のゲームなら、f^* = (0.6 \times 1 - 0.4) / 1 = 0.2。つまり、毎回資産の20%を賭けるのが最適解です。

💬 プロのブラックジャック・プレイヤーは答えを知っているが、金融関係者は知らなかった。

この言葉は、理論を知ることと、それを実践できることの間の深い溝を示唆しています。ソープは、カジノという実践の場で、破産リスクを制御しながらリターンを最大化するこの原則を体に刻み込んだのです。

歴史は繰り返す:レバレッジという名の悪魔 👿

ソープは、歴史的な金融危機を 「過剰なレバレッジによる災害の繰り返し」 として分析します。レバレッジはリターンを増幅させますが、同時に損失も増幅させ、破滅的なフィードバックループを生み出します。

💬 投資家が毎回救済されるのであれば、彼らはリスクについて決して学ばないだろう。

これは、モラルハザードの問題を鋭く指摘しています。痛みなくして、市場は規律を学べないのです。


結論:現代のクオンツ開発者へのメッセージ

エド・ソープの思考の旅路は、現代の我々に不朽のメッセージを伝えています。

  1. 第一原理から思考せよ: フレームワークやライブラリの前に、問題の本質を数学的・論理的に突き詰める。
  2. エッジは実証可能であれ: なぜその戦略が機能するのか、経済的合理性と統計的有意性の両面から説明できなければならない。バックテストの結果が良いだけでは不十分だ。
  3. リスク管理はリターン追求に優先する: 破産確率を最小化する戦略こそが、長期的な成功の鍵。ケリー基準はその強力なツールの一つだ。
  4. 理論と現実の制度を結びつけよ: APIの仕様、取引コスト、市場のルールといった「現実世界の制約」を無視したモデルは、本番環境では動かない。
  5. 常に進化し続けよ: あなたが見つけたアルファは、いずれ陳腐化する。常に自身の戦略を客観的に検証し、改善し続ける姿勢が不可欠だ。

ソープの物語は、単なる金儲けの技術ではありません。それは、知性を武器に未知の問題に立ち向かい、世界の構造を解明しようとする、科学者であり、ハッカーである我々の根源的な姿勢そのものです。

情報とノイズが氾濫する現代において、彼の「深い思考」のアプローチこそ、我々が進むべき道を示してくれる羅針盤となるでしょう。

Discussion