投資xAIで勉強してきたことまとめ
本記事は、マケデコアドベントカレンダー1日目の記事です。
はじめに
近年、個人のPCスペック向上やPythonライブラリの充実により、個人でも高度な金融データ分析やバックテストが可能になってきました。「投資 x AI」の領域は非常に奥が深く、どこから手をつければ良いか迷うことも多いです。
今回は、私がこの領域を学ぶにあたって実際に取り組んだMOOC(オンライン講座)、読み込んだ専門書、そしてインスピレーションを受けた読み物を体系的にまとめます。これからクオンツトレードやファイナンス機械学習を学びたいエンジニアの方々の参考になれば幸いです。
1. 手を動かして学ぶ(MOOC編)
まずはPythonを使って実際にポートフォリオ構築やアルゴリズムを実装する講座です。理論だけではイメージしづらい部分を、コードを通じて理解するのに役立ちました。
Investment Management with Python and Machine Learning Specialization (Coursera)
EDHEC Business Schoolが提供する名講座です。
- URL: Coursera Link
-
学べること:
- リスク指標(ドローダウン、VaRなど)の計算実装
- ポートフォリオ最適化(平均分散アプローチ、ブラック・リッターマンなど)
- CPPIなどの動的ヘッジ戦略
- 機械学習、オルタナティヴデータの使い方
-
感想:
- ポートフォリオ理論を実務家の視点から学べてとても良かったです。この講座を受けてからベンチマークにはいつも1/Nを使っています。Lecture3は演習問題も含めて微妙ですが、それ以外の講座はかなり勉強になるはずです。
2. クオンツの「聖書」で理論を固める(古典理論編)
Pythonでの実装と並行して、その背景にある数理的な基礎を学ぶために参照した書籍です。
アクティブ・ポートフォリオ・マネジメント (Active Portfolio Management)
クオンツ運用を目指すなら避けては通れない、Grinold & Kahnによる名著です。
- 書籍: Active Portfolio Management / Advances in Active Portfolio Management
-
キーコンセプト:
-
基本法則:
(情報係数とブレッドスの概念)IR = IC \times \sqrt{BR} - アルファの生成とリスク管理の分離
-
基本法則:
-
学び:
- 言わずと知れた名著です。UKIさんの記事にも重要な数式がちらほら。クオンツ運用でアルファを求めたい人は余計なことに手をつけずこの本を読みましょう。
最近は生成AIはすごく賢いので、この本について聞くと色々返してくれてしかもわかりやすい。
- 言わずと知れた名著です。UKIさんの記事にも重要な数式がちらほら。クオンツ運用でアルファを求めたい人は余計なことに手をつけずこの本を読みましょう。
3. 現代の「ファイナンス機械学習」へ(Modern ML編)
「普通の機械学習」をそのまま金融データに適用して失敗しないための、金融特有のML作法を学ぶための書籍です。これらはパラダイムシフトを感じさせる内容でした。
マルコス・ロペス・デ・プラドのファイナンス機械学習シリーズ
金融データにおける「非定常性」や「バックテストの過学習」という落とし穴に対し、数学的にアプローチしています。
ファイナンス機械学習 (Advances in Financial Machine Learning)
- 書籍: Amazon Link
-
ポイント:
- Bars(時間足だけでなく、Volume BarやDollar Barの重要性)
- CPCV法によるクロスバリデーション
- メタラベリング
アセットマネジャーのためのファイナンス機械学習
- 書籍: Amazon Link
-
ポイント:
- デノイズ(ランダム行列理論)による共分散行列の前処理
- クラスタリングを活用したポートフォリオ構築(NCO)
-
学び:
- 金融データは取扱いを間違えると偽のエッジを発見をしたり、逆にエッジを取り逃がしたりします。データの作り方から丁寧に解説してくれているので勉強になるかと思います。
最近の生成AIの発展は凄まじく、気になる箇所を聞くととても丁寧な解説をしてくれます。書かれてある手法を学ぶと言うよりはむしろ、書かれてある考えを理解していくことが大切だと思います。
- 金融データは取扱いを間違えると偽のエッジを発見をしたり、逆にエッジを取り逃がしたりします。データの作り方から丁寧に解説してくれているので勉強になるかと思います。
4. モチベーションと文脈(読み物・記事)
学習のモチベーション維持や、業界の現実を知るために読んだコンテンツです。
最も賢い億万長者(ジム・シモンズ)
クオンツ界の伝説、ルネサンス・テクノロジーズの創業者ジム・シモンズの伝記です。
- 書籍: 最も賢い億万長者〈上・下〉
-
感想:
- 天才数学者たちがどのように市場に挑み、どのような苦労を経てシステムを構築したのか、そのドラマに引き込まれました。「パターンを見つける」ことへの執念に刺激を受けます。ただ、これから新しく成功するクオンツヘッジファンドがあるとすれば、それは彼らとは少し異なるアプローチをとっているファンドではないかと思います。
5. 実践
- Numerai: Numerai
-
学び:
- 一時期流行ったNumerai。今の自分があるのはNumerai Tournamnet、Singalsに参加したからだと思います。機械学習の使い方も含めて、とても参考になります。Cryptoを賭けると報酬がもらえますが、なくても楽しめると思います。ちなみに最近Signalsに復帰しました。3か月後の結果が楽しみです。
- JQuants API: JQuants API
-
学び:
- 日本株では最も正確性の高いデータソースだと思われます。いろんな戦略を考えたり作ったりできるのでとても楽しいです。ただし、プレミアムプランはそれなりのお値段なのでご注意を。
一旦プレミアムでデータを取得した後に解約し、成果が出るようになったら継続して契約すると良さそうな気もします。
- 日本株では最も正確性の高いデータソースだと思われます。いろんな戦略を考えたり作ったりできるのでとても楽しいです。ただし、プレミアムプランはそれなりのお値段なのでご注意を。
おわりに
これらのリソースを通じて、単に「予測モデルを作る」だけでなく、どのようにモデルを使うのかを学ぶことができました。ただ、投資で稼ぐためにAIが必須かというと違うと思います。大きなリターンを得るためには、相場を見極め、アベノミクスやコロナバブルなどの上昇相場にのることの方が重要なのではないでしょうか。最近強くそう思います。
自分でできることは一通りやり切った感があるので、今後は、生成AIの応用などを発展させていければと考えています。ちなみにこの記事の構成は生成AIに考えてもらったものです。
最後に、同じ分野に興味がある方は、ぜひこれらの書籍やコースを手に取ってみてください。
Discussion