MixSeekという投資アルゴ量産のための新しいAIエージェントプラットフォーム
本記事は、マケデコ advent calendar 2025 5日目の記事です。
はじめに
近年の生成AIの発展を見て、「これで思いっきり投資アルゴの量産プラットフォーム作りたい!」と思ったことがある人は多いんじゃないでしょうか?
・・・僕はあります。
なかなか、そのような課題に会社のチームでチャレンジする機会があることは珍しいのですが、様々な理由により、本気でそのようなことが実現できるAIエージェントフレームワークを作ろうということになり、 MixSeek というソフトウェアを開発しました。こちらでOSSとして公開しています。なお、後述するアルゴ量産部分はprivateでプラグインで開発しているので、公開されているのはあくまで基盤部分となります。
MixSeekという名前の由来ですが、最初はdseekという社内コードネームで開発していたのですが、DeepSeekに名前が近すぎるという問題が有り、ちょうど我々のフレームワークの思想的に参考にした論文であるTUMIXがGoogleのDeepMindチームから発表され、そこからMixをお借りして、MixSeekと命名しました。これまでも為替の投資アルゴの量産プラットフォームなどをk8sベースで開発してきましたが、今回はそのプラットフォームの基盤部分をOSSで公開しています。

MixSeekのご紹介
改めて紹介すると、MixSeekは汎用のAIエージェントフレームワークです。「汎用の」というのは、実際何でも作れるという意味です。ただし、以下のような挙動をすることに特化しています。
- AIエージェントによるチームの組成を行います。チームを束ねるAIエージェントを「リーダーエージェント」、チームに所属する専門家のエージェントを「メンバーエージェント」として、各チームがタスクを実行します。
- 各チームは自分たちの成果物を提出します。サブミッションした成果物は評価・スコアリングされます。
- 評価結果はスコアが管理されるリーダーボードに掲載されます。これらの結果を元にプロンプトが生成され次のラウンドが開始されます。
察しのよい方はすでに気づいたかと思いますが、Kaggle上で行われているコンペの仕組みを採用しています。いわゆる「コンペ型」と呼ばれるAIエージェントフレームワークです。Cursorなど複数のAIエージェントを起動して、その成果物を利用するソフトウェアが開発されていますが、MixSeekはチーム制とラウンド制を取り入れた、僕が知る限り世界で初めての本格的なコンペ型フレームワークとなります。
MixSeekは近年のAIエージェントフレームワークでよく見られるワークフローエンジンのようなことはやりません。この分野は今後大手も参入し、おそらくありとあらゆる改良が繰り返され、多くの業務特化のSaaSがでてくると想定されます。この分野は我々が参入する分野ではないと考えています。
また、マルチモーダル対応や画像生成などは、今のところ出来ません。いったん、データサイエンティスト・アナリスト・クオンツのタスクに特化して開発しています。
世の中の投資やリスク管理、シナリオシミュレーションのようないくつかの問題はワークフロー型に適しておらず、またもともと私のチームが得意としている金融の分野は特にその傾向が強いので、ワークフロー型ではないエージェントフレームワークがいくつかの分野で有用と考えています。
ワークフロー型ではないAIエージェントとは、機械学習のアンサンブル学習に近い考え方です。個々のエージェントを「弱い予測器」とみなし、複数の予測を組み合わせることで、単体では到達できない精度や多様性のある結果を得ることを目指します。
OSS化は、私がマケデコというコミュニティを主催しており、その中でもMixSeekをいろいろと触ってみてほしいという気持ちを込めて決定しました。ただ、まだ実際に動かす部分は最低限しか公開できておらず、記事後半にあるアルゴ量産部分は非公開なので、今後ハッカソンなどを企画してアルゴ量産の一部を公開する予定です。
仕様駆動開発という開発スタイル
MixSeekはGithubが提供するSpecKitを利用した仕様駆動開発を採用しています。
仕様駆動開発とは、コードを書く前に仕様を作成し、その仕様に基づいて実装を行う開発手法です。AIエージェントによる実装と組み合わせることで、仕様という「唯一の正しい情報源」を人間が管理しながら、実装をAIに任せるワークフローが実現できます。
これだけ書くと当たり前に聞こえますが、仕様駆動開発における仕様とはいわゆる設計書のことではなく、What=何を作るか / Why=なぜ作るか / How=どのような制約で作るかをまとめた唯一の正しい情報源を維持しながら開発を行うスタイルです。
具体的にどのような開発スタイルを行っているかも後述するマケデコイベントで詳細を説明したいと思いますが、気になる方は以下のリンクの中にあるファイルを眺めていただければ開発スタイルが想像がつくかと思います。これらの仕様を生成しながら実装はClaude Codeなどに任せるというスタイルです。気になる方はこちらのフォルダを覗いてみてください。
このあたりに興味がある人向けに書くと、以下のような開発フローを採用しています。
- ブランチ (XXX-spec-name) や spec-kit への指示 (要件定義) を作成
- /speckit.specify を実行して仕様書を作成
- spec.md の仕様を確認し、改善点があれば /speckit.clarify で修正
- 仕様が固まったら PR を作成して 30分程度のレビュー会を実施 ✅
- ok だったら develop にマージ
- /speckit.plan で設計書を作成
- plan の確認し、問題があれば仕様や設計を修正
- /speckit.task を実行し、実装計画を作成
- /speckit.implement で実装開始
- 6-9 の手順で設計書や実装に違和感があれば /speckit.analyst, /speckit.checklist などを利用して修正を行う
- 6-9 の手順ではレビューは必須としませんが、確認事項があればレビュー依頼を出す
- 全実装が完了したら PR を作成して Google Code Assistのレビューを受ける
- レビューが完了したら develop ブランチにマージしてチームのSlackに通知
採用した技術スタックと何が出来るのか?
MixSeekを利用する上で土台として何を利用するかの議論の結果、Pydantic AIを採用しました。
Pydanticは、FastAPIの基盤などで広く採用されている、型ヒントを活用したデータ検証ライブラリです。Pydantic AIは、このPydanticを開発するPydantic Services, Inc.が提供するAIエージェントを構築するための基盤となるライブラリです。
Pydantic AIは主に以下の理由で採用しました。
- モデルの応答をPydanticモデルへ自動変換・検証するため、期待するスキーマで確実に受け取れる。これにより後処理の手間とバグが大幅に減る。
- エージェント側で関数(ツール)を登録し、必要に応じてモデルが自律的に呼び出す。外部APIやデータベース、内部サービスとの連携が自然に組める。引数のバリデーションも行われるため安全性が高い。
結局、AIエージェントを作成してみるとエージェントはコンテキストとエラーとの戦いなのですが、ここにPydanticのアプローチを導入したPydantic AIは堅牢なエージェントを作ることに非常に貢献します。
最初は各プロバイダーのSDKを直接利用して書いていたのですが、Pydantic AIは仕様駆動開発と非常に相性が良く、抽象化レイヤーが適切な粒度であるため採用した価値が非常にあったと考えています。
では、改めてMixSeekで出来ることをまとめてみます。
- 各チームはリーダーエージェントと専門家であるメンバーエージェントで構成されます。リーダーはメンバーに指示を出しながらタスクを遂行し、成果物をサブミッションします。サブミッションはEvaluatorで評価され、結果がリーダーボードに反映されます。このKaggle式のワークフローを複数チームで並行で回すことができます。
- Pydantic AIを通じてモデルの出力を型(スキーマ)で検証し、検証失敗時はエラーにさせることができます。これにより下流処理(ランキング、DB保存、UI表示)の信頼性が高まります。
- エージェントが必要に応じて登録済みツールを呼び出し、結果を踏まえて次の行動を決められます。外部データを使った探索や評価ループの自動化が可能です。
- 出力バリデータ、ModelRetry、Logfire等の観測機能により、本番運用時の品質担保とデバッグがやりやすくなっています。
これを読んでもらえれば、なんとなくMixSeekで僕がどんなアルゴ量産をやりたいかが見えてきたと思います。
アルゴ量産に向けた基本方針: MixSeek-Bulk-Algos
我々が目指す「アルゴ量産」を行うプラグインMixSeek-Bulk-Algosの基本方針は以下のようになります。
近年ヘッジファンドの運用は、複数のポッドという独立したチームを利用したマルチマネージャー型の採用が増えています。
マルチマネージャー型ファンドとは、1つのファンドの資産を運用戦略・運用手法の異なる複数のマネージャーに分割して運用させる戦略のことを指します。以下の図 からも、2017年以降マルチマネージャー型ファンドの運用資産残高が急速に上昇しており、投資成果への信頼が高まり資金が集まっていることがわかります。

投資の世界では「単一の手法」に依存するよりも、「お互いに連携していない複数の手法から知見を濾し取る手法」が安定的な結果を生むことが知られており、この手法を採用する予定です。
では、細かくやりたいことを紹介していきます。
- まずデータについてですが、これはエージェント内に保持せず、完全に外部から与えられる設計にします。あくまでエージェントはロジックの生成に集中させるためです。ライブでも外部から直近データが入っているDBにアクセスするため、この仕様は妥当と思います。
- 肝心のリーダーエージェント。彼らには「極めて優秀なクオンツ」として振る舞ってもらいたいと考えています。単にコードを書くだけではありません。例えば論文PDFのマークダウンを渡せばその理論を実装し、WebのURLを与えればそこに書かれた情報をベースに投資アルゴリズムを構築してくれる。そんな挙動を目指しています。ここはシンプルに優秀なクオンツ型のエージェントを愚直に我々のノウハウを活かして設計します。
- 評価(Evaluation)とインターフェース(IF)に関しては、Kaggleなどのコンペに慣れ親しんだ方にはおなじみのTimeSeries API形式を採用します。エージェントが生成したアルゴリズムはこのAPIフォーマットで提出され、EvaluatorによってTarget(正解データ)との順位相関(Rank Correlation)などで厳正に評価されます。
MixSeek-Bulk-Algosが目指すのは、データ分析・バックテストだけのツールではありません。リーダーボードに登録されたアルゴリズムは、データが更新されるたびにそのままLive環境で動作し続ける仕組みを目指しています。つまり、エージェントが良いスコアを出せば、即座に実戦投入可能なポートフォリオの一部として機能し始めることを目指します。具体的にはMixSeekから生み出されたアルゴがNautilusTraderなどに連携されることを目指す予定ですが、このあたりはまだ未定です。
まぁ、実際にここに書いていることはまだ目指しているだけで、実際は最初の一歩くらいですが、マケデコイベントでその最初の一歩を紹介したいと思います。
そしてマケデコイベントに続く
次回12/26 19:30-からのマケデコイベントでMixSeekの詳細を説明します。また、現在開発中のクオンツエージェントMixSeek-Bulk-Algosにより生成された戦略の紹介とレビューも行う予定です。ぜひぜひ、皆様ご参加ください!
Discussion