LLM分業は人のそれに酷似する→MASスキルは腐るか?
要約
MAS=マルチエージェントシステムのパラダイム展望です。
・当面はユーザは人間組織に倣ってエージェントを組閣・RAGセットアップするのが良いかもしれません。
・最後はややSF的です。意外とMASスキルは腐らない?
※周回遅れの妄想です。
※書式とか構成が阿呆です。読みづらくてすみません。
予想
-
- リアルワーカーさながらのマルチエージェントによる分業が世代あたりコスパが最強という結論が界隈で定説になる(とっくになってそう)。
-
- モデルの1.ギャラ+2.専門性(=職能)+3.味付けの三軸が昇順で多様化し需給が拡大する。
-
- 高度な職能モデルは次第に口下手に、もしくは自然言語を話さなくなり、仲介モデルが登場する。ユーザは仲介とだけ話すようになる。
-
- バイブコーダーの役割は予算配分とエージェント組閣(たまに調教・育成)、オフィス作り(RAGやプロトコルなどのセットアップ)にシフトする。
-
- LLMベンダーは、次第にこれをパッケージ化する。
根拠
-
予想1と2
- モデルは特化育成により世代×価格あたりの各分野の職能の天井を高める。
-
codexの示唆
- codexはgpt5と同社・同世代・同価格であるが開発職能が高い。
- codexはsonnet4.5よりAPI出力トークンは安価にも関わらず最も開発職能が高い。
-
codexの示唆
- 上流から下流への分業が職能コスパを高める。
-
codex-sonnet4.5連携の私的所感
- IT開発分野においてもsonnet4.5はcodexの抽象的指示を理解し実現する一定の能力がある。
- 完璧ではないですが、codexは少コストで検品が可能です。
- 開発業務の難易度(抽象度)を上流にcodex、下流にsonnet4.5と二階層で分業したところ、codexのトークンあたり成果量が体感2倍ほどに増えた。
※体感ですみません
※sonnet4.5の方がapi出力が高価だから当たり前だと思うかもしれませんが、論旨としてはsonnetの汎用性を取り外し=IT開発の専門軸におけるギャラ階層化によるコスパ向上の可能性、もしくは施工特化モデルの可能性です。またI/Oはcodexが1:8、sonnet4.5は1:5と出力の多い下流業務は割安?
- IT開発分野においてもsonnet4.5はcodexの抽象的指示を理解し実現する一定の能力がある。
-
codex-sonnet4.5連携の私的所感
- モデルは特化育成により世代×価格あたりの各分野の職能の天井を高める。
-
予想3
- 最近は賢いモデルほどI/O料金比率が広がる傾向がある。
- 出力トークンは少ないほど安価である。
- codexの説明は難しい。コスパの観点に限れば今後はこの傾向が顕著になるはず。
- sonnet4.5はcodexの説明を理解し翻訳する能力がある。
- 出力トークンは少ないほど安価である。
- 最近は賢いモデルほどI/O料金比率が広がる傾向がある。
-
予想4
- 上述から導かれる自然な予想のつもりです。
-
予想5
- これ以降はどうしてもSF的になりますが、現在APIがサブスクより割高なのは製品利用との棲み分けに見えますし、その延長ですとベンダー側が最新モデルを単体で提供する経済的合理性はそこまで見当たりません。ただ金融市場や政府・ユーザの思惑などでどう転ぶかはさっぱりです。談合・合併が一番ダークですが、各社が競争してくれているうちはそう単純には運ばなさそう?
まとめ
差し当たりMASは組閣ゲーになる
過渡期である当面はユーザは多様化する最新モデル事情への精通と案件に基づいた組閣(もしくは調教)、オフィス作り(RAG参照先のセットアップ)スキルが大事でしょう。
MAS組閣は人間のそれを模倣するのが良さそう
例えば私は趣味でバイブコーディングでギャルゲーを作っておりますが、インディー規模でさえ予め管轄:デザイナー、プログラマー、ライター、総監督でRAG参照先を棲み分けていればもっとスムーズに進んだろうと痛感します。単純に各コンテキストが持つべき情報を整理できますからね。その下に作業員エージェントを配置するような感じですね。
この辺りの組織構造は何が正解か分からないので面白いですね。
今後、LLMの発達と共に案件の規模が大きくなるほど組閣と管轄、分業の重要性が増すでしょう。
最後はどうなるんでしょうね?
次第に組閣もオフィス作りもエージェント化するでしょう。ベンダーに最新モデルも経済土俵も占有され完全に腐る未来も考え得りますが、たぶんそう単純には転ばないかな?意外とMASスキルは腐らないかも。
おわりに
拙稿ご拝読ありがとうございます。反論反証お待ちしております。
余談
日本は計算資源とLLMノウハウにおいて成すすべもありませんが多様化するデータセット需要に応えることはできそうですね。
仲介役はミドルマンと呼ばれそうな気がします。かつて各自治体には知識人の主張や政治情勢などの難しい話を一般人に向けて嚙み砕いて説明する人々が居たそうな。彼らをミドルマンと呼んだそうな。まあ単に直訳でもありますけどね。
くそ余談
今後LLMは兵器になるだろうなと思います。ベンダーと官僚が倫理的努力をしているのは分かりますが、OpenAIのテックリードを他社は速攻でポリシーガバガバの良コスパモデルを提供している様子を見るに、ノウハウはすぐパクられあとは米中と資本の計算資源の暴力となるでしょう。これも日本には成すすべがありません。核兵器は一度落ちましたからね、その後に協定でも結ばれるんでしょうか。怖いですなぁ。職能はあるがIQが無い点をMITが頑張ってるのは幸いですが上の当てにはなりませんね。
Discussion
補足、5について
最新モデルのMASパッケージ化とは、コア技術である最新モデルへのアクセス手段を、例えば現在のWebUIのような窓口に限定しユーザフレンドリーに囲い込むような事です。素人の使用感は今のチャッピーとなんら違いは無い、というような。既にあるOpenAIのモデル選定・思考モードの自動判定がその予兆かな?どちらかと言えばApple気質ですよね。そうして他社は玄人ユーザやトラスト系需要を向くのかな?妄想です。