CEO,プロダクトオーナー体験ゲームの紹介、あるいはMGX.devをゲームとして楽しむ話
注意(?)
これはAI驚き屋的な記事ですが、正しく「驚き」でしかないという結果なので安心してください(?)
昨日、MGX.devというサービスを試してみました。
これはいわゆるDevinみたいなサービスで、SaaS形式のプロンプトで開発作業をおこなうAI Agent万能作業サービスです。課金はVM時間でなく、LLM呼び出し回数っぽいです(よくわからんが)。
面白い点として、「Team leader」「Engineer」などの様々な役割をもった別のAI Agentプロセスがおり、それらが協調しながら作業が進むという所です。
(結構辛辣なプロンプトかいてるが、この時点で私はもう「これはゲームだわ、軍隊式マイクロマネージCEOのRPでいくぞ!!」となっています)
AI Agentにある程度くわしくなると「やってみたらできんじゃね?」って思う典型的なアイディアですが、Freeプレイで指示をだしたら協調?動作を始めるので、実際に形になってる!すげえ!っておもって課金プレイです。
結論、まだまだ完成度は低いので仕事で使うモノではないですね。
しかしながら、トンチキでおもしろかったので、シェアするしかねえ!となりました。
たぶん、このゲーム(?)をうまくクリアできるなら、あなたはCEOやPOとしての才能があるのではないでしょうか?(そういうのの練習ツールとしても良さそう)
そして運がよかったら、プロダクトが完成します(いや、それが本来の目的なのだが)
さて、自分のツイートをまとめただけの記事だとどうかと思うので、AIでまとめ直しました。
以下、AIで書かせたので、若干意味不明な所がありますが、ご了承ください。
===
仮想CEOの挑戦記
これはMGX.newを仮想チームを管理しながら技術的な課題に取り組む、「経営ゲーム」として楽しみ、Xでその過程をたくさん投稿しました(@uzulla)。以下に、その体験をブログエントリとしてまとめます。
MGXのプレイを始めた初日、開発環境のスクリーンショットを投稿しました:
「MGXのプレイ風景(面白みのない当たり障りのないスクショ)」
この画像は、ブラウザウィンドウと開発者ツールが開かれた、典型的な開発環境を示していました。MGXでは、仮想チームと協力してプログラミングやシステム管理のタスクに取り組む必要があり、複雑な作業が待っていることを予感させました。
最初のプロジェクトは私がつくったpod-tenukiというポッドキャストツールの動画版をつくってくれ、という依頼でしたが、初期にPRDに口出しを大量にすることになり、「あ、これはそういうツールじゃないんだな」となってしまって、萎えて数時間放置しました。
が
その後また時間ができたのでもう一度画面をひらきました。
そもそも「設定上、俺はCEOだし、「こういうのつくって」だけいえば出来るツールなのだから、PRDにいちいち口出しするのがマズいのでは?」と思い直したからです。
ということで、GUIがあると面倒そうなので、PHPのコードマイグレーションツールをかいてみてもらうことにしました。なお、この時点で「完成はせんやろな」という感じで、あまったクレジットで遊ぶ感じです(やったことがあることなら、評価できるな、という感じ)
送ったプロンプトはこれだけ
PHPのウェブアプリケーションで
Guzzle version 3 を利用して書かれたソースコードを
Guzzle version 7 で動くようにソースコードを修正・リファクタリングするツール
を開発してほしい。
(この時点で、「PHPのウェブアプリケーションで」とミスしていたが、後の祭り。正しくは「PHPのウェブアプリケーションの」ですよね…)
画面だとこんな感じで、Mikeという人がTLらしいです
あとはAIがわちゃわちゃしているのをみているだけです
なんやかんやイテレーション(?)はすすみます。なんでかSPAがあって「あっ、俺の最初のプロンプト…」ってなったり(プロダクトオーナーがちゃんとみてないとこういうのありがちですよね)、なんかMikeからの質問を無視してたり、データアナリストがなぜかDockerの調査してたりするのをほほえましく見る感じです。
で、インテグレーションテストが必要なフェーズっぽくなりました。
私「テストしてね」
Mike「どうやってテストしますか?」
そんなもん経営層の俺が考える事ではないだろうが、エンジニアが考えてくれよとおもいましたが、Dockerでやったらええんちゃう?とレスして放置しました。
で、ここで仮想エンジニアのAlexが直面した問題に気づきました。彼はsudo権限のないLinux環境で作業しており、Dockerのインストールすらできない状況でした:
「まあ、そんなもんか。AlexはsudoのないLinuxで作業させられていてかわいそう。」
スクリーンショットには、タスク管理インターフェースが映っており、私に「sudoとDockerが使える環境を準備する」タスクが割り当てられていました。Alexの苦労に同情しつつ、リアルな技術的制約がゲームに反映されていることに感心しました。
Alexの作業を進めるため、CEOの私はLinuxが得意なので具体的な指示を出すことにしました。すると、意外にもタスクが成功しました:
「と、おもったら具体的に指示したらできた。仮想会社のCEO(私)よりLinux詳しくないエンジニアAIは交換してほしい…」
この投稿では、AlexのLinux知識が私(仮想CEO)より劣ることに少し不満を感じつつ、指示の明確さが重要だと学びました。
さらに進めると、システムがiptables(Linuxのファイアウォールツール)で問題を起こしていることが判明しました:
「iptables周りでコケてるから、QEMUかなにかの仮想環境の上に乗ってるなこれは。」
この技術的な観察は、MGXが仮想環境上で動作していることを示唆し、ゲームのリアリティを高めていました。
チームリーダーとエンジニアの進捗報告が一致しない、職場でよくある状況に直面しました:
「チームリーダーとエンジニアの言ってること(現状報告)がズレてるのがリアルで笑う。」
このユーモラスな状況に笑いつつ、チームリーダーを無視して直接Alexと会話することにしました:
「チームリーダーをシカトして、Alexと会話を始めた。」
仮想CEOとして、チーム管理に深く介入し始めました。特に、データアナリストのDavidが本来の仕事以外のタスクに手を出していることに気づき、注意しました:
「データアナリストのDavidが暇すぎて環境構築確認をしてるから『貴様の仕事はそれではない、タスクをやめろ』などといいだし、仮想CEOがTeamLeaderを無視してマイクロマネージメントを始めている。(注意:私はMGXを経営ゲームだとおもって作業しています)」
このロールプレイは、ゲームの没入感を高め、楽しくもありました。
調査を進めると、エンジニアがチケットの更新を忘れたことが、進捗報告の混乱の原因だとわかりました:
「エンジニアがチケットの更新を忘れたのが原因だが、チームリードが仮想CEO(プレイヤー)に進捗報告が正しくできず、仮想CEOがエンジニアに確認したら全然違うことになってるし、実はエンジニア作ってるものもなんかまちがってるし、お前はなにやっとるんだ、というロールプレイになっている。」
この状況は、実際の職場でのミスコミュニケーションを忠実に再現しており、ゲームのリアリティに驚きました。
問題の解決に向けて、チームにガン詰めしはじめました:
「詰問してる。」
しかし、Mikeにとっては運良く、このタイミングで$20分のクレジットがつかいはたされ、ゲームが中断してしまいました。
「売り切れ。ゲームオーバーです。」
使用量のサマリー画像では、割り当てられたクレジットをわずかに超えたことが示されていました。
MGX.devの体験を振り返り、以下のように総括しました:
「感想:AIが相互にやりとりする、と言う仕組みは(ゲームとして)面白い。無駄が多すぎるしプラン的にまともな物を作らせたいなら$200プランが必要そう。決済がAmazon Pay(米国)なのがめずらしい『ゲームとしては』面白い。実用したいなら、普通にDevinを使った方が良いと思う。」
AI同士の相互作用はゲームとして魅力的でしたが、効率性には課題があり、実用目的には他のツール(例:Devin)が適していると感じました。それでも、ゲームとしての楽しさは十分に味わえました。
まとめ
MGX.devは、技術的な課題とチーム管理をゲーム形式で体験できるユニークなプラットフォームです。sudo権限のない環境での苦労や、チーム間のコミュニケーションのズレ、Alexに私が質問したら、なぜかMikeがズレたレスをして、その後にAlexがまともなレスをする、みたいな実際の職場を思わせるシナリオが満載でした。
仮想CEOとしてマイクロマネジメントに奔走し、クレジット切れでゲームオーバーになるまで、笑いと学びに満ちた時間でした。
興味がある方は、ぜひMGX.devを試してみてください!
というか、「金をかけるほどは興味ない」とおもっているなら、私がおごるんで、このゲームプレイしてみませんか?
真面目な話
AI Agentによる協調での問題解決は多分だれもが考えるアイディアですが、速度をだすために「非同期にするとどうなるのか?」を一定のレベル・形で実現した例だと思います。そういう意味では体験して良かったと思います。凄く勉強になりました。
多分、同期を取る仕組みをちゃんと作りきらないとやらないほうがよいアイディアなんだなとなりました(MGXでは、口答指示やファイルにチェックリストをつくったりしてやっていた)。Mike(チームリーダー)にめっちゃ詰めてもAlexとのやりとりにタイムラグがあり、いつまでもPjの整合性がとれない感じがつづきました。
ただ、AI Agentがバラバラなのに、チャットのリセットは同時なのは「やってみた結果、それが良い」となったんですかね?あと、チャットログも全部はのこらないのがうーんとなりました(UI的にどこにあるのかわからん)。
「Remix」という仕組みで、ある時点から新しいセッションを開始して〜という実装になっていました。
UIの出来はよいところと悪いところが混ざってますね、Editorがないので編集はできないのは微妙です。でもまあCEOがファイルいじったらダメだよな。
ただ、DLできるファイルマネージャがあるのでDevinほど辛くもない、みたいな感じです。
プランニングフェーズは見てて面白いです、PRDでmermaidがかかれたりしてるのは盛り上がります。単純にカッコイイ。ただ、それをみるのもAIなので若干「演出」感はいなめませんでしたが…。
ただ、そこでCEOをいれて全体会議で止まるわけでもないのはどうなのかな…(さっさと実装にすすんでしまった)
なお、LLMなんで、日本語でやってといえばある程度は日本語でやってくれます。ただ、ネイティブランゲージにはならないですね、英語がネイティブです。
一応デフォルトのLLMとしてはClaude Sonet 3.5でうごいているので、コード自体はまともです。ただ、ファイルの配置は結構ひどいもので、「整理してくれないかな…」ってずっとおもってました。READMEすらかかないのはどうなのか。
GitHub連携もあるっぽいですが、怖くて私はためしていません。
という感じ。
一週間に何度も驚きのある時代でたのしいですね!
こちらからは以上です。
Discussion