[2025年9月12日] AI小作人にならないために (週刊AI)
こんにちは、Kaiです。
Codexのアップデート速度が凄まじいことになっています。Claude Codeというお手本もあり、ほぼ機能的には追従してしまったのではないでしょうか。先日のAnthropicの資金調達といい「ジェネリックなAIプロダクト」は完全に資本力で殴る世界になってしまっています。
今週もAnthropicがExcelやパワポを直接作成・編集する機能をリリースしました。精度やデザインはまだまだ発展途上ですが、恐らくこれも大資本力同士の競争が行われ、一瞬で類似のことを試みていた小規模スタートアップは焼き払われてしまうのではないでしょうか。
少し前、デジタル小作人という言葉がありました。GAFAMをはじめとする米国のBig Techに資本と利益が集中し、日本の貿易収支におけるデジタル赤字が莫大な額になっていることを揶揄した、自虐的な言葉でした。
現在、AIの領域では米国と中国が覇を競っており、正直その他の国々は存在感がありません。では、近い将来AGI/ASIが実現したら、富の集積はどうなるのでしょうか?
遠い将来のことは、残念ながらまだ霧の中です。イーロン・マスク氏の言うように、数十億体のヒューマノイドロボットが地球と火星であらゆる仕事をしてくれる世界が来たとき、人類がどのように生きるべきなのかは、どちらかというと哲学の領域かもしれません。
一方で、ここ数年、或いは10年程度を見据えたときに、AI小作人にならないために私たちはどう振舞っていくべきかは、まだ想像の余地があると思います。私見ですが、まず先述の「ジェネリックなAIプロダクト」は日本語のローカライズも含めて、残念ながら全てBig Techがかっさらっていくと思います。
だからニッチ戦略だ、と各所で言われていますが、ニッチとは何でしょう。業種?業態?規模?一つの考え方は、少人数のチームで少人数向けのサービスを作ることでしょう。AIによって、一つのサービスをとりあえず形にするのに必要な人数はかなり減りました。たとえば3人のチームで、世界で1万人が熱狂して使うサービスを作れれば、とりあえず持続可能になりそうな気がします。日本人は突き詰めたモノづくりも割と好きだと思うので、これも一つの道です。
もう一つは、データのニッチではないかと思います。AIの基盤モデルが進化したとしても、学習データにもオープンになっていないデータにも含まれていないものは考慮できません。そういったクローズドなデータへのアクセスをいかに確保するか、これがポイントになるように思います。
先日、Geminiがオンプレミスサービスを発表しました。つまり、「単純にクローズド環境でローカルLLMを提供するサービス」もまた、Big Techに焼き払われる可能性が高いです。とするならば、非常に泥臭い話ではありますがそれらクローズドデータを個別交渉により収集・共有・構造化して、ニッチ領域でのデータ基盤を作り上げることが、AI小作人から脱却する道の一つではないかと思います。
では冒頭ポエムはここまでにして、今週のトピックスです。
注意事項
- 直近収集したAIおよびWeb系の記事やポストが中心になります
- 私のアンテナに引っかかった順なので、多少古い日付のものを紹介する場合があります
- 業務状況次第でお休みしたり、掲載タイミングが変わったりします
AI新着モデル、サービス、アップデート
OpenAI: Codexアップデート
日どころか時間単位でアップデートされているので、ここで何が実装されたか書いても意味なさそうです。ということでリリースノートを見に行ってください。Claude Codeの機能にどんどん追従しています。
OpenAI: 開発者モード追加
リモートMCPサーバをフルサポートするモードとのこと。危険なのでMCPやコネクタを理解している開発者向けのベータリリース。
Google: 「Google スプレッドシート」で「Gemini」が使えるAI関数、日本語を含む7カ国語に対応
ほとんどのAI業務改善は(技術的には)Googleスプシで実現できるのではないかと思っている派です。
Google: Veo 3アップデート
機能面もさることながら、めちゃくちゃ安くなりました。資本力。
Anthropic: ファイル作成機能追加
Excelやパワポなどを直接作成・編集できるようになったとのこと。ただ、デザイン力などはまだまだのようです。
(感想など)その他AI系話題
信頼できるLLM-as-a-Judgeの構築に向けた研究動向
LLM-as-a-Judgeは部分的に当社でも活用しています。やはり出力のブレはどうしてもついて回るので、使いどころには工夫が必要。サーベイ論文をもとにした最新の研究動向の整理記事。ノウハウというより、問題提起と傾向を掴む内容。
オブザーバビリティが広げる AIOps の世界
多分に宣伝も含まれていますが、AIに何の情報を与えられるかが出力精度に直結するため、確かに良さそうなプロダクトだと思います。
Claude Codeを用いて仕様書の自動更新の仕組みを構築した話
こういうところこそAIの出番ですよね。スラッシュコマンドでの更新にしていますが、StagingへのデプロイをHookにしたさらなる自動化とかも可能そうです。
OpenAI、LLMの「幻覚」についての論文公開 「評価方法の抜本的見直し」を提言
この論文はかなり話題になっています。現状の評価方法は、ざっくり言うと「正解は1、誤りは0」ですが、これだと原理的にハルシネーションを回避できないとのこと。「正解は1、回答不能は0、誤りは-1」といった、新しい評価方法への移行が必要だとしています。
GitHub、自然言語でGitHub Actionsワークフローを記述可能にする試み。生成AIで自然言語をYaml形式にコンパイル
自然言語での記述は夢がありますが、自然言語自体の不正確性と、LLM自体の不正確性の相乗効果をどう解決するのかな……。
社内データを活用した推薦タスク向け基盤モデル開発
私たちのチームで取り組んでいるのはシングルサービス内の推薦ですが、複数サービスを横断した共通ベクトル化(マルチモーダルも視野)というのは面白くかつ難しい課題だと感じます。いずれ取り組んでいきたい。
″仕様駆動開発″というプロンプトを外付けするSpec Kit
Kiroで話題になった仕様駆動開発を外付けできるGitHubのOSS(Claude Code/Gemini CLI/GitHub Copilot対応)です。よくまとまっていますので、とりあえずここを読めばKiroを使わなくても試せるはず。
AIエンジニアリング入門:Pythonによる開発の基礎(uv, Ruff, dataclass, Pyright, Git hooks)
「入門」と銘打っていますが、普通にベテランエンジニアが知識をアップデートするのにも役立つ記事でした。
OpenAIのAIリリース年表
nkapaさんが随時アップデートしているやつです。AIの進化速度やアップデート速度に疑問を持つ人にはこれを見せてあげればいいんじゃないかな。
Playwright MCPを使ってE2Eテストを楽に書く
いいまとめでした。Playwrightは以前の記事でも取り上げていますが、実事例でのユースケースはまだ少なかったように思います。
WEB開発系話題
ZOZOマッチのアーキテクチャと技術構成
組織的背景も含めた、かなり詳細な技術選定の内容と理由がまとまっています。これから新サービスを作ろうとする場合には結構参考になる部分も多いかと思います(ある程度成熟した開発体制が前提ですが)。
AWSのリージョン間のレイテンシ
マルチリージョンで作るときや、低コストなリージョンにバッチを退避させるときなどの参考に。数値よりもこうしたイメージの方が直感的です。
その他一般テック話題
デプロイを任されたので、教わった通りにデプロイしたら障害になった件 ~俺のやらかしを越えてゆけ~
めっちゃ面白い。こういうやらかし話、恥ずかしいんですが面白いし参考になるのでいっぱい増えて欲しい。中身はなるほどなぁ、という納得感あるものでした。
We are hiring!
私の所属するAI技術開発室では、AIを応用した医療系サービスを手掛けています。先日は以下の「CareNet Academia」をリリースしました。
積極採用中ですので、こういった医療xAIの領域に興味のある方は、是非以下からご応募ください!
Discussion