[2025年7月25日] LLMは金髪ゴス少女の夢を見るか? (週刊AI)
こんにちは、Kaiです。
先週はお休みを頂いておりまして2週間ぶりになりますが、その間にAniちゃんがめちゃくちゃ盛り上がって急速に鎮静化しましたね。既存技術の足し合わせではあるのですが、大予算が投じられたであろうクオリティと、大手企業にあるまじき自由さが話題をかっさらっていった印象です。
(そして色々ナーフされて鎮静化……)
さて、エージェントコーディングではAWSのKiroが大きな話題になっています。Claude Codeに比べて、要件定義などいわゆる上流工程にかなり特化した構造になっており、補完的に使うこともできるようです。私も入れようと思ったのですが、バタバタしているうちにタッチの差で間に合わずWaiting List入りになってしまいました……残念。
Claude Codeも相変わらず人気でたくさんの記事が出てきていますが、既に基本インフラの一つになってしまった感があります。非エンジニアにも広がりつつあるのは、全ての業務の基盤になっていく可能性を感じますね。
一方、正式発表ではないので紹介しませんが、GPT-5が8月上旬に公開予定という報道も出ています。サム・アルトマンによるとこのモデルは既にOpenAI社内で利用されていて、人間が理解しがたいレベルの知性に到達している模様。ベンチマークが既に飽和している中、私たちが何を基準にしてAIモデルを選ぶのかが問われていきそうです。
では2週間分のトピックスいってみましょう。
注意事項
- 直近収集したAIおよびWeb系の記事やポストが中心になります
- 私のアンテナに引っかかった順なので、多少古い日付のものを紹介する場合があります
- 業務状況次第でお休みしたり、掲載タイミングが変わったりします
AI新着モデル、サービス、アップデート
Grok: Companion(Aniちゃん)
なんというか、「こう来るのか」という感じでしたね……。Grokのコンパニオンは、他にもBadモードを搭載して暴言を吐くなど、他の上品なBig Techモデルとは一線を画すものになっています。
AWS: エージェントIDE "Kiro"
ものすごく良さそうなので使ってみたかったんですが、間に合わなかった……。色々記事は出ているので、再公開されたら有料でも登録してみたいと思います。
(公式)
(検証、使ってみた等)
AWS: AWSサミットNYCまとめ
AI中心に大量の発表が行われたそうです。中でもAgentCoreは発表後かなり注目されており、やってみた記事もすぐに投稿されていました。 (AgentCore)
OpenAI: ChatGPT agent
リサーチをやらせてみましたが、なかなか良さそうです。ただこの領域はManusとかGensparkとか、競合が多いだけにどうでしょう。
Claude Code
Kiroの仕様書駆動開発プロセスをClaude Codeで徹底的に再現した
先述の通り、Kiroは上流工程に強みがあるようですが、Claude Codeでも工夫することで同様のプロセスを実現可能。GitHubで実ファイルも公開されています。
Claude Code メモリ管理と効率的な開発手法
メモリについては割と知られていると思いますが、開発手法はまだまだ試行錯誤が続きそうです。一つのベストプラクティスとして。
Claude Codeでセッションを探すためにccsearchを作った
これはいいですね!前にご紹介したccusageとともに使い倒したいところ。
How I use Claude Code (+ my best tips)
英語ですが、かなり網羅的なClaude Codeのノウハウ。レビュー要素もあるので、読んで損はないかと。
Claude CodeにLTスライドをHTMLで作ってもらった話
最近こういう方増えてますね。もはやプロプライエタリなソフトウェアやサービスを使う時代ではなくなりつつあるのかも。
【速報!】Claude CodeがWindowsをサポート開始!
ううーん、WSLで環境作っちゃいましたから今から移行するのは……。とはいえ新規の方にとってハードルが下がったのは事実。
その他AI系話題
AIを使っていい感じにE2Eテストを書けるようになるまで
5月の記事をスライド化ということで読みやすくなりました。やはりメンバーオンボーディングと同じようなプロセスを経るのが大事。
プロダクトマネージャーのためのAIドキュメンテーションどれがいいの?を徹底調査
エンジニア観点ではなく、PdM観点でのドキュメント生成。比較結果も載っているので面白く参考になります。
Deep Security Conference 2025:生成AI時代のセキュリティ監視
実は当社でも監視の一部にLLMを導入していますが、概ね感覚は近いですね。しかしセキュリティアラート監視用の専用エージェントを作ってしまうとは。
全部AI、全員Cursor、ドキュメント駆動開発 〜DevinやGeminiも添えて〜
ノウハウというより読み物という感じですが、「AIで職能横断チームが作りやすくなった」というのはその通りかもしれません。当社でもビジネスサイドがモックを作るなど、両者の距離が縮まった印象があります。
Docker MCP Gatewayがすんばらしい
MCPサーバとクライアントを一括管理。確かに立てるクラサバが増えてくると、管理コストだけでも大変。
AWS Documentation MCP+AWS Terraform MCP+Claude Codeで簡単にインフラ環境を作ってみる。
AWSのドキュメントを参照するのはいいプラクティスですよね。当社もIaCはかなりの部分AIに作ってもらっています。
Amazon S3 Vectors
S3がベクターデータをネイティブサポート。おお?これはいいかも。特にお値段が。 (検証記事)
推薦システムにおけるPost Processの取り組み
閲覧情報をリアルタイムのPost Processとして推薦システムに組み込むというお話。割とメジャーな手法だと思っていて、当社のサービスでも一部この手法を使っています。
Google ColabのPro/Pro+でGemini/Gemmaを定額利用可能なライブラリ
最近めっきりColab使わなくなってしまいましたが、使うときには良さそう。
AIエージェントのサービス構築を検討しているあなたへ
自前で作ることはあまりないかもしれませんが、MS謹製記事なのでさすがの情報量。Azureでの実例付き。
WEB開発系話題
React は次の10年を生き残れるか:3つのトレンドから考える
Reactは主要フレームワークの中でパフォーマンスは最悪の部類とのこと。その原因をReactが追い付けていない最近のトレンドから分析しています。知らないことも多く、大変勉強になりました。
フロントエンドのパフォーマンスチューニング
総論ではなくめちゃくちゃ具体的な改善例。
その他一般テック話題
DMMを支える決済基盤の技術的負債にどう立ち向かうか
一人で巨大な壁に立ち向かった方の記録。どうやってロジックを組み、組織を動かしていくかの考え方が示されています。
We are hiring!
私の所属するAI技術開発室では、AIを応用した医療系サービスを手掛けています。先日は以下の「CareNet Academia」をリリースしました。
積極採用中ですので、こういった医療xAIの領域に興味のある方は、是非以下からご応募ください!
Discussion