[2025年5月9日] 旅のおともにo3を (週刊AI)
こんにちは、Kaiです。
ゴールデンウィーク明け、皆様いかがお過ごしでしょうか。私は6月にもゴールデンウィークを設けることを政府に提案したいと感じています。
連休中、私もちょっとした旅行に出ていたのですが、美術館や博物館などに寄った際、AIを可能な限り活用してみるという方針を取ってみました。これが大正解で、以前までは鑑賞しながら心に浮かんだ疑問を忘れるままにしていたところ、AIとのディスカッションをログとともに残すことができました。
特に、両界曼荼羅の解釈、密教における三身説とキリスト教における三位一体の相同性、相違点、そして原始宗教から理論化・組織化の過程で必然的にこういった信仰の機能分離が行われるか否かについて、マックス・ウェーバーを絡めながら議論し理解を深められたのは、これまでにない経験でした。
これをもしAIなしで真面目に調べて理解しようと思えば、それこそ何時間も何日もかけてWikipediaや文献、書籍などを読み込む必要があるでしょう。しかし、いくら興味があると言っても、専門家になりたいわけではありません。「ざっくり、概要を掴みたい、そして疑問を解消したい」というニーズなのです。
そういう観点で、AIは非常に有用でした。旅の体験を広げてくれたと言えます。ただ、もちろんハルシネーションや、前に書いたエコーチェンバーには留意しなければいけません。AIが圧縮している情報量は、私に合わせたかなり表層的なものに過ぎず、それを読みこんで議論したとて専門家になれるわけではありません。
ただ、美術館・博物館で出会った事物の理解を深め、教養を得るという観点では、素晴らしいパートナー(教師)であると感じました。これは、恐らく森羅万象に応用できるものであり、自然の中を歩けば山川草木を、街を歩けば亭台楼閣を、直ちに知ることができるのです。特にo3の画像認識能力は非常に高いので、写真を撮って質問し、知識を深めていくことも可能でしょう。
日々コーディングやリサーチなど、言語的・直截的タスクに偏っていた使い方ですが、この旅行を通じて「人生の解像度を上げてくれる教師」としてAIを捉え直すことができました。
さて、それでは連休中のトピックスです。
注意事項
- 直近収集したAIおよびWeb系の記事やポストが中心になります
- 私のアンテナに引っかかった順なので、多少古い日付のものを紹介する場合があります
- 業務状況次第でお休みしたり、掲載タイミングが変わったりします
AI新着モデル、サービス、アップデート
Qwen3
ベンチ上、最大の「Qwen3-235B-A22B」ではo1に並ぶレベルとか。小さいモデルは公開されているのですぐ使えます。ただ、ベンチスコアってもはやあまり役に立たなくなってる気がするんですよねぇ。
OpenAI: 買い物機能
検索とのガチ競合ですね。o3はWeb検索とシームレスに統合されていますので、この流れは続くでしょう。あとは広告がどう入って来るか、ですね。
OpenAI: GPT-4oをロールバック
「忖度しすぎる」アップデートであったとのこと。サイレントナーフではなくちゃんとアナウンスするの結構珍しいような。
OpenAI: Windsurfを買収
これはまた。Cursorにも色々な企業が関心を示しているという報道もあります。
OpenAI: 営利化を断念
営利法人への転換を取りやめ、非営利法人が経営権を持ち続けるとのこと。投資しているMSやSBなどの動向も注目です。
Amazon: Nova Premier
競合する他モデルに劣らないということですが、ちょっと使いどころが分からないですね……。どれくらい本気で独自モデルに取り組む気があるのやら。
Anthropic: Integrations / Advanced Research
外部MCPサーバに接続可能なIntegrationsに、最大45分間の深いリサーチ(社内情報も可)を行うAdvance Researchが登場。Anthropicはやはり、業務に溶け込ませるAI、というコンセプトを採用していくようですね。
その他AI系話題
Cursor/Devin全社導入の理想と現実
実際にどのプランを選択し、どのように使って課題が出てきたかのレポ。Devinはそろそろ当社も導入しようと思っていますので、参考にします。「成熟するまで様子を見ようは超危険」はその通りかと。
OpenAI o3, Claude 3.7 Sonnet , Gemini 2.5 Proの評価と解釈[2025年4月版]
ベンチとリーダーボードまとめ、という感じです。上にも書いた通り、そろそろベンチスコアはあまり使えなくなってきている気もしますが……。
BedrockナレッジベースでAuroraを使ったハイブリッド検索サポート!日本語でもいけるの??
おっ、と思いましたが、この方の結論としては「日本語はダメっぽい」という感じです。
ローカルで動かせる日本語TTSをいろいろ試す
ポコポコ出てきているのは知っていましたので、こうして比較してくださる記事はありがたい。「ダメ」としているものも、これはこれで味があるかも。
MCPでのデータベースとの対話+資料化
BigQueryに接続してデータ解析を行う例。とても分かりやすい。ただ、大規模データになると多分コンテクストウィンドウ超えちゃうと思うんですよねぇ。(現在進行形で困ってる)
ClineとDDDと私
Clineへの指示内容、生成されたコードを全て公開してくださっていてめちゃくちゃ参考になります。皆さん同じことを書かれてますが、結局ジュニアエンジニアとペアプロしてる感覚でやるのが良さそうですね。
AIエージェントを使って実際にアプリ開発→リリースした経験・知見を共有する
Claude Codeを使って実際にリリースしたアプリの経験。やはりこの方も、AIをツールではなくチームの一員として捉えていくことの重要性を述べています。かなり具体的なノウハウも示してくださっています。
AIコーディングエージェントClineとAWS MCP ServersでAWSを使ったシステムのレビューと機能追加してみた
おーこれは割とすごい。ClineのようなエージェントとMCPが合わさると、出来ることの幅が一気に広がる感じがします。
AI Coding Agent を使うことで、怒り狂い、視座が上昇する話
「こいつはプログラミングのルンバだ。掃除をさせるのではなく、掃除しなくてよくなるような振る舞いを人間に叩き込む機械なのだ。」これめちゃくちゃ同意。結果的に部屋がきれいになる。
FastMCP での MCPサーバ と MCPクライアント の構築を試す
サクッとMCPサーバ・クライアントを作れるパッケージ。周辺領域のツールも増えてきて、いよいよ基盤技術になってきた感じです。
Cursor ・ Github Copilot ・ Windsurf ・ Cline の料金プランまとめ
選定・乗り換えに便利な一覧表。
顧客サポートAIが暴走してコードエディターAI「Cursor」開発企業の評判がガタ落ちに
Cursor開発企業のサポートAIが誤った回答をしたとのこと。多段AIレビューとかやってるかと思ったんですが、コストの問題で一発出しにしてるんですかね。上場企業的にはちょっと怖い感覚。
LLM時代の海外旅行
冒頭でも書きましたが、旅行のおともにAIを活用すると本当に世界が広がります。みんなやってほしい。
バイブスでコーディングする難しさ
海外企業が行った3つのAIコーディングスタイル比較実験が面白いです。結局、丸投げではなく伴走してチームのように開発するスタイルが、設計も品質もよいものが出来た、ということです。
AWS、AIエージェントがGitHubのコードを読んで開発やレビューを行う「Amazon Q Developer in GitHub」プレビュー公開
他のエージェントのようにコードエディタに組み込むのではなく、GithubそのものAppとして組み込むストロングスタイル。ちょっと面白そう。
AI 2027
AI界隈でかなり話題になっていた、2027年までにAIを中心にどう世界が変わるか、の詳細なシミュレーション。最後に選択肢が提示され、選ぶとさらに未来の物語が展開されます。半ばSFじみていますが、このうちの一部は確かに実現されるのでしょう。特に米中のAI技術競争など。
WEB開発系話題
そのWAF、本当に効いてますか?
あっ、はい、すみません確認します。
まぁ冗談は置いといて、ちゃんと環境に合わせて設計しましょうね、鵜呑みはだめですよというお話。確認ポイントも書いてくださってます。
実践Webフロントパフォーマンスチューニング
冒頭に「マジのガチの実践」と掲げている通り、めちゃくちゃ実践的に何バイト削る、何文字削るみたいな内容です。基本的な部分も多いですが、全部完全に出来ているWebアプリは多分ほとんどない。
[アップデート] AWS Lambda のログが CloudWatch Logs の Vended Logs としてサポートされるようになり、今後は使用量に応じた従量制割引が適用されたり S3 や Data Firehose も出力先に選択できるようになりました
これはいい!5月2日にアナウンスされたようです。
その他一般テック話題
シャドーロール:AWSのデフォルト設定がサービス乗っ取りの扉を開く可能性がある
デフォルトのIAMロールに危険な設定が含まれる場合がある、とのこと。サービス設計に合わせてデフォルトロールもちゃんと見た方がいいですね。
「パスワード」から「パスキー」への移行はなぜ難しいのか--パスワードなき未来への課題と期待
確かに、技術に明るくないユーザにとってパスキーの体験は不安を掻き立てるものかもしれません。ただ、パスワードはどんなものでも、もはや安全ではなくなりつつありますので、ユーザ側の意識変化が必要ですね……。
おまけ
ドイツの肉屋で1年間働いてみた
あまりにも熱量が高く、読みやすく、一つのエッセイか私小説を読んだ気分になったのでご紹介。異国の地で悪戦苦闘し、涙と汗を流し、少しずつ世界との調和を取り戻していくような、読後に清々しさを感じる文章でした。
Discussion