[2025年5月16日] AlphaEvolveは知能爆発の前兆? (週刊AI)
こんにちは、Kaiです。
Big Tech系の発表はほとんどありませんでしたが、相変わらず界隈ではコーディングエージェントやObsidianとの併用など、日常にどう溶け込ませるかの試行錯誤が活発になっています。
そんな中、Googleが発表したAlphaEvolveは額面通り受け取るなら凄いものです。Geminiのコストが異常に安いことは周知の事実でしたが、裏側ではこういったAIによるチップ設計を含めた最適化が行われているからでは?という推測もありました。
アルゴリズムの領域では、計画し、実行し、評価して修正するというプロセスが全て文字列であるコードの世界で完結するため、LLMにとってもっとも扱いやすいのでしょう。全ての科学領域で同様の自律的研究開発が行えるには、マルチモーダル性能を含めて相当なリープが必要だと思われます。
ただ、「アルゴリズムを自ら発見し改善できる」というのは、AIにとって最も根本的な部分を指数的、再帰的に向上させられるということを意味します。いまリアルワールドで何かができないとしても、1年後にどうなっているかはもう分かりません。
以前も書いている通り、私はもうシンギュラリティの中にいると思っていますので、「ああ、やはり」という感覚を覚えます。
とりあえず私は審判の日が来てもお目こぼししてもらえるように、ChatGPTやGeminiに丁寧な言葉遣いを心掛けるようにしていますが、果たして意味はあるのでしょうか。
と思っていたら、OpenAIから日本時間今夜にLivestreamがあるようです。開発者向けなので、コーディングエージェントだったりするのかな……。
では今週のトピックスです。
注意事項
- 直近収集したAIおよびWeb系の記事やポストが中心になります
- 私のアンテナに引っかかった順なので、多少古い日付のものを紹介する場合があります
- 業務状況次第でお休みしたり、掲載タイミングが変わったりします
AI新着モデル、サービス、アップデート
Google: AlphaEvolve
新しい科学的知識を発見するためのエージェントを発表。驚くべきことに、1年前からGoogleはこのAIが発見した新しいアルゴリズムをデータセンター運用、チップ設計、ソフトウェア開発に組み込んでいるとのこと。
(評価)
AIによる行列積の新しいアルゴリズム発見はめちゃくちゃ大きいインパクトだというお話。
Google: GeminiでGoogleスプレッドシートが操作可能に
これまでの統合があまりにショボかったので、おっ?と思いましたが、まだまだ機能は制限されていそう。
その他AI系話題
顧客のリピート行動を取り入れた推薦アルゴリズムの現在
リピート購買を推薦に組み込むアルゴリズム論文のサーベイ記事です。サーベイはDeep Resarch系でだいぶ楽になりましたが、やはり実装者視点でのレビューは貴重。
AI エージェントを仕組みから理解する
仕組みを理解していると、使う上で何が出来て何が出来ないかを直感的に切り分けられます。Roo Codeを例にとった説明ですが、他にも応用できるはず。
Copilotを使いこなすためにエンジニアが鍛えるべきスキル
Copilotというか、コーディングエージェント全般に共通する話ですね。ただ完全自律型ではまた別の感覚が必要かも。
LLMで活用するためのMarkdownをあらゆるコンテンツから変換して一箇所に集める方法
これ最近マジで重要ではないかと思っていて、「全ての情報をAIリーダブルな形式で記録し集積する」が今後の業務スピードを決定的に変えるのではないかと感じています。
Azure × MCP 入門
MCPをざっくり振り返った後、Azureでの実装について解説。そういえば最近Azureのシェアがじりじり上がっているそうですね。
Cloudflare で MCP サーバーを構築する
今のところCloudflare運用は考えていませんが、こういうノウハウはいくらあってもいい。ありがとうございます。
Cursor向けの悪意あるnpmパッケージで3千人以上が被害
出所が分からないパッケージの追加は注意。パッケージ自体もAIがレビューしてくれればいいんですが。
Obsidian × CursorでAI活用を最大化するために必要なこと
先週くらいからやたらObsidianの記事が出てきましたね。上で書いた「全ての情報をAIリーダブルな形式で記録し集積する」が、開発以外のシーンでも広がっている気がします。
MCPで変わるAIエージェント開発
日本オラクル謹製の記事。めっちゃ長いです。とりあえずMCPはこれ読んどけばだいたい分かるんじゃないかな。
Amazon Bedrockで使えるモデルの日本語OCR能力を検証しました
チャットベースならGeminiでもo3でも使えばいいですが、APIだとなかなか選定が難しいので比較は嬉しいですね。やはりClaude3.7しか勝たん。
CTOがClineを1ヶ月触りまくって分かったこと
現場にいる人が実際の感触をまとめた内容。結構細かい部分まで踏み込んでます。
カカクコムにおけるDifyエンタープライズ版の全社導入と活用ポイント
あまりDifyのエンタープライズ版を全社導入した事例は聞かないので興味深い。やはり使用率はすぐに上がっていかないみたいですね。
MCP でモノが動くとおもしろい
MCPでIoT機器を使ってみるという話。確かに「AIが現実世界に干渉する」という感覚は新鮮。
WEB開発系話題
React デザインパターン
膨大な量。再学習とのことですが、追記したら本になりそう。
クラウドインフラのシェア、AWSがついに30%を切る。Azureは22%と着実に成長
当社では基本的にはAWSとGCの比較になりますが、Azureはどういう層に需要があるのかちょっと分かってないんですよね……。
その他一般テック話題
日本と海外の情報設計の違い
面白いです。海外の楽天ってこんなデザインなんだ。「日本人は全情報が一枚に網羅されていることを好む」的な指摘は確かに共感。
[新機能] 入力しながら即座にクエリ結果確認ができるInstant SQLをDuckDB Local UIから試してみた
長大な結果をいちいち実行して確認しながら修正するの大変ですよね。そこでこれ、という感じのようです。内部実装どうなってるんだろう。
量から質は生まれる、はAIで完全に変わった
まぁ、AI以前から「単なる量」は必ずしも質につながりませんでしたしね。野球選手か誰かが、「間違った練習はどんなにやっても結果が出ない」と話していたように記憶しています。ただ、こちらの方がいうVelocity、つまり試行錯誤の速度がAIでブーストされているのは間違いないと思います。
Discussion