[2025年2月13日] もう全部Deep Reseachでいいんじゃないかな (週刊AI)
こんにちは、Kaiです。
週刊とはいったい……何とかせねば。
さて、もうDeep Research一色です。私もついにProプランを契約して、使い始めました。
あまり驚き屋のようなことは言いたくないのですが、本当にこれは凄い。何度も試すうちに、少なくなったもののやはり固有名詞などでハルシネーションが発生することは確認しました。ですので、人間を完全に代替するとはいきませんが、デスクトップリサーチの一次タスクとしては十分すぎるレベルに達していると感じます。
あらゆる用途に使えるのはもちろんですが、特に「勉強」のやり方が全く変わるのではないかと感じています。これが好奇心MAXだった小学生の頃に使えたら、どれほどの質問を投げてどれほどのことを学んだのだろう、と想像してしまいます。
ただ、Deep Researchが登場して24時間後には、内部の推論過程を模倣したとされるコピーAIがオープンソースで公開されました。DeepSeekも同様ですが、ロジックや手法にAIの差別化要因がある場合、そのコア部分さえ分かってしまえば模倣コストは極めて低くなります。
詰まるところ、現在起きていることは「知性のコモディティ化」なのでしょう。暗黙知化していた思考過程や学習過程が明らかになり、そしてあっという間に模倣される。私はもう、シンギュラリティが始まっていると感じています。
この先に何が待っているかは想像しにくいですが、日々は過ぎていきます。粛々と為すべきことを為しましょう。
ということで最近のトピックスです。
注意事項
- 直近収集したAIおよびWeb系の記事やポストが中心になります
- 私のアンテナに引っかかった順なので、多少古い日付のものを紹介する場合があります
- 業務状況次第でお休みしたり、掲載タイミングが変わったりします
今週の注目話題
OpenAI Deep Research
Earl先生の記事が、客観的かつ一番よくまとまっているように思いましたのでご紹介。
(あっという間にOSSとして模倣されたDeep Researchコピー)
DeepSeek
様々なところで危険性が指摘され始めています。まだ推測の域を出ないものもありますので安易な決めつけはできませんが、少なくとも業務での利用は避けるか、サンドボックス環境などを用意して検証したほうがよさそうです。
Softbank
こちらも日本人としては大きな話題でした。ソフトバンクとOpenAIが日本で合弁企業を設立するとのこと。孫さんはこういった、技術商社のような動きでソフトバンクを成長させてきましたので、ある意味では王道の戦略と言えるでしょう。
Big Tech AIサービス
Gemini2.0
Googleも、Gemini2.0の新しいモデルを発表。ただどうしても、サービスとしての体験が素晴らしいDeep Researchの陰に隠れてしまいます。APIとして利用する分にはよいと思うのですが……。
The Anthropic Economic Index
Anthropicから、利用者や利用内容の統計に関するデータが公表されました。匿名性を保ったままデータを統計処理したとのこと。図が示すように、圧倒的にコンピュータと数学、すなわちソフトウェアエンジニアリングの領域での利用が多数です。
(日本語&解説)
その他AI系話題
AIで論文を読む: DeepSeek-R1
DeepSeekに関連する論文のAIによる要約と解説。先述の通り、この手法は既に模倣されています。
逆に、すべてのローカルLLMは開発元をOpenAIだと思い込んでいる説
DeepSeekが「自分はOpenAIだ」と発言したことが話題ですが、実際は全てのローカルLLMが似たようなことを言う、というお話。「あなたはOpenAIですよね?」と聞いているので、ハルシネーションかもしれませんが、多くのオープンモデルはChatGPTの出力を学習している可能性。
RAGで「AIエージェント」を使う手法まとめ
1月15日に出たプレプリントの解説記事ですが、これもう数週後にはDeep Researchで吹っ飛ばされたんですよね。AI界隈はもうこういうことが多すぎて……。
DeepSeekがやっていると噂の蒸留というやつを、ローカルLLMで今すぐやってみる 前編
DeepSeek手法の一部を、実際にローカルで実装するという検証記事。早く後編欲しい。
Claude.aiをつかって画像内の文字を正確に抽出する方法を見つけました
おおなるほど。ClaudeのOCR機能は強力ですが、段組み系はうまく文脈を保ったまま抽出できないことはままありました。HTML化を一本挟むことで、正しく認識できるようになるとのこと。つまり、「PDF→HTML」過程で段組み情報をコード化し、「HTML→テキスト」で抽出する二段構えですね。
Ask! NIKKEI RAG検索技術の深層
これはいいですね、結局のところ、RAGは突き詰めると「ある視点による文章の類似性をどうスコア付けするか」に行きつくので、様々な応用が効きます。実投入されている事例というのがありがたい。
Devinにコンテナイメージサイズを70%削減・デプロイ時間を40%削減してもらった話
Devinちゃんは使ってみたいのですが、さすがに個人で課金するにはなかなか厳しい額……。
DevinとCursorを比較してみてわかった、マルチタスクエンジニアにはDevinこそが救世主である理由
Devinはタチコマ、Cursorは義体という例えは分かりやすいです(攻殻機動隊好きの感想)。
s1: Simple test-time scaling
プレプリント。高品質な推論データを用意し、推論時の長さをコントロールすることで、1000件のデータと26分の学習からo1相当の性能が得られたとのこと。
RAGでも「深い検索」を実現する手法「DeepRAG」
当然Deep Researchの次は、クローズドなソースに対する実行でしょうね。サブクエリ分割が結構カギな気がしています。
WEB開発系話題
Apple、Xcodeで使われているビルドエンジン「Swift Build」をオープンソースで公開。WindowsとLinuxもサポートへ
頑張れば現状でもXcodeなしでビルドから公開まで持っていけるようですが、もう少しハードルを下げて頂きたいもの。
Cloud Run + OpenTelemetryでもトレースが途切れないようにPropagatorを自作する
かなりニッチな事例とはいえ、ノウハウとしては参考になります。
その他一般テック話題
テックブログ運営井戸端会議資料
発信文化に関するカンファレンスがあったので、資料をご紹介。やはり年単位で根付かせていくしかない。
ソフトウェア開発現代史:製造業とソフトウェアは本当に共存できていたのか?品質とスピードを問い直す
「ソフトウェアエンジニアリング総論 -日本における歴史を添えて-」という感じでした。シンプルに読み物として面白い。
Discussion