💡

[2025年2月13日] もう全部Deep Reseachでいいんじゃないかな (週刊AI)

Kai

2025/02/13に公開

こんにちは、Kaiです。

週刊とはいったい……何とかせねば。
さて、もうDeep Research一色です。私もついにProプランを契約して、使い始めました。

あまり驚き屋のようなことは言いたくないのですが、本当にこれは凄い。何度も試すうちに、少なくなったもののやはり固有名詞などでハルシネーションが発生することは確認しました。ですので、人間を完全に代替するとはいきませんが、デスクトップリサーチの一次タスクとしては十分すぎるレベルに達していると感じます。
あらゆる用途に使えるのはもちろんですが、特に「勉強」のやり方が全く変わるのではないかと感じています。これが好奇心MAXだった小学生の頃に使えたら、どれほどの質問を投げてどれほどのことを学んだのだろう、と想像してしまいます。
ただ、Deep Researchが登場して24時間後には、内部の推論過程を模倣したとされるコピーAIがオープンソースで公開されました。DeepSeekも同様ですが、ロジックや手法にAIの差別化要因がある場合、そのコア部分さえ分かってしまえば模倣コストは極めて低くなります。
詰まるところ、現在起きていることは「知性のコモディティ化」なのでしょう。暗黙知化していた思考過程や学習過程が明らかになり、そしてあっという間に模倣される。私はもう、シンギュラリティが始まっていると感じています。
この先に何が待っているかは想像しにくいですが、日々は過ぎていきます。粛々と為すべきことを為しましょう。
ということで最近のトピックスです。
注意事項
直近収集したAIおよびWeb系の記事やポストが中心になります
私のアンテナに引っかかった順なので、多少古い日付のものを紹介する場合があります
業務状況次第でお休みしたり、掲載タイミングが変わったりします

 今週の注目話題
 OpenAI Deep ResearchEarl先生の記事が、客観的かつ一番よくまとまっているように思いましたのでご紹介。

https://drmagician.exblog.jp/33506967/
（あっという間にOSSとして模倣されたDeep Researchコピー）

https://huggingface.co/blog/open-deep-research

 DeepSeek様々なところで危険性が指摘され始めています。まだ推測の域を出ないものもありますので安易な決めつけはできませんが、少なくとも業務での利用は避けるか、サンドボックス環境などを用意して検証したほうがよさそうです。

https://www.itmedia.co.jp/news/articles/2501/30/news173.html

https://storialaw.jp/blog/11668

https://x.com/oryzae1824/status/1887340414702874784

 Softbankこちらも日本人としては大きな話題でした。ソフトバンクとOpenAIが日本で合弁企業を設立するとのこと。孫さんはこういった、技術商社のような動きでソフトバンクを成長させてきましたので、ある意味では王道の戦略と言えるでしょう。

https://www.softbank.jp/corp/news/press/sbkk/2025/20250203_01/

 Big Tech AIサービス
 Gemini2.0Googleも、Gemini2.0の新しいモデルを発表。ただどうしても、サービスとしての体験が素晴らしいDeep Researchの陰に隠れてしまいます。APIとして利用する分にはよいと思うのですが……。

https://chatgpt-lab.com/n/n5de62a9527a3

 The Anthropic Economic IndexAnthropicから、利用者や利用内容の統計に関するデータが公表されました。匿名性を保ったままデータを統計処理したとのこと。図が示すように、圧倒的にコンピュータと数学、すなわちソフトウェアエンジニアリングの領域での利用が多数です。

https://www.anthropic.com/news/the-anthropic-economic-index
（日本語＆解説）

https://x.com/rom13856511/status/1889088401510744476

 その他AI系話題
 AIで論文を読む: DeepSeek-R1DeepSeekに関連する論文のAIによる要約と解説。先述の通り、この手法は既に模倣されています。

https://7shi.hateblo.jp/entry/2025/01/28/225747

 逆に、すべてのローカルLLMは開発元をOpenAIだと思い込んでいる説DeepSeekが「自分はOpenAIだ」と発言したことが話題ですが、実際は全てのローカルLLMが似たようなことを言う、というお話。「あなたはOpenAIですよね？」と聞いているので、ハルシネーションかもしれませんが、多くのオープンモデルはChatGPTの出力を学習している可能性。

https://zenn.dev/yuiseki/articles/d90c4544ea3ea6

 RAGで「AIエージェント」を使う手法まとめ1月15日に出たプレプリントの解説記事ですが、これもう数週後にはDeep Researchで吹っ飛ばされたんですよね。AI界隈はもうこういうことが多すぎて……。

https://zenn.dev/knowledgesense/articles/64975fb9377f82

 DeepSeekがやっていると噂の蒸留というやつを、ローカルLLMで今すぐやってみる 前編DeepSeek手法の一部を、実際にローカルで実装するという検証記事。早く後編欲しい。

https://zenn.dev/yuiseki/articles/4737799cad4a8d

 Claude.aiをつかって画像内の文字を正確に抽出する方法を見つけましたおおなるほど。ClaudeのOCR機能は強力ですが、段組み系はうまく文脈を保ったまま抽出できないことはままありました。HTML化を一本挟むことで、正しく認識できるようになるとのこと。つまり、「PDF→HTML」過程で段組み情報をコード化し、「HTML→テキスト」で抽出する二段構えですね。

https://qiita.com/moritalous/items/f5afd052992afa40d524

 Ask! NIKKEI RAG検索技術の深層これはいいですね、結局のところ、RAGは突き詰めると「ある視点による文章の類似性をどうスコア付けするか」に行きつくので、様々な応用が効きます。実投入されている事例というのがありがたい。

https://speakerdeck.com/hotchpotch/ask-nikkei-ragjian-suo-ji-shu-noshen-ceng

 Devinにコンテナイメージサイズを70%削減・デプロイ時間を40%削減してもらった話Devinちゃんは使ってみたいのですが、さすがに個人で課金するにはなかなか厳しい額……。

https://tech.layerx.co.jp/entry/2025/02/06/110027

 DevinとCursorを比較してみてわかった、マルチタスクエンジニアにはDevinこそが救世主である理由Devinはタチコマ、Cursorは義体という例えは分かりやすいです（攻殻機動隊好きの感想）。

https://zenn.dev/ubie_dev/articles/e9682c9c6487c8

 s1: Simple test-time scalingプレプリント。高品質な推論データを用意し、推論時の長さをコントロールすることで、1000件のデータと26分の学習からo1相当の性能が得られたとのこと。

https://arxiv.org/abs/2501.19393

 RAGでも「深い検索」を実現する手法「DeepRAG」当然Deep Researchの次は、クローズドなソースに対する実行でしょうね。サブクエリ分割が結構カギな気がしています。

https://zenn.dev/knowledgesense/articles/034b613c9fd6d3

 WEB開発系話題
 Apple、Xcodeで使われているビルドエンジン「Swift Build」をオープンソースで公開。WindowsとLinuxもサポートへ頑張れば現状でもXcodeなしでビルドから公開まで持っていけるようですが、もう少しハードルを下げて頂きたいもの。

https://www.publickey1.jp/blog/25/applexcodeswift_buildwindowslinux.html

 Cloud Run + OpenTelemetryでもトレースが途切れないようにPropagatorを自作するかなりニッチな事例とはいえ、ノウハウとしては参考になります。

https://dev.henry.jp/entry/otel-propagator

 その他一般テック話題
 テックブログ運営井戸端会議資料発信文化に関するカンファレンスがあったので、資料をご紹介。やはり年単位で根付かせていくしかない。

https://speakerdeck.com/wooootack/wu-li-sezuni-minnadezuo-rou-fa-xin-wen-hua

https://speakerdeck.com/tkkz1009/kai-fa-zu-zhi-nofa-xin-wen-hua-wodouti-xian-suruka

https://speakerdeck.com/yjszk/ji-shu-fa-xin-wosok-kerunan-sisawoxing-dong-decheng-riqie-ru

 ソフトウェア開発現代史：製造業とソフトウェアは本当に共存できていたのか？品質とスピードを問い直す「ソフトウェアエンジニアリング総論 -日本における歴史を添えて-」という感じでした。シンプルに読み物として面白い。

https://speakerdeck.com/takabow/zhi-zao-ye-tosohutoueahaben-dang-nigong-cun-dekiteitanoka-pin-zhi-tosupidowowen-izhi-su-dc76f0ad-2d4c-4f2a-bf4d-cecbceb7eb5e

CareNet EngineersPublication

株式会社ケアネットのエンジニアブログです。CareNetサービスの技術情報を中心に記事を投稿しております。各記事の内容は個人の意見であり、企業を代表するものではございません。

Discussion

ログインするとコメントできます

今週の注目話題

OpenAI Deep Research

DeepSeek

Softbank

Big Tech AIサービス

Gemini2.0

The Anthropic Economic Index

その他AI系話題

AIで論文を読む: DeepSeek-R1

逆に、すべてのローカルLLMは開発元をOpenAIだと思い込んでいる説

RAGで「AIエージェント」を使う手法まとめ

DeepSeekがやっていると噂の蒸留というやつを、ローカルLLMで今すぐやってみる 前編

Claude.aiをつかって画像内の文字を正確に抽出する方法を見つけました

Ask! NIKKEI RAG検索技術の深層

Devinにコンテナイメージサイズを70%削減・デプロイ時間を40%削減してもらった話

DevinとCursorを比較してみてわかった、マルチタスクエンジニアにはDevinこそが救世主である理由

s1: Simple test-time scaling

RAGでも「深い検索」を実現する手法「DeepRAG」

WEB開発系話題

Apple、Xcodeで使われているビルドエンジン「Swift Build」をオープンソースで公開。WindowsとLinuxもサポートへ

Cloud Run + OpenTelemetryでもトレースが途切れないようにPropagatorを自作する

その他一般テック話題

テックブログ運営井戸端会議資料

ソフトウェア開発現代史：製造業とソフトウェアは本当に共存できていたのか？品質とスピードを問い直す

Discussion

DeepSeekがやっていると噂の蒸留というやつを、ローカルLLMで今すぐやってみる前編