<h2 id="%E5%B0%8E%E5%85%A5" data-line="0" class="code-line">
<a class="header-anchor-link" href="#%E5%B0%8E%E5%85%A5" aria-hidden="true"></a> 導入</h2>
<p data-line="1" class="code-line">こんにちは、株式会社ナレッジセンスの須藤英寿です。</p>
<p data-line="3" class="code-line">今回は、AIエージェントが陥る考えすぎ(過剰推論)を防いで、精度を向上させる手法<code>ReaRAG</code>について紹介します。</p>
<p data-line="5" class="code-line"><span class="embed-block zenn-embedded zenn-embedded-card"><iframe id="zenn-embedded__255c594a8e43e" src="https://embed.zenn.studio/card#zenn-embedded__255c594a8e43e" data-content="https%3A%2F%2Farxiv.org%2Fpdf%2F2503.21729" frameborder="0" scrolling="no" loading="lazy"></iframe></span><a href="https://arxiv.org/pdf/2503.21729" style="display:none" target="_blank" rel="nofollow noopener noreferrer">https://arxiv.org/pdf/2503.21729</a></p>
<p data-line="7" class="code-line"><img src="https://storage.googleapis.com/zenn-user-upload/b27ee93309a2-20250330.png" loading="lazy" class="md-img"></p>
<h2 id="%E3%82%B5%E3%83%9E%E3%83%AA%E3%83%BC" data-line="9" class="code-line">
<a class="header-anchor-link" href="#%E3%82%B5%E3%83%9E%E3%83%AA%E3%83%BC" aria-hidden="true"></a> サマリー</h2>
<p data-line="11" class="code-line">2025年はAIエージェント元年と呼ばれるように、Web検索やコード生成の分野でAIエージェントの活躍の舞台は広がっています。しかし、AIエージェントの抱える問題の一つ「過剰推論」によって回答にたどり着けなくなる問題があります。ReaRAGはこの「過剰推論」をファインチューニングで防ぐことに成功しています。</p>
<p data-line="13" class="code-line">ポイントは、ツール(Web検索など)そのものと少ない手数で回答にたどり着くパターンを学習するという点です。ツールの使用方法を学習することは多いですが、利用するツールそのものとそのツールを少ない手数で利用する様子も学習に含めることで、ツール利用の精度が大幅に向上します。</p>
<details><summary>エージェントの過剰推論問題</summary><div class="details-content">
<h3 id="%E9%81%8E%E5%89%B0%E6%8E%A8%E8%AB%96%E3%81%AB%E3%82%88%E3%82%8B%E5%95%8F%E9%A1%8C" data-line="17" class="code-line">
<a class="header-anchor-link" href="#%E9%81%8E%E5%89%B0%E6%8E%A8%E8%AB%96%E3%81%AB%E3%82%88%E3%82%8B%E5%95%8F%E9%A1%8C" aria-hidden="true"></a> 過剰推論による問題</h3>
<p data-line="19" class="code-line">例えば、「請求書払いに対応している、法人向けのチャットサービスを一覧にして」という質問をＷｅｂ検索で解決しようとするとします。この時、「Ａ社は請求書払いに対応しているか？」を確認するときに検索で見つからなかった場合に、何度も繰り返し検索してしまう(過剰推論)。という問題が発生することがあります。</p>
<p data-line="21" class="code-line">こうした過剰推論は、時間やコストの無駄になるだけでなく、その後の推論において過剰に推論した無駄な文字列が影響して、その後の出力の精度にも悪影響を与えてしまいます。</p>
</div></details>
<h3 id="%E6%89%8B%E6%B3%95" data-line="25" class="code-line">
<a class="header-anchor-link" href="#%E6%89%8B%E6%B3%95" aria-hidden="true"></a> 手法</h3>
<p data-line="27" class="code-line">まずは、ReaRAGがどういった手順で動作するかについて説明します。<br>
　　　　　　　　　　　　　　　　　　　　　　　　　　　　<br>
<img src="https://storage.googleapis.com/zenn-user-upload/f79039f96a8c-20250331.png" loading="lazy" class="md-img"></p>
<p data-line="31" class="code-line">ReaRAGは一般的なRAGをLLMの思考のループ内で使用し、回答を作り出します。<br>
具体的には、以下のような手順を繰り返して回答を導き出そうとします。</p>
<ol data-line="34" class="code-line">
<li data-line="34" class="code-line">Thought: 回答にどんな情報を知る必要があるかを考える</li>
<li data-line="35" class="code-line">Action: 使用するツールを指定する</li>
<li data-line="36" class="code-line">Observation: ツールを使用した結果を受け取る</li>
</ol>
<p data-line="38" class="code-line">Actionで<code>finish</code>が選択されると、そこでループは終了します。この動作は比較的一般的なもので、ReaRAGの特徴はむしろ学習過程にあります。ポイントは以下の2点です。</p>
<ul data-line="40" class="code-line">
<li data-line="40" class="code-line">ReaRAGで使用するToolを利用して、思考する過程を学習データに利用する</li>
<li data-line="41" class="code-line">使用する学習データはできるだけ短いステップで回答にたどり着いているものを利用する</li>
</ul>
<p data-line="43" class="code-line">理想的なツールの使用法を学習することで、「過剰推論」を防ぎ高い精度を実現しています。</p>
<h3 id="%E6%88%90%E6%9E%9C" data-line="45" class="code-line">
<a class="header-anchor-link" href="#%E6%88%90%E6%9E%9C" aria-hidden="true"></a> 成果</h3>
<p data-line="47" class="code-line"><img src="https://storage.googleapis.com/zenn-user-upload/9aee1035f386-20250331.png" loading="lazy" class="md-img"></p>
<p data-line="49" class="code-line">既存のRAGの手法と、ReaRAGの各種ベンチマークにおける精度の比較を行っています。特に多段階の推論が必要なタスクにおいては、既存よりも15%近くの精度向上を実現していると記載されています。</p>
<p data-line="51" class="code-line"><img src="https://storage.googleapis.com/zenn-user-upload/729bac8ce95f-20250331.png" loading="lazy" class="md-img"></p>
<p data-line="53" class="code-line">続いて、各種ベンチマークにおける回答にたどり着くまでに要した繰り返しの回数を示すグラフです。Search-o1と比較して、おおよそ2~4割ほど繰り返し回数が削減されていることが見て取れます。これは、学習の成果が現れているポイントとなっています。この繰り返し回数の削減が、一つ前の表で示した精度にプラスの影響を与えたと考えられます。</p>
<h3 id="%E3%81%BE%E3%81%A8%E3%82%81" data-line="55" class="code-line">
<a class="header-anchor-link" href="#%E3%81%BE%E3%81%A8%E3%82%81" aria-hidden="true"></a> まとめ</h3>
<p data-line="57" class="code-line">今回は、ツールを上手に使う方法を学習させることで、検索の性能を向上させる手法、ReaRAGについて紹介しました。手法こそ違うものの、2025年2月に発表されたOpenAI社のDeepResearchも、検索ツールの使用方法をLLMに学習させることで高い検索性能を実現しています。その点で、かなり裏付けのある手法で、ReaRAGもオープンソースのモデルでも実現できている点から、かなり応用の効く手法と言えそうです。<br>
一方で、ReaRAGの手法は使用するToolを事前に決めておく必要がある点から、決して楽に導入できる手法ではないと言えそうです。使用するモデルとツールが完全に決まっているタスクが生まれて、プロンプトの調整では効かないレベルの精度を実現する必要が生まれてから、取り入れるべき手法だと考えています。</p>


AIエージェントの考えすぎを防いでRAGの精度を向上

Discussion