📌
ReAct: 言語モデルにおける推論と行動の相乗効果 (新しい論点の紹介)
この論文では、LLM を使用して推論トレースとタスク固有のアクションの両方をインターリーブ方式で生成し、両者の相乗効果を高める方法を検討します。推論トレースは、モデルがアクション プランを誘導、追跡、更新し、例外を処理するのに役立ちます。一方、アクションは、モデルの知識ベースや環境などの外部ソースとインターフェイスして追加情報を収集できるようにします。
下の図を参照してください。推論のみのベースライン (つまり、CoT:思考の連鎖) は、知識を取得して更新するために外部環境に根ざしておらず、限られた内部知識に頼らなければならないため、誤情報 (赤色) に悩まされています。行為のみのベースラインは推論が不足しており、この場合、ReAct と同じアクションと観察を行っているにもかかわらず、最終的な答えを統合することができません。対照的に、ReAct は解釈可能で事実に基づいた軌跡でタスクを解決します。
論文へのリンク: https://arxiv.org/pdf/2210.03629
参照コード: https://python.langchain.com/v0.1/docs/modules/agents/agent_types/react/
Discussion