Azure OpenAIとLangChainを使ってReActの概念を学ぶ
はじめに
この記事は、Azure OpenAI Service と LangChain を使って ReAct の概念を学びます。
大規模言語モデルの概念の説明から記載しているので、初学者の方もご安心して読み進めていただければと存じます。
人工知能・大規模言語モデル(LLM)にご興味がある方は、ぜひ一読ください。
大規模言語モデル(LLM)の概要と課題
大規模言語モデル(LLM)は自然言語処理(NLP)の分野で用いられる大量のテキストデータから学習した機会学習モデルのことです。
LLM は以下のようなことが出来ます。
- 自然言語生成
- 質問応答
- 翻訳
- 要約
- 文書分類
- 要素認識
- 感情分析
特に質問応答は ChatGPT の登場でお馴染みになりましたよね。
ChatGPT が有名ですが、実は他にも大規模言語モデルは各社リリースしています。
https://arxiv.org/pdf/2104.04473.pdf
enterprise | llm name |
---|---|
BERT | |
OpenAI | GPT |
NVIDIA | Megatron-LM |
Microsoft | Turning-NLG |
Bard |
特に最近注目されている ChatGPT を例に挙げて紹介してみると以下のような感じです。
- 2022 年 11 月 30 日リリース
- GPT モデルを使って作られたチャットアプリサービス
- リリース後 2 ヶ月で1億ユーザ突破
- GPT3/4 モデルの学習データは 2022 年 1 月までのデータしかない
上記で注目したい点は、GPT3/4 モデルの学習データは 2022 年 1 月までのデータしかない
という点です。
これから新しい情報や未知の情報(各企業の独自の情報等)を AI に組み込み、利活用していきたいと考えると LLM を強化する必要があります。
LLM を強化する方法
前述した通り、大規模言語モデル(LLM)の問題点は人工知能が学習した範囲内でしか回答ができないということです。
昨今人工知能の需要は高まり、以下のようなニーズがあるかと思います。
- 2022 年 1 月以降の情報が必要となる回答も正確に返してほしい
- 外部には公開していない社内の情報への質問にも正確に返してほしい
...etc
上記目標を達成する為には LLM を強化させなくてはなりません。
そこで、LLM を強化させる方法として 2 つの方法があります。
-
Prompt Engineering
- LLM に与えるプロンプト内に追加データを含めたり、不足がある場合に外部ツールを呼び出してデータを追加することで回答制度を向上させる方法
- 以前の情報をヒントにして回答
- Web で検索して回答...etc
- LLM に与えるプロンプト内に追加データを含めたり、不足がある場合に外部ツールを呼び出してデータを追加することで回答制度を向上させる方法
-
Fine-tuning
- LLM 自体を再学習させ、パラメータを調整することで回答制度を向上させる方法
- GPT3.5 や GPT4 自体を新たに作成...etc
- LLM 自体を再学習させ、パラメータを調整することで回答制度を向上させる方法
もちろん Fine-tuning の方が精度の高い回答を得られる可能性が高まります。
ただ、LLM 自体が数億・数十億とお金をかけて大量のデータを用いて作成したものであるので、Fine-tuning を実施しようとすると膨大なコスト及びデータ量が必要になります。
そんな時に活躍するのが Prompt Engineering の手法であるReActという概念になります。
ReAct とは?
ReAct(REasoning and ACTing)
は、言語モデル(LLM)を使用して思考(推論)と行動を同時に行うための新しい枠組みです。
ReAct の主な目的は、自然言語推論と意思決定のタスクを統合することで、より高度な言語理解と知識活用を可能にすることです。
ReActの動作は主に以下の 2step からなります。
-
Reasoning(推論)
- 問題領域を分析して検索の方法と内容を検討
-
Acting(行動) + Observation(観察)
- 問題領域の分析結果に応じて具体的な情報を検索、情報収集
- 検索結果を要約して解答を作成
具体例を出すと以下の画像のような感じになります。
ReActの流れ
- 人からの質問
- OpenAI へ質問を投げかける。(この時 OpenAI へ送るプロンプトにツールとして BingSearch が使えることを含める)
- OpenAI だけでの解答が難しい場合は、BingSearch を使って検索を行い、情報を得る
- BingSearch から得た情報も含めて再度 OpenAI へ情報を送り、回答の要約を作成する
- 人へ回答を返す
上記のように 2022 年 1 月以降の情報でも、検索情報を含めて再度 OpenAI へ送ることにより回答が可能になります。
上記では、BingSearch を使用していますが、他にも様々なツールを使用することが可能です。
例えば、BingSearch の箇所を社内情報に変更してみたりすると、社内のことを回答してくれる OpenAI が作成できます。
拡張性が高く、かなり便利で面白いシステムが構築出来ると考えています。
これからは各企業で DX 化がどんどん推進されていくかと思いますが、その際に ReAct の概念が多く使われるのではないかと個人的に期待しています。
では実際に簡単なアプリケーションを作成し、動作を確認しましょう!
ReAct アプリケーションの動作検証および解説
以下にハンズオンの記事を作成したので、そちらを参照して実施してみてください。
github にもコードを上げているので、そちらも参照してみてください。
github
最後に
ReAct は非常に面白い概念で、今後の AI の発展に大きく貢献すると考えています。
ちなみに本記事はほぼほぼ Github copilot を使って作成しています。
恐ろしいですね。
AI が DX 化してくれることはもちろん、全ての仕事をやってくれる日はそう遠くないのかもしれません。
お疲れ様でした。
Discussion