🍣

【学習ログ】RAGとは

2025/01/31に公開

はじめまして、株式会社ヘッドウォータースの山尾弘大(やまお こうだい)です。
今回はRAGについて勉強したのでアウトプットとしてZennに記事を投稿します。

まず、RAGを説明する前にLLM(大規模言語モデル)について説明します。

LLM(大規模言語モデル)

LLM(大規模言語モデル)とは膨大なテキストデータとディープラーニングを用いて構築された技術のことです。
身近な例でいうと「ChatGPT」や「Gemini」などもこのLLMによって回答を生成しています。LLMは、人が話す言葉(自然言語)を理解して、文章を作成したり、質問に回答したりするロボットというイメージを持ってもらうとわかりやすいと思います。
ただし、LLMはインターネットなどから収集したデータを元に回答を生成しているので、社内情報などクローズドな情報を扱うことができません。
また、ハルシネーションといった嘘の回答を出力するときもあります。そこで、それらの課題を解決するのに有効なのが「RAG」です。

RAG(検索拡張生成)

RAGは、別名「Retrieval Augmented Generation」と呼ばれており、日本語では「検索拡張生成」と言われています。
これは、外部の最新情報や社内にしかない情報などをLLMに取り込んで、回答させる技術(フレームワーク)のことです。RAGを応用することで「一般的な情報」と「社内情報」に対して回答する特化型のAIを作成することができます。
また、データを用意し、回答する前に、そのデータベースへ検索をしてから、LLMの回答を生成することができます。こうすることで、信憑性の高い情報をインプットすることができるのでハルシネーション防止に繋がります。

短い記事ではありますが、今回は以上になります。今後も学習ログを掲載していきます。

参考文献

https://aws.amazon.com/jp/what-is/retrieval-augmented-generation/
https://www.sei-info.co.jp/quicksolution/column/rag/
https://www.dir.co.jp/world/entry/solution/rag
https://www.nec-solutioninnovators.co.jp/sp/contents/column/20240229_llm.html
https://www.hitachi-solutions-create.co.jp/column/technology/llm.html

ヘッドウォータース

Discussion