🤖

【初心者向け】RAGの基礎をわかりやすく解説！LLMをもっと賢く使う方法

teller

2025/10/14に公開

 はじめに最近、ChatGPTやGeminiなどの大規模言語モデル（LLM）がますます注目されていますね！

でも、こんな経験ありませんか？
ChatGPTに最新の情報を聞いたら、古い情報や間違った情報が返ってきた
自社の製品マニュアルについて質問したいのに、LLMは知らない
もっと正確で、信頼できる回答を得たい
こういった課題を解決する技術が RAG（Retrieval-Augmented Generation） です！
この記事では、プログラミング初心者の方でも理解できるように、RAGの基礎をわかりやすく解説していきます！

 RAGとは？RAG（Retrieval-Augmented Generation） は、日本語で「検索拡張生成」と訳されます。
簡単に言うと、LLMに外部の知識を与えて、より正確な回答を生成させる技術 です！

 RAGの基本的な仕組み従来のLLMは、学習時に覚えた知識だけで回答を生成します。そのため、以下のような問題がありました：
学習データに含まれていない情報（最新情報や社内情報など）には答えられない
存在しない情報を自信満々に答えてしまう（これを「幻覚（Hallucination）」と言います）
RAGは、この問題を解決するために外部のデータベースから関連情報を検索し、その情報を元に回答を生成します！

 RAGのアーキテクチャRAGの処理の流れを図で見てみましょう！

ユーザーが質問する: 例「当社の返品ポリシーは？」

質問をベクトル化: 質問を数値データ（ベクトル）に変換

関連文書を検索: ベクトルデータベースから類似度の高い文書を検索

LLMに渡す: 検索した文書と質問をセットでLLMに渡す

回答を生成: LLMが検索結果を参考に正確な回答を生成
これにより、LLMが知らない情報でも、データベースから関連情報を引っ張ってきて回答できるようになります！

 RAGの構成要素RAGは主に3つの要素で構成されています！

 1. ベクトルデータベースベクトルデータベースは、文章を数値化（ベクトル化）して保存するデータベースです。

 なぜベクトル化が必要？通常のデータベースでは「キーワード検索」しかできませんが、ベクトル化することで意味的に似ている文章を検索できるようになります！
例えば：
質問: 「犬の飼い方を教えて」
類似文書: 「ペットの世話について」「イヌの育て方ガイド」
キーワードが完全一致しなくても、意味が似ていれば検索できるのが強みです！

 代表的なベクトルデータベース
Pinecone: クラウドベースで使いやすい

Weaviate: オープンソースで柔軟性が高い

Chroma: 軽量でローカル開発に最適

Qdrant: 高速で大規模データにも対応

 2. エンベディングモデルエンベディングモデルは、文章を数値（ベクトル）に変換するAIモデルです。
例えば、以下の文章：
「犬は人間の最良の友です」
これを数値に変換すると：
[0.23, -0.45, 0.78, 0.12, ..., 0.56]
このようなベクトルに変換することで、コンピュータが「意味の近さ」を計算できるようになります！

 代表的なエンベディングモデル
OpenAI Embeddings: ChatGPTと同じOpenAI製

Google Vertex AI Embeddings: Googleが提供

Sentence Transformers: オープンソースで日本語にも対応

 3. LLM（大規模言語モデル）LLMは、検索した情報を元に自然な文章で回答を生成します。

 代表的なLLM
GPT-4 / GPT-3.5 (OpenAI)

Claude (Anthropic)

Gemini (Google)

LLaMA (Meta)
RAGでは、検索した文書を「参考資料」としてLLMに渡すことで、より正確で根拠のある回答を生成できます！

 具体的なユースケースRAGはさまざまな場面で活用されています！

 1. 企業の社内ドキュメント検索システム課題: 社内の膨大なマニュアルや規約から必要な情報を探すのが大変
RAGの活用:
社内ドキュメントをベクトルデータベースに保存
社員が質問すると、関連するドキュメントを検索して回答
例: 「有給休暇の申請方法は？」→ 就業規則から該当部分を抽出して回答

 2. カスタマーサポートの自動応答課題: 同じような質問が繰り返し来て、サポート担当者の負担が大きい
RAGの活用:
FAQや製品マニュアルをデータベース化
顧客からの質問に自動で回答
例: 「パスワードを忘れた場合は？」→ パスワードリセット手順を自動回答

 3. 専門分野（医療、法律など）の質問応答システム課題: 専門的な知識が必要で、一般的なLLMでは不正確な回答になる
RAGの活用:
医学論文や法律条文をデータベース化
専門家の質問に対して、根拠となる文献を提示しながら回答
例: 「この症状に対する最新の治療法は？」→ 最新の論文から情報を引用

 4. 製品マニュアルのチャットボット課題: 分厚いマニュアルから必要な情報を探すのが面倒
RAGの活用:
製品マニュアル全体をベクトル化
ユーザーが自然言語で質問すると、該当するページを検索して回答
例: 「Wi-Fi接続の設定方法は？」→ マニュアルの該当ページを参照して説明

 メリット・デメリットRAGにはどんなメリット・デメリットがあるのでしょうか？

 メリット
 1. 最新情報を反映できるLLMの学習データは過去のものですが、RAGならデータベースを更新するだけで最新情報に対応できます！
例：
2024年の最新ニュースについて質問したい
先週追加された社内ルールを確認したい

 2. 幻覚（Hallucination）の軽減LLMが知らない情報を「でっち上げる」ことを防げます。データベースから取得した事実に基づいて回答するため、正確性が向上します！

 3. ドメイン固有の知識に対応可能自社製品や専門分野など、一般的なLLMが知らない情報にも対応できます。

 4. 情報の出典を明示できるどの文書を参考にして回答したかを示せるため、回答の信頼性が高まります！

 デメリット
 1. システムが複雑になる単純にLLMを使うだけに比べて、以下の要素が必要になります：
ベクトルデータベースの構築・運用
エンベディングモデルの導入
検索精度のチューニング

 2. コストが増加するベクトルデータベースの利用料金
エンベディングAPIの利用料金
LLM APIの利用料金
これらが積み重なり、運用コストが高くなる可能性があります。

 3. 検索精度に依存する関連する文書を正しく検索できないと、LLMが間違った情報を元に回答してしまいます。検索品質がそのまま回答品質に影響します。

 4. データの準備が必要ベクトルデータベースに保存するデータを整理・準備する必要があります。データが整理されていないと、検索精度が低下します。

 プロンプトエンジニアリングとの比較RAGとよく比較されるのがプロンプトエンジニアリングです。どう違うのでしょうか？

 プロンプトエンジニアリング定義: LLMへの指示（プロンプト）の書き方を工夫して、より良い回答を引き出す技術
例:
悪い例: 「会議の議事録を書いて」
良い例: 「以下の会議内容から、決定事項、担当者、期限を明確にした議事録を作成してください。」
特徴:
LLMの既存知識を最大限活用
コストが低い（追加のシステム不要）
実装が簡単
限界:
LLMが知らない情報には対応できない
最新情報を反映できない

 RAG定義: 外部データベースから情報を検索し、LLMに提供して回答を生成させる技術
特徴:
LLMが知らない情報にも対応可能
最新情報を反映できる
根拠のある正確な回答
限界:
システムが複雑
コストが高い
データの準備が必要

 どちらを使うべき？判断基準は以下の通りです！


条件
おすすめ


LLMの一般知識で十分
プロンプトエンジニアリング

特定のドメイン知識が必要
RAG

最新情報が必要
RAG

コストを抑えたい
プロンプトエンジニアリング

正確性・信頼性が最優先
RAG

出典を明示したい
RAG

実際には、両方を組み合わせるのが効果的です！
RAGで関連情報を取得
プロンプトエンジニアリングで回答の質を向上

 まとめこの記事では、RAGの基礎について解説しました！

 要点のおさらい
RAGとは: LLMに外部知識を与えて、より正確な回答を生成させる技術

主な構成要素: ベクトルデータベース、エンベディングモデル、LLM

メリット: 最新情報対応、幻覚軽減、ドメイン固有知識への対応

デメリット: システムの複雑性、コスト増加、検索精度への依存

プロンプトエンジニアリングとの違い: RAGは外部知識を活用、プロンプトエンジニアリングは指示の工夫

 次のステップRAGの基礎を理解できたら、次は実際に手を動かしてみましょう！
簡単なRAGシステムを構築してみる
LangChainやLlamaIndexなどのフレームワークを使うと簡単です
まずは小規模なデータセットで試してみましょう
ベクトルデータベースを触ってみる
ChromaやPineconeの無料プランを試してみる
自分の文書をベクトル化して検索してみる
実際のユースケースを考えてみる
自分の業務でRAGが活用できそうな場面を探してみる
どんなデータをベクトル化すると便利か考えてみる
RAGは、LLMをより実用的にする強力な技術です。ぜひ、実際に触れてみて、その可能性を体感してください！
今後、RAGの実装編や具体的なユースケースについても記事を書いていきたいと思います！

条件	おすすめ
LLMの一般知識で十分	プロンプトエンジニアリング
特定のドメイン知識が必要	RAG
最新情報が必要	RAG
コストを抑えたい	プロンプトエンジニアリング
正確性・信頼性が最優先	RAG
出典を明示したい	RAG

NonEntropy Tech BlogPublication

NONENTROPY JAPAN株式会社は、Blockchain、IPFS、DID/VC、生成AIなどを活用し、Web3時代の信頼を支える技術を開発しています！技術情報を中心に投稿します！

はじめに

RAGとは？

RAGの基本的な仕組み

RAGのアーキテクチャ

RAGの構成要素

1. ベクトルデータベース

なぜベクトル化が必要？

代表的なベクトルデータベース

2. エンベディングモデル

代表的なエンベディングモデル

3. LLM（大規模言語モデル）

代表的なLLM

具体的なユースケース

1. 企業の社内ドキュメント検索システム

2. カスタマーサポートの自動応答

3. 専門分野（医療、法律など）の質問応答システム

4. 製品マニュアルのチャットボット

メリット・デメリット

メリット

1. 最新情報を反映できる

2. 幻覚（Hallucination）の軽減

3. ドメイン固有の知識に対応可能

4. 情報の出典を明示できる

デメリット

1. システムが複雑になる

2. コストが増加する

3. 検索精度に依存する

4. データの準備が必要

プロンプトエンジニアリングとの比較

プロンプトエンジニアリング

RAG

どちらを使うべき？

まとめ

要点のおさらい

次のステップ

Discussion