[Dify] 社内規程について、チャット形式でQ&Aができる仕組みを作ってみた
社内の規定にQ&A、RAGできるようにする
LLM(大規模言語モデル)は、自然言語処理の能力を活用して、社内の規定やマニュアルの検索・理解を効率化する強力なツールです。中でも、就業規則や各種社内規程に対する質問応答(Q&A)は、その実用性が顕著に現れる分野の一つです。従来は規程集を手動で検索して必要な情報を見つける作業は時間と労力を要しましたが、LLMを活用することで、必要な情報を迅速かつ正確に取得することができます。
本記事では、Dify を使った社内規程の検索システム構築から運用までの基本的な流れや、具体的な活用例について解説します。例えば、就業規則をテキストデータとして取り込み、その後LLMを活用して従業員からの質問に自動で回答させることで、人事部門の業務効率化を図ることができます。また、RAG(検索拡張生成)技術を活用して正確な情報提供を実現する方法や、社内規定を効果的にチャンク分割する方法についてもご紹介します。
RAGを行う流れ
- ナレッジを作成する
- 作成したナレッジを、チャットボットやワークフローから呼び出す
ナレッジ
ナレッジとは
大規模言語モデル(LLM)の学習データは、一般的にインターネット上の公開情報をもとに作られています。そのため、一度モデルを学習すると、モデル内部に“固有の知識”が蓄積される反面、以下のような課題が生じます。
• 新しい情報への対応が遅れる(学習後の最新情報をすぐに反映できない)。
• 特定の企業内部文書やドメイン固有の知識など、公開されていない情報を学習データとして含みにくい。
このように、モデルが扱える知識(ナレッジ)はどうしても“最新・機密性の高い”情報を反映しにくいのが現状です。
RAGによる解決
こうした課題を解決するのが**RAG(Retrieval-Augmented Generation)**と呼ばれる技術です。
-
ユーザーの質問を受け取る
-
外部データ(たとえば社内文書やナレッジベース)から関連する情報を検索・取得(Retrieval)
-
取得した情報をもとにAIが回答を生成(Generation)
RAGを使えば、LLMはあらかじめ学習していない情報でも、外部から取得した内容を活用して柔軟に回答できるようになります。
Dify のナレッジ機能は、この”外部データ”を、作成・管理できる機能です。
Difyでは、ファイルのアップロードだけでなく、Webサイトや外部サービスとの連携など、多彩な方法で外部データを活用できます。
今回は、ファイルのアップロード機能を用いて、社内の規定をナレッジとして作成し、チャットボットからQ&Aを行える (RAGを行える) ようにします。
ナレッジを作成する
上部のメニューからナレッジをクリックし、ナレッジの管理画面を開きます。”ナレッジを作成” ボタンを押して、進みます。
元にデータソースの選択画面が表示れます。今回は、ファイルアップロードでナレッジを作成するので、”テキストファイルからインポート”を選択します。※テキストファイル以外にも対応しています
今回は、厚生労働省のモデル就業規則をサンプルとして扱います。
こちらのページからダウンロードしたdocをdocxで保存しなおした上で、ファイルをアップロードします。(Difyがdocをサポートしないため )
次に、テキストの前処理とクリーニングのページになります。今回は、すべての設定はそのままで、”保存して処理” を押して進みます。
すると、ナレッジが作成されました!のメッセージとともに、埋め込み処理 ( ベクトル化 )が開始あれます。
ドキュメントに移動ボタンを押して結果を確認しましょう。
ドキュメント画面位は、先ほど追加したファイルが表示されています。
Dify のナレッジは、
ナレッジ > ドキュメント > チャンク
の構造になっています。ドキュメントをクリックすると、分割されたチャンクが確認できます。
これで、ナレッジの作成は完了です。他にも、外部データとして追加したいファイルがある場合は、ドキュメント画面の右上の、”ファイルを追加”ボタンから、追加してください。
チャットボットからナレッジを利用する
次に、チャットボットから、先ほど作成したナレッジを利用して、RAGを行います。
スタジオを開き「最初から作成」をクリックして始めます。
アプリの種類は、チャットボットを選択。
アプリのアイコンと名前、説明を入力してください。
例:
アプリの名前:
就業規則のRAGチャットボット
説明:
就業規則の内容に対して、RAGを用いてQ&Aを行います。
チャットボットの設定画面いて”コンテキスト”として先ほど作成したナレッジを追加します。
これでRAG、ナレッジを利用する設定は完了です。
手順の欄のプロンプトには、以下のようなプロンプトを設定しました。
あなたは人事のエキスパートとして、コンテキストに基づいて就業規則の内容に答える役割を果たしてください。
また、右側のデバッグとプレビュー画面の下部にある、”高度機能”をクリックし、引用と帰属、を有効かします。これで、チャットボットが、どのドキュメント、チャンクを参照して回答したかわかるようになります。
実際に、チャットボットに質問してみてください。
アップロードしたファイルの内容を元に、回答が行われていることが確認できます。
まとめ
本記事では、Difyを活用して社内規程のQ&A・RAGシステムを構築する方法について解説しました。主なポイントは以下の通りです:
- Difyのナレッジ機能を使用して、社内規程をベクトル化し、検索可能なデータとして活用できる
- チャットボットとナレッジを連携させることで、社内規程に関する質問に自動で回答できる
- RAG技術により、LLMが外部データを参照しながら正確な情報提供を実現できる
このようなシステムを導入することで、社内規程の検索や問い合わせ対応にかかる時間と労力を大幅に削減できます。また、一度構築したシステムは継続的に利用できるため、長期的な業務効率の向上にも貢献します。
今後は、より多くの社内文書の追加や、プロンプトの最適化など、さらなる改善の余地があります。ぜひ、組織のニーズに合わせてカスタマイズし、より効率的な規定管理・問い合わせ対応を実現してください。
Discussion