🔎

FAQゼロの現場で“考えるチャットボット”を育てるまで

に公開

── バニラRAG卒業宣言。GraphRAG × LangGraph でノウハウ推論へ挑む 90日プラン

🛠 この記事は“ロードマップ公開”フェーズです。 まだコードは動いていません。

ですが 90 日後、必ず「やってみた編」を Zenn に投下すると宣言します。

もしあなたが…

  • 「FAQ がそもそも無い現場」で RAG が詰んだ
  • GraphRAG / LangGraph の実務像が掴めない
  • 検索ではなく“推論”できるボットを夢見ている

そんな仲間なら、ぜひブックマークして経過を見届けてください。


1. モヤモヤの正体 ―― FAQも整備できないのに RAG が流行る矛盾

RAG を試した同僚が首をひねる——

「“その質問は登録がありません”って、チャットボットなのに冷たいね」

問題はシンプル:FAQ が無い/散在しているのに、ベクトル検索だけでは回答できない。Valprovia (2025) 調査によれば 67% の組織が“ドキュメント不足” を最初の壁に挙げています。

つまりバニラRAGは 「FAQが整っている世界線」 を前提にしている。現実は違う。だからこそ GraphRAGLangGraph Agent に賭けてみる価値がある、と考えました。


2. 目指すユーザー体験

👩‍💻 ユーザ : 画像が荒い。もっとキレイにしたい
🤖 Bot    : config.toml の quality を 60 → 80 に変更してください。
            理由  : JPEG は値を上げるほど画質優先になります。
            手順  : ① ファイルを開く → ② パラメータを変更 → ③ 再起動

「設定値」+「理由・手順・注意点」 まで、FAQゼロでも導出する。これがゴールです。


3. 技術プラン:ベクトルだけに頼らない 4層構成

レイヤ 役割 採用OSS/SaaS
① 意味抽出 文書→ (S, P, O)トリプル LangChain QAGenerationChain + GPT‑4o
② Knowledge Graph 因果・手順をエッジで保持 Neo4j Aura Free (Cypher)
③ Hybrid Retrieval 高リコール + 高精度 ChromaDB + bge‑reranker-large
④ 推論エージェント Python Tool / API を呼び出し CoT 統合 LangGraph(StateGraph)


4. “まだ動いていない” ロードマップ公開

Phase ゴール Deliverable
0 1 ドメイン決定& KPI 設計 Notion 1枚企画書
1 2‑3 トリプル抽出PoC triples.csv / 精度メモ
2 4‑5 GraphRAG 基盤構築 graphrag_chain.ipynb
3 6 Hybrid Retrieval + Rerank diffグラフ&Latency計測
4 7‑8 LangGraph Agent + Tool demo動画 / stategraph.png
5 9 Docker & README 化 Private GitHub repo
6 10‑12 実践編記事 & 公開リポ Precision≥0.79 / Lat≤1s

🎯 KPI(暫定):Precision+10pt / Latency P95<1s / Token削減20%


5. 既存 Zenn 記事との違いは?

  1. FAQゼロ問題を主題に据える
  2. GraphRAG × LangGraph × Rerank をひとつの記事で試す
  3. 評価指標&改善プロセスを公開 —— 成功でも失敗でもブログにさらす

6. 今抱えている“宿題”

  • トリプル抽出誤爆:信頼度の閾値はいくつが適切?
  • グラフ更新:日次バッチ vs ストリーム、どちらが運用コスト低い?
  • PIIマスキング:抽出時 or 推論時、どちらが漏れにくい?

👉 コメントでアイデアや経験談をもらえると泣いて喜びます!


7. 読みながら参考にしたリンク集


8. 次回予告

#1 トリプル抽出編 – “30 行 Python”で S‑P‑O を抜き、精度を測る

読んでくださりありがとうございます。次回はコードが登場しますのでお楽しみに!


© 2025 @y0uhey — 再利用自由(CC‑BY 4.0)、クレジットだけお願いします。

Discussion