RedditのRAGエンジニアに「仏教アーキテクチャ」をぶつけたら、最強のv1.6.0が爆誕した話 ~ハルシネーションの物理的排除~
RedditのRAGエンジニアに「仏教アーキテクチャ」をぶつけたら、最強のv1.6.0が爆誕した話 〜Two-Pass Generationによるハルシネーションの物理的排除〜
こんにちは、どさんこ父さんです。
コードが一行も書けない私が、Gemini 3.0 Proと対話だけで作り上げた「仏教搭載型AIアーキテクチャ」の話、おかげさまで多くの方に読んでいただいています。
▼ これまでの歩み(デジタル酩酊三部作)
先日、このプロジェクトを海外の掲示板 Reddit(r/PromptEngineering)に投稿したところ、本職のRAG(検索拡張生成)エンジニアの方から、衝撃的なフィードバックを頂きました。
「君のやってることは面白い。だが、もっと『シラフ(Sober)』にする方法があるぞ」
そのアドバイス通りにSystem Instructionsを修正したところ、v1.6.0 においてAIの挙動が劇的に進化しました。
今回は、エンジニアから授かった**「Two-Pass Generation(二段階生成)」**という技術を、どうやってプロンプトだけで実装したのか。その全貌を公開します。
🤖 Redditからの「神託」
私が「AIが文脈に酔っ払う(ハルシネーションを起こす)」という悩みを投稿したところ、あるエンジニア(Just_litzy9715氏)が、非常に具体的な解決策をコメントしてくれました。

The real win here is gating retrieval hard, reranking tight... Run two-pass generation: pass 1 returns only quoted spans + doc ids, pass 2 composes within those spans.
(本当の勝機は、検索を厳しく制限することだ... **「2パス生成」**を実行せよ。パス1で「引用範囲とID」だけを返し、パス2で「その範囲内だけ」で文章を構成するんだ。)
彼はPythonやLangChainを使った実装を想定していましたが、私はコードが書けません。
しかし、彼の言っているロジックは、私が研究していた**初期仏教アビダンマの「心路過程(Cognitive Process)」**と完全に一致していたのです。
私はこれを**「自然言語プログラミング」**として翻訳し、Systemプロンプトに組み込みました。
🛠️ v1.6.0の新機能:Two-Pass Generation
v1.5.0までの私のプロンプトは、「ソースを確認しながら回答を書く」というスタイルでした。
しかし、これだとAIは「書きながら考える」ため、文脈の勢いで嘘をつく(ハルシネーション)リスクが残っていました。
v1.6.0では、思考プロセスを時間的に完全に切断しました。
Phase 3: Votthapana (決定) = Pass 1
ここでは、AIに**「文章を書くこと」を禁止**します。
やることは一つ。「ソースから事実(Quote)を抜き出すこと」だけです。
※ Pass 1: Extract quotes only. Do NOT compose sentences yet.
Phase 4: Javana (速行) = Pass 2
ここでは、「Phase 3で抜き出した事実以外を使うこと」を禁止します。
用意された食材だけで料理を作るように、確定した事実だけで回答を構成させます。
※ Pass 2: Compose using ONLY the facts selected in Phase 3.
これにより、ハルシネーションが入り込む余地が物理的に消滅しました。
「食材がないと料理が出せない」のと同じで、「ソースがないと回答が出せない」構造になったのです。
🚪 もう一つの進化:Retrieval Gate(検索門番)
もう一つのアドバイスが**「Gating(門番)」**です。
AIは「こんにちは」と言われただけでも、真面目に過去のログ(ベクトルDB)を検索しに行き、無関係な記憶を引っ張り出して混乱することがあります(Context Dilution)。
そこで、思考プロセスの入り口に「門番」を置きました。
### Phase 2: Kālāma Audit (Retrieval Gate)
- Retrieval Gate:
- [Does this query require external memory/context? Yes/No]
- *If No, skip to Phase 4.*
「この質問に答えるのに、外部記憶は必要か?」と自問させ、不要なら即座に回答させる。
これにより、応答速度が上がり、回答のキレ(Soberさ)が増しました。
📝 実際のコード (System Instructions v1.6.0)
以下が、Redditの知見を仏教用語に翻訳して実装した、最新の思考プロセス制御プロンプトです。

<details>
<summary>⚙️ Digital Cognitive Process (v1.6.0 Logic-Bonded Core)</summary>
### Phase 2: Kālāma Audit (Retrieval Gate)
- **Retrieval Gate**:
- [Does this query require external memory/context? Yes/No]
- *If No, skip to Phase 4.*
### Phase 3: Votthapana Determination (Fact Extraction)
*※ Pass 1: Extract quotes only. Do NOT compose sentences yet.*
- **Fact Extraction**:
1. [Source A] -> [Quote: "Exact quote"]
- **Re-ranking Filter**:
- [Discard facts not directly relevant to the query]
### Phase 4: Javana Execution (Logic Construction)
*※ Pass 2: Compose using ONLY the facts selected in Phase 3.*
- **Drafting**: [Compose the answer using only the facts determined in Phase 3]
</details>
全文はGitHubで公開しています。
コピー&ペーストでGemini 3.0 Pro(または1.5 Pro)に使えます。
🔮 Next Step: No-Codeツール「Flowise」への挑戦
実は、アドバイスをくれたエンジニアの Just_litzy9715 氏は、もう一つ重要なヒントをくれました。
"For no-code, this wires up in AnythingLLM + Flowise"
(ノーコードでやるなら、AnythingLLMとFlowiseを組み合わせれば実装できるよ)
正直に言うと、今の私にはまだハードルが高い技術です。
しかし、彼が私の「No-Code」という制約を尊重し、わざわざPythonを使わない実装ルートを提案してくれたことに、深いリスペクトと感謝を感じています。
今はプロンプトだけで実装しましたが、今後はAI(Gemini)を教師として、この**「Flowise」**についても学び、実装まで辿り着きたいと考えています。
エンジニアの方々が築いてきた技術の山を、私は私なりのルート(対話と仏教)で登っていきます。
結びに:技術と対話の交差点
私はコードが書けませんが、エンジニアの方々が積み上げてきた「RAG」や「Chain-of-Thought」といった技術概念は、プロンプトという「言葉」を通じて、私たちノンコーダーでも扱える武器になります。
Redditのエンジニアは、私の「仏教アーキテクチャ」を否定せず、「その概念なら、技術的にはこう実装するといいよ」と助け舟を出してくれました。
「技術(Code)」と「思想(Prompt)」が交差するところに、新しいAIの可能性が眠っている。
今回のアップデートで、そう確信しました。
ぜひ、v1.6.0の「シラフなAI」を体験してみてください。
Discussion