🐶

Difyにrokadoc変換処理を組み込む

に公開

今回はDifyの処理にrokadocの変換処理だけを組み込ませる設定の一例を記載しようと思います。

rokadoc(ベクトルストア込み)を外部ナレッジとして組み込む場合は下記を参照してください。
https://zenn.dev/timoneko/articles/b344b2125f8309

以下のように簡易的に組みました。

  • ユーザーはとあるドキュメントを保持しており、LLMにrokadocの出力結果を投げる。

開始ノード


開始ノードではアップロードファイルを入力としておきます。

HTTPリクエスト ノード

設定は下記のように実施します。
(4分のタイムアウトを超える場合は、/api/doc2txt/partsのエンドポイントがありますので、ページ単位ごとで回すことをおすすめします。(APIの使用制限には注意))

api-keyは、rokadocの自身のhomeから確認することができます。

LLMノード

今回は、出力結果を要約してもらいます。

AIは自身の好きなモデルを設定しておき、コンテキストにはrokadocで変換したjsonをそのまま差し込んでいます。(LLMの性能がイマイチな場合はjsonの一部を切り取って渡すと良いかもしれません。)

終了ノード

LLMの出力結果を出力しています。

テスト


テストする場合は、三角のアイコンをクリックすることで実施できます。


自身の適当なファイルをアップロードしましょう。あとは待つだけです。

まとめ

今回のように、1ファイルずつLLMに聞く方法もありますし、APIを利用すればナレッジにも溜め込んでいけると思います。自身のワークフローを想定して作成してみてください。
ドキュメント変換のアプリは様々ありますのでファイルのタイプによっていろんなドキュメント変換のツールに切り替える仕組みを構築するのも面白いと思います。

Discussion