🙆‍♀️

生成AI 構造化/エージェント rokadoc

に公開

リリースされてから、かなりアップデートがありそうだったので、記事を少し書き換えました。

rokadoc

ドコモビジネス(旧NTTコミュニケーション)から出ている、非構造化データを生成AIに適した構造化データに変えるツールやエージェントを利用できるサービスです。
↓ニュースリリース
https://www.ntt.com/about-us/press-releases/news/article/2025/0219_2.html

rokadoc(public beta版)のお試しサイトから無料で構造化変換とRAGを試すことが可能です。(クォータ制限上限あり)。

↓public beta版
https://rokadoc.ntt.com/

rokadocの詳細な仕様に関して

チュートリアルの紹介↓
https://docs.rokadoc.ntt.com/docs/tutorial/

API関連のドキュメント
https://docs.rokadoc.ntt.com/docs/api/

今回はPersonalと公式スペースに含まれているドキュメントで実験してみました。

ドキュメント変換

まずはアップロード

「Home」タブから、アップロードすることができました。
複数のファイルアップロードが可能なようで、変換したいPDF等のファイルをドラッグアンドドロップまたはクリックであげることができました。

結果確認

rokadocから変換された結果をUIで確認することができます。

  • 各コンポーネントに対して、どのような変換がされたかを確認することができるようです。
  • また変換された結果に関して編集機能がついていました。

プレイグラウンド

UIからアップロードした場合、変換後のドキュメントは自動的に内部でベクトルストアに格納されるそうです。(APIでは変換のみの利用も可能。)

また、会話を行うと、

右側に、参照したドキュメントが表示されます。
左側には、会話したスレッド(履歴)が残り、スレッドを選択すると、以前の会話から再開できるようです。

参照したドキュメントに対してさらに質問を実施する。

参照したドキュメントに対して、「チャットに挿入」ボタンを押すことで、チャットの質問に添付して、さらに詳細が聞くことができる機能が備わっていました。

RAGの構成をカスタマイズ

ここはまだ簡易的ではありますが、LLMのモデルの変更(gpt-5)やreasoning effortの設定も実施可能なようです。

エージェント機能

プレイグラウンドに対して、より自律的に情報を取得してくれる機能のようです。

RAGの場合だと必ず、参照ドキュメントをとってきてしまいますが、エージェントの場合は必要に応じて データをとってくるところが賢いと感じました。

プランに応じてタスクを自動的に考えるようで、回答根拠もハイライトして回答してくれました。

ファイルストア

アップロードしたファイルを確認することができるみたいです。

rokadocのタグ機能

タグを設定することで、ドキュメントの絞り込みや、RAGで検索する対象をタグで制御することが可能です。

ドキュメント管理からタグを追加。

RAG構成の設定から、検索する対象をタグで指定することが可能。

フィルタの設定でタグを設定すると、指定したタグのみでRAGが実施可能のようです。

Discussion