FLINTERS BLOG
🚀

NotebookLMを使ってナレッジ集約し始めました

に公開

はじめに

株式会社FLINTERSの津布久です。
AI研究会という社内イベントで発表を行ないましたので、その内容を紹介します。


直近私たちのチームでは以下のような課題を抱えています。

  • 過去のSlackのやり取りを掘り起こすのに時間がかかる
  • 作成したドキュメントやシートの所在が分からなくなる
  • データ異常を発見した際の調査手順がテンプレート化されていない

これらの課題を改善するために、最近注目されている生成AIを使えないかということでNotebookLMを使ったナレッジ集約に取り組んでみました。

NotebookLMとは

NotebookLMは、Googleが提供するAI搭載のリサーチ・ライティングアシスタントです。
ユーザーがアップロードした資料を基に、質問への回答や要約、アイデアの生成などを行うことができます。
https://notebooklm.google/?gad_source=1&gad_campaignid=22706731437&gbraid=0AAAAA-fwSscVX2bwwi2vROK8VSMolXKVN&gclid=Cj0KCQjwwZDFBhCpARIsAB95qO3e5rxuoI0BlRmxD4QaNbvyIgYApjLzUqwXgiuDcRD9lVROFkGY-doaArRQEALw_wcB

主な特徴

  • ソースベースの回答: アップロードした資料のみを情報源として使用
  • 多様なファイル形式対応: PDF、テキストファイル、Google ドキュメントなど
  • 引用機能: 回答の根拠となるソースを明示
  • 無料で利用可能: Googleアカウントがあれば誰でも使用可能

NotebookLMでのナレッジ集約への取り組み

集約対象の情報

NotebookLMに以下の情報を集約することにしました:

  1. 運用保守情報: AWSやSnowflakeで発行した認証情報のローテーション方法
  2. 技術的な仕様: Snowflakeへのデータ格納で利用するツールの仕様
  3. メタデータ: Snowflake上の各テーブルのSLAやカラム情報

集約方法

今回は主に2つのケースでソース登録を行いました。

単純な文章

こちらはGoogleドキュメントに保存し、ソースとして登録するようにしました。
Googleドキュメントやスライドはソースに追加してからも、Googleドライブからの同期が可能で、情報の更新がしやすいという利点があったためです。
また、ドキュメントもgeminiを使って要約することで、統一されたスタイルにできるのも良かったです。

スプレッドシート

こちらはGASを使ってmarkdownファイルに変換し、ソースとして登録しました。
はじめGoogleドキュメントに変換してみましたが、列数や文字数によってはフォーマットが崩れる点が気になったため、markdown形式に変換するようにしました。
GAS側でスケジューリング設定できるので、定期的な変換も可能です。
ただし、手動でのアップロードが毎回必要になってしまうので、運用でのカバーが必要な点は課題だと感じました。

NotebookLMを使ってみた感想

良かった点

手軽に触れる

すぐに利用を開始できる点が非常に良かったです。

ソースにない情報は正直に教えてくれる

情報がない場合は「回答が分からない」と明確に伝えてくれるため、信頼性を感じました。

共有で限られた人にのみに公開可能

情報によって社内・チーム内のみなど必要な公開範囲が異なります。
その際にユーザー単位で閲覧者・編集者の権限付与することで適切な公開範囲にとどめることができます。
ソース自体を見せず、チャットのみ可能にする権限設定があるのもいいなと感じました。

気になった点

Googleシートの直接追加できない

今回はmarkdownファイルに変換・ダウンロード・ソースに追加というステップで行いましたが、やはり手間を感じました。
Googleドキュメントのように直接Googleシートを追加できるようになったら嬉しいですね。

ソースへの登録が手動

ソースの鮮度を高く保つためには、更新があったら再登録する運用が考えられます。
この手順を毎回忘れずに行うというのは難しいので、API連携で自動更新できるようになったらいいなと思いました。

回答精度

ソースに情報があるにも関わらず、うまく回答されないケースがありました。
この場合、原因がソースの構成によるものか・質問の仕方なのか・精度によるものなのか切り分けの難しさを感じました。

今後の展望

今回の取り組みを通じて、生成AIの活用はまだ始まったばかりであり、多くの可能性を秘めていることを再確認しました。
NotebookLMでのナレッジ集約は、情報の属人化解決に向けた第一歩として取り組みやすいと思いました。
今後も改良を行い、チーム内外に展開できるようにしたいです。

今回触ったサービス以外にも、直近はSnowflakeのCortex Agentsという技術が気になっています。
https://docs.snowflake.com/en/user-guide/snowflake-cortex/cortex-agents

こちらは、Snowflake上に格納した構造化・非構造化データをソースとして、質問に対する適したソースを解釈して回答するような機能を持っています。
例えば、SlackアプリとしてAPI連携させることで、Slack上でSnowflakeのテーブルに存在するレポート結果を確認できたりします。
SQLを書くのに慣れていない人が、データの確認を行う際に活躍すると考えています。

今後も新しい技術の動向を追いながら、生成AIの活用を進めていきたいと思います。皆さんも、まずは小さな範囲から生成AIツールを試してみることをお勧めします。

FLINTERS BLOG
FLINTERS BLOG

Discussion