🍡

社内データ活用を加速する“Kibidango”の新機能!テーブルレコメンド×SQL生成で検索体験を革新

はじめに

こんにちは。D2Cのデータサイエンティスト(AIエンジニア)の須田です。

前回、最小限のリソースで社内向けSQL自動生成ツールを構築した話を記事にまとめました。
もしまだ読んでいない方は、ぜひこちらからご覧ください
▶︎ 最小限のリソースで作った社内向けSQL自動生成ツールの話

今回はその続編として、社内データ探索をさらに身近に、スムーズにするための新機能をリリースしました。 テーマは「テーブルレコメンド × SQL生成」です。

この記事では、新機能の中身を中心に紹介します。


「こういう分析をしたいけど、どのテーブルを使えばいいの?」
「社内のデータを使ってこういうことってできそうなんだっけ?」

そんな社内の声に応えるために生まれたのが、Kibidangoです。
Kibidangoは、自然言語で質問するだけで、社内データベースから必要な情報を探し、SQLまで生成してくれるAIツールです。


今回のアップデートの中身

1. テーブルレコメンド機能の追加

「こういうことを分析したい」と自然言語で質問すると、
目的に応じた最適な社内テーブルをレコメンドしてくれる機能を追加しました。

たとえば:

「デモグラデータを集計したい時は、どのテーブルを使えばいい?」

といった質問に対して、顧客情報や属性情報に関連するテーブルが提案されます。

デモ画像

ちょっと下に画面をずらすとSQLクエリが出力されているのも確認できますね。
ただ出力されるのではなく、データによって異なる社内の指定ルールを考慮+limitを考慮しているところも工夫ポイントです。

この機能を支えている技術と工夫

  • Amazon Bedrock Knowledge Base(ベクトル検索)
  • Claude 3.5 Sonnet による自然言語応答
  • Glue Data Catalog由来のスキーマ情報(CSV化)
  • 用途ごとのテーブル説明+サンプルクエリのナレッジ整備
  • プロンプトテンプレートの最適化

2. SQL生成機能の強化(JOIN対応)

従来の単一テーブルのクエリ生成に加えて、
複数テーブルのJOINに対応したSQL生成ができるようになりました。

  • キーの一致を文脈から自動で判定し、JOIN句を構築
  • テーブル間の関係性を自然言語で補足説明
  • 出力されるSQLも実行しやすい形式に整備

この2つの機能は、単体でも便利ですが、
テーブルレコメンド → SQL生成 → データ取得という流れをつなぐことで、
スムーズな分析体験を実現しています。


ユーザーの声(リリース直後のリアルな反応)

リリース後、実際に触ってくれた社内ユーザーから前向きな感想を多くいただきました。
一部をご紹介します。

💬 「先月末から直近一年」と記載したら、関数付きでSQLが出てきて、個人的に感動しました!

💬 集計ロジックを考える時間が短縮されそう。(新人の人だと特に)

💬 簡単なSQLがすぐ出て良かった。SQLを触らない人でも“こういうことができるかも”とイメージが湧く入口になると思う。

💬 「氏名を出したい」では、JOIN先のテーブルも指定されていた。わかってるな〜という感じでした。

💬 「データを取得したいけど、どのテーブルを使えばいいのかわからない」という場面はまだある。テーブル一覧や用途別のナビゲーションがあると嬉しいかも。

💬 きびだんごが肉まんに見えました。すみません(ちなみにセブンの肉まんが好きです)。

こうした声を受けて、

  • テーブルナビゲーションの強化
  • NGルールやセキュリティルールの整備

などが、次の改善ポイントとしてすでに検討に入っています。
これらも含めて、今後はさらにユーザー体験を高めるためのアップデートを予定しています。


今後の拡張・展望

Kibidangoは「情報を簡単に、自立した形で活用できるようにして、ユーザーの作業効率アップに貢献すること」をビジョンに、進化を続けていきます。

■ 精度と柔軟性の向上

  • Claude 3.7 など最新モデルでの精度検証
  • 用途別テーブル・クエリ例のナレッジ拡充
  • 質問タイプに応じてプロンプトを動的に切り替える設計

■ 実行と操作の拡張

  • 生成クエリをAthenaにそのまま渡して実行する機能
  • リセットボタンで流れを初期化できるUI改善

■ パーソナライズと履歴活用

  • ユーザーログインによる個別最適化
  • 過去のやり取りを参照したやりとりの継続性
  • 条件や設定の保存による再利用性の向上

■ パフォーマンス強化

  • 処理速度のさらなる向上
  • 条件の固定設定(テンプレート適用)の実現
  • クエリ出力評価においてパフォーマンスと最適化項目の精度向上を目指す

おわりに

今回の機能は、AWSの先進的な活用事例としてもご紹介いただきました。
「こんなやり方もあるんだ」と社内外からも参考にしていただける機会が増えてきたのは、嬉しい反響のひとつです。

まだ始まったばかりのプロダクトですが、 ユーザーの声や技術の進化を取り入れながら、これからも着実に育てていきたいと思っています。

ここまで読んでくださってありがとうございます!
「こんな工夫してます」「ここは共感した」など、ぜひコメントやリアクションいただけたら嬉しいです。(会社規定で返答はできませんが全て拝見します)

D2C m-tech

Discussion