😽

自然言語でのデータ分析を当たり前に:IVRyのDatabricks Genie運用の現在地(インターン視点)

に公開

こんにちは!IVRyのDataサークルでインターンをしているMiyakeです。

インターンとしてIVRyに参加して最初の1ヶ月間、私は「ビジネスサイドの戦略立案における意思決定のスピードを上げる」という狙いに対して、DatabricksのLLMであるGenieを活用して、誰もが自然言語でデータ分析を自走できる仕組みづくりに取り組みました。本記事はその実践記録です(2025/07/22〜2025/08/15での活動記録です)。

IVRyでのインターンに興味がある方や、Databricks Genieについて知りたい方に読んでいただければ嬉しいです。

本記事は、#IVRy_AIブログリレー の9月10日(8日目)の記事です。昨日は、エンジニアのkomtakiさんが「IVRyの半年で激変したコーディング支援ツール:Cursor, Claude Code等の導入実録」という記事を公開しました。ブログリレーの記事一覧は「IVRy AIブログリレー全記事まとめ」をぜひご覧ください。

背景:意思決定の“待ち時間”をなくしたい

これまでビジネスサイドがデータを必要とする際、まずデータチームへ分析を依頼します。そこから、依頼の背景や欲しいデータの要件をすり合わせ、分析、そして結果の確認…というプロセスを経るため、最終的なアウトプットを得るまでにどうしても時間がかかっていました。この"待ち時間"が、迅速な戦略立案におけるボトルネックの一つとなっていると感じました。そこで、このリードタイムを短縮する解決策として、Databricksに搭載されているLLM「Genie」を活用し、データ分析を自走してもらう、ということを目指しました。

そもそもGenieとは

Genie自身に何ができるかを聞いてみたところ、以下のように答えてくれました。

私はデータベース内のデータをSQLクエリを使って取得し、ユーザーの質問に基づいて
データを提供することができます。また、データの可視化もサポートしています。
データの解釈や予測は行いませんが、必要なデータを提供することで、ユーザーが自身で
分析や結論を導き出すのを支援します

つまりGenieは、ユーザーの質問に応じてSQLを生成しデータを取得、その結果を可視化まで行ってくれる「データ提供・可視化サポート役」(示唆出しや解釈は範囲外)です。
例えば「積み上げ棒グラフでMRRの顧客区分別推移を見せてください」と入力すると、GenieがSQLを自動生成し、データを抽出・グラフ化してくれます。

詳細は以下のDatabricksが出しているGenieの文献をご覧ください。

https://docs.databricks.com/gcp/ja/genie

今回は、このGenieを実務に導入できるか検証した事例を、2つご紹介できればと思います。

検証①:可視化

まず、ビジネスレポートでそのまま利用できるような、高品質なグラフが作成できるかを検証しました。以下は、私たちが想定していたグラフ(図1)と、実際にGenieが出力したグラフ(図2)です。(数字は架空のものです)


図1:想定していたグラフ


図2:Genieが出力したグラフ

Genieのグラフ作成機能について、以下のことが分かりました。

  • 得意なこと: 大まかな傾向や割合を素早く確認するための、簡単なグラフ作成。

  • 苦手なこと: 線の太さの変更や、企業ロゴの色(例:IVRyの緑)を指定するなど、デザインの細かい調整。

結論として、 データ確認などの内部利用には便利ですが、デザインの作り込みが必要な顧客向けの提案資料などへの使用は難しいと判断しました。

検証②:複雑な計算

チャーンレートなど、ビジネスで利用される指標の中には単純な算術平均を用いてはダメなケースが多々あります。

例えば業界Aのチャーンレートが1%、業界Bのチャーンレートが3%の場合、業界AとBの合計チャーンレートは単純に1%と3%の平均で2%とはなりません。しかし計算済みのチャーンレートがフィールドにある場合、Genieは単純なプロンプトではこのような誤った計算をしてしまいます。

この課題に対して様々なプロンプトを試した結果、Genieに明確な計算定義と要件を詳細に記述することで正確な計算結果を得られることがわかりました。

ただし、正しい結果を得るまでには何度も試行錯誤が必要で、一度成功しても毎回同じ定義を伝える必要がありました。そこで解決策として、事前に定義をコンテキストとして入力したり、成功した問いかけを「サンプルクエリ」として保存し、誰でも再利用できる環境を整えました。それでも表現を少し変えただけで誤答してしまうことが多々ありました。

Genieのメリット・デメリット

ここまでの検証で分かった、Genieのメリットとデメリットはこちらになると思います。

メリット

  • 自然言語で質問するだけで、手軽にデータを可視化できる
  • 詳細な定義やコンテキストを与えることで、複雑な計算にも対応できる

デメリット

  • デザインの微調整が難しく、高品質なビジュアル作成は苦手
  • 将来予測のような高度な分析は(現時点では)できない
  • プロンプトの表現に結果が左右されやすく、意図しない誤答をすることがある

(この内容は8月15日の活動記録以降の出来事についてです)
しかし最大のメリットはGenieの進化の速さだと思います。このノートを執筆し始めた後、再びGenieにグラフ作成を依頼したところ、驚くほど機能が向上していました。特に以下のようにグラフの棒の太さや色選択の自由度が大幅に改善されていました。


図3:Genieが現在出力するグラフ

現在のGenieのユースケース

数値の誤りが致命的になるケースではGenie単体での利用は難しいため、現在は別の形で活用を進めています。

実はGenieはDatabricksにある既存のダッシュボードに対しても使用できます。そこでダッシュボード自体にはグラフ表示しないが、内部的に多数の区分を仕込んでおき(セマンティックレイヤー)、ダッシュボードに対してGenieに質問ができるようにするという方法で、誤った情報を提供しないための基盤を構築しました。

例えば、顧客区分別MRRのダッシュボードに内部的に様々なディメンションのデータ(業種別MRRや従業員数別MRRなど)を仕込んでおき、「従業員数別で表示して」とGenieに質問すると、既に検証済みのデータを引き出すことで正確な情報提供を実現しています。現在は私のメンターであったwadaさんがこの取り組みをさらに発展させています。詳細は後日のAIブログリレーで紹介される予定ですので、ぜひご期待ください!

最後に

IVRyは職種を問わずAIを実務に溶け込ませることに前向きで、インターンの私にも、Genieの検証→運用設計→展開まで任せてもらえました。

IVRyでは「イベントや最新ニュース、募集ポジションの情報を受け取りたい」「会社について詳しく話を聞いてみたい」といった方に向けて、キャリア登録やカジュアル面談の機会をご用意しています。

ご興味をお持ちいただけた方は、ぜひ以下のページよりご登録・お申し込みください。

https://www.notion.so/209eea80adae800483a9d6b239281f1b?pvs=21

https://herp.careers/v1/ivry/wmZiOSAmZ4SQ

また、私が所属するDataチームでも新卒・インターンを募集しています。優秀で面白い社員さんたちと一緒に働けるチャンスです。ぜひ一度、お話ししてみてください!

https://note.com/ivry/n/nc80c02e6250f

IVRyテックブログ

Discussion