👻

Google Cloud UPDATES まとめ -BigQuery data canvas, Gemini in BigQuery など

2024/05/15に公開

本記事では、2024/5/13 に開催した Google Cloud UPDATES #3 の内容から、登壇者が特にイチオシだった機能や、参加者からの質問で盛り上がった UPDATE をお伝えします。
なお、資料や動画はイベントページからも確認できるので、こちらも是非ご活用ください!

BigQuery data canvas

Google Cloud Next で発表された新プロダクトです。
自然言語を使って、データの検出や変換、クエリ、視覚化などが可能な機能です。
本イベントの中では、動画を用いたデモを行いました。
まず、テーブルに関連する単語をいれてテーブルを選択するシーンから。

その後、クエリしたい内容を自然言語で入力すると、SQL 文が自動生成されます。このサンプルデータでは、MLB の試合に関するデータが取り上げられており、”球団ごとの平均観客数を教えて” と問うと、SQL が自動生成されることが確認できます。

クエリを実行すると、実行結果が表示されます。
更に、”可視化”をクリックすることで、結果に関するグラフが表示されます。現時点では、棒グラフ、円グラフ、折れ線グラフなど 5 種類のグラフに対応しています
グラフと合わせてデータが何を表しているかに関するサマリーも記載されます。

また、グラフの操作も可能です。自然言語で並び替えを指示すると、グラフの表示を変えることができます。

BigQuery data canvas により、SQL に詳しくないメンバーでも、データの探索や Join などの処理を簡単に行うことができます。
また、探索の結果を Notebook へエクスポートすることも可能なので、まず BigQuery data canvas 上でデータを探索し、エクスポートにより Notebook の下地を作ってから本格的な分析を始めるなどのユースケースも考えられます。

Gemini in BigQuery

自然言語によりクエリの生成や、クエリの内容の説明を行ってくれる機能です。
質疑応答の中で ”どのようにクエリ生成の結果の精度を高めたらいいか” という質問をいただきました。

基本的には、メタデータ(Description) を充実させたり、カラム名をわかりやすくするなど、元データ側の整備が重要となります。これは、クエリ生成に限らず重要な事項となります。
また、合わせてプロンプト内で “このカラムはこの意味です” などと明示的に指示をすることでも、精度を高めることができます。

参考リンク

BigQuery data preparation

こちらも、Google Cloud Next で発表された新機能の一つで、BigQuery Studio 上でデータのクレンジングを行うことができる機能です。
データの傾向を確認しながら、データ探索を行う前の、データの傾向理解などに役立てることができます。

更に、Gemini ならではのポイントとして、右側にデータクレンジングに関する自動提案の機能がついてきます (画面右側参照)。
例えば、日付や通貨の単位など、列の中で揃っているべきポイントがずれているときに、自動的に補正の提案をしてくれます。
現時点で全てをこの自動提案に任すことができるかというと、そうではないケースもあるかとは思いますが、例えばシンプルなケースに活用するなど、クレンジング作業を半自動化することに役立てられます。

なお、イベント時点では、Public Preview にはなっていません。ご興味あれば、担当の営業チームや、パートナー様までお問い合わせください。現時点で全ての皆様にお試しいただくことはできません。さらなるアップデートにご期待ください。

Model Builder : プロンプト管理

こちらも、Google Cloud Next でアップデートのあった内容です。
プロンプトの管理を効率化するための機能を幾つか紹介し、イベントの中でデモを行いました。
まず、プロンプトのバージョン管理について紹介しました。以下の図のように、プロンプトに名前をつけて保存ができ、更にはその変更履歴も追っていくことができます。


プロンプトを変更する際に、複数のプロンプトを並べて、結果を比較することもできます。プロンプトによる出力結果だけでなく、一貫性・流暢さ・安全性など、数値的な指標も合わせて表示されます。

また、プロンプトに対する理想的な回答(この例では正しいレシピなど)がわかっているときは、”グラウンドトゥルース”の機能を利用することにより、理想の回答との類似度を、ROUGE や BLEU の指標で評価することも可能です。

こちらも Google Cloud Next で発表された機能です。イベント内やイベント資料では Public Preview となっていますが、ちょうどイベントの翌日(5/14)に一般提供になりました
LLM を Google Search と Grounding を行うことで、回答に Google Search の結果を取り入れることができます。こちらもイベントの中でデモを行いました。

Grounding を行っていない場合は、”今日時点の天気”など、LLM の学習データからは返答が難しい返せないケースが出てきます。これは、LLM の学習が特定の時点 (画像の例だと 2023年11月)のデータを使っているためです。

ここで、“根拠付けを有効にする” を有効にし、Google Search を選択すると、回答が変わり、Google 検索の結果も反映した回答に変わります。これにより、最新の情報など、外部の情報も交えて回答を返すことができます。

また、セッションの最後では、Grounding on Google Search を含む、Google Cloud の生成 AI 関連機能に関するサンプルコードについても、ご案内しました。
https://github.com/GoogleCloudPlatform/generative-ai

まとめ

Google Cloud UPDATES #3 (2024年) で特に盛り上がったアップデート内容について、まとめました。
定期で開催しているので、是非イベントにも遊びに来てください!
生放送で質疑応答なども行っており、今回は 13 件の質疑応答があるなど、かなり盛り上がってます!
イベント登録はこちらから!

Google Cloud Japan

Discussion