BigQuery data canvasを試してみた
はじめに
データ・エージェンシーの高橋です。
2024年4月9日に、BigQueryの新機能である「データキャンパス」がリリースされました。ざっくり言うと、データ加工ステップの可視化や自然文によるクエリ作成などができるようです。
それでは早速試してみましょう。検証にあたり、以下の公式ドキュメントを参考にしました。
事前準備
プレビューである現段階では、まず利用申請が必要です。
公式ドキュメントから申請フォームを開き、[ BQ Data Canvas Access ] をクリックします。
次の画面では [ グループに参加 ] をクリックします。
これで事前準備は完了です。
検証開始
ここではデータとして、[ bigquery-public-data.google_trends.international_top_terms ] を利用します。これはGoogle トレンドに関するデータセットのうち、全世界のデータが格納されたテーブルです。
まずはこのテーブルを表示します。
画面上部の [ クエリ ] > [ データキャンパス内 ] をクリックします。
キャンバスが開き、これまでも確認できたプレビューが表示されます。左下の [ クエリ ] をクリックします。
プロンプトが表示されたら、[ country_nameがjapanのものだけ表示 termの上位20件を表示 それぞれの件数も表示 ] と入力してEnterキーを押します。
生成されたクエリを確認し、問題がなければ [ 実行 ] をクリックします。
クエリ結果が表示されたら、グラフにしてみます。[ 可視化 ] > [ 棒グラフの作成 ] をクリックします。
サマリーと棒グラフが表示されましたが、少し見づらい感じです。
プロンプトに [ sort by count, make the label diagonal ] と指示を追加してEnterキーを押します。なお、ここでは日本語での指示がうまく伝わりませんでした。
棒グラフが件数順にソートされ、ラベルも見やすくなりました。ここまでの全体像は以下のように表示されています。
まとめ
今回検証できたのは、BigQuery data canvasの機能のほんの一部だと思います。さらにいろいろと検証を進め、業務にも導入していきたいと思います。
株式会社データ・エージェンシー
弊社では、エンジニア経験を活かしてデータエンジニアリングにチャレンジしたい方を募集しています。採用情報や社員インタビューについては以下をご参照ください!
Discussion