Data Cloudのノーコードビルダーで予測AIモデルを作成してみた
はじめに(TL;DR)
Data Cloud 「Einstein Studio」タブからノーコードで予測AIモデルを作成してみたので一連の流れを紹介します。Data Cloudを使用することによって新規、もしくは既存のAIモデルをSalesforceに組み込むことができますが、本記事ではモデルをノーコードで新規に作成し、過去の解約顧客データより解約予測モデルを作成、結果を確認してみます。
Einstein Studioとは?
Einstein Studioとは、Data Cloudの予測AI機能です。モデルビルダーとも呼ばれていますが、既存のAIモデル(Sagemaker, Google Vertex, Databricks)を組み込んだり、ノーコードで1から機械学習モデルを構築することもできます。
それでは早速作成開始!
1. 下準備
モデルを作成する前に、ユースケースの設定と、データの用意が必要です。
今回は、対象顧客の解約予測率を把握するために、過去の解約顧客データから機械学習モデルを作成していきます。
S3に解約顧客データcsvファイルをアップロード、Data CloudのS3コネクタよりデータを取り込んでいきます。
データの中身
以下の項目で7000人分のデータを使用します。
- Record ID
- 支払い方法
- 性別
- 合計請求金額
- 月別請求金額
- 解約(TRUE/FALSE)
- 契約期間
- 通信サービス
- テクニカルサポート
Data Cloudデータストリーム画面
2. データマッピング
Data Cloudにデータが取り込めたら、データモデルにマッピングをします。データストリームレコードの「データマッピング」の下で「確認」をクリックしてください。スクショではCustomer Churnのデータの例です。
3. モデルの作成
Data Cloudにデータが準備できたので、ノーコードでモデルを作成していきます。
ここからはスクショとともにステップバイステップで解説していきます。
- Einstein Studioに移動し、「予測モデルを追加」をクリック
- 「モデルを最初から作成する」を選択
- データソースの選択では、先ほどデータストリームをマッピングしたDMOを選択(これは、モデルがトレーニングされるデータと考えてください)
- 必要に応じてデータをフィルタリングすることができます。
- モデルの目標を設定(例: 顧客の解約を最小化したいので、値を予測する項目はChurn, TRUEの値を最小化を選択)
- モデルのトレーニングに使用する変数を選択してください。すべての変数を選択する必要はありません。
- 最適なアルゴリズムは事前に選択されていますが、必要に応じて別のアルゴリズムを再選択することも可能です。
- 内容を確認したら、「保存してトレーニング」をクリックしてください。
- 設定完了!トレーニング完了まで数十分かかるので待機
4. モデルを有効化する
モデルのトレーニングが完了しても、すぐに有効化、とはいきません。
「良いモデル」は「良い学習データ」に依存しており、このステップで学習に使用したデータに関する問題がないか確認することができます。
モデルの詳細ページで「トレーニングメトリクスを表示」をクリックして、再びModel Builderを起動します。ここで、データやモデルのパフォーマンスに関する詳細なトレーニングメトリクスを確認できます。
いくつかのメトリクスの意味がわからない場合は、情報アイコン(i)にカーソルを合わせてみてください。最も重要なメトリクスは「モデルトレーニング品質」にあります。「その他のメトリクス」セクションは、より技術的なユーザー向けです。
すべてが問題なければ、モデルを有効化します!
5. モデルを活用して、予測結果を算出してみる
ここまでで、取り込んだ過去データを使用して顧客属性と解約率の関係性を学習したAIモデルを作成できました。
それでは、既存顧客の解約予測を確認していきたいと思いますが、その前にもう1ステップ必要です。
「予測ジョブ」の作成です。
予測ジョブの作成は、モデルの「インテグレーション」タブから「新しい予測ジョブ」ボタンで行うことができます。
- 指定されたDMOを参照し、
- すべての行に予測モデルを適用し、
- 出力を新しいDMOに保存します。
- 予測ジョブ作成後、有効化ボタンを押しますが実行完了まで数分かかります。
以下、予測ジョブ作成後の画面です。
それでは、いよいよ結果の確認です!予測ジョブを作成したことによって、新たに"Predicted_Chrun"というデータモデルができているので、Data Cloudのデータエクスプローラータブより中身を確認していきます。
解約予測の数字がしっかりと各顧客に入ってきているのが確認できました!
このデータモデルを使って、セグメントに予測スコアを活用したり、計算済みインサイトで集計をとったり、などというように活用もできるので、予測ジョブによって出力されたデータモデルは非常に便利ですね。
Discussion