🎮

Tableau Public実践 BIツールデータ活用100本ノック 第2章

2024/06/09に公開

この記事は、Tableau(タブロー) Public実践 BIツールデータ活用 100本ノックを読んで学んだことをまとめています。Knockタイトルや内容が本とは異なっている部分もありますので、あらかじめご了承ください。

この記事をきっかけにもっと勉強したいと思った方は、是非本をお手に取って読まれてください。

【リンク紹介】
【一覧】Tableau Public実践 BIツールデータ活用100本ノック
これまで書いたシリーズ記事一覧

この章ではデータの全体像を把握していきます。

データ準備

Knock21:データを読み込んで確認する

Knock2と同様にして
データソース」タブ→「接続」の「テキストファイル」→「customer_master_20221231.csv」を選択します。
さらに、「item_master_20221231.csv」、「order_202001.csv」を選択してデータを読み込ませます。
※読み込ませるデータはこちらからダウンロードできます。

Knock22:注文データを縦方向に結合する(ユニオン)

order_○○.csvの名前が付いたファイルをすべて縦方向に結合します。
ユニオンの新規作成」をダブルクリックし、「ワイルドカード(自動)」を選択してファイル名を「order*」として、「適用」を選択します。

結合が完了したら「ユニオン」を「order.csv」に変更しておきます。

Knock23:注文データにマスターデータを横に結合する(リレーション)

Knock22で作成したキャンバス上の「order.csv」に
ファイル」の「customer_master_20221231.csv」と「item_master_20221231.csv」を
ドラッグ&ドロップで結合させます。

基本統計量の確認

Knock24:注文ステータスの発注済みデータのみを表示する

  1. シート1を選択します。(シート名を「発送済み数」に変更)
  2. データペインの「order.csv」のメジャーネームにある「注文ステータス」を、行シェルフにドラッグ&ドロップします。
  1. データペインのメジャーバリューにある「order.csv(カウント)」を、「マークカード」の「テキスト」にドラッグ&ドロップします。
  1. 行シェルフの「注文ステータス」を右クリックし、「フィルターを表示」をクリックして、フィルターを表しさせます。
  1. 注文ステータス」フィルターで「キャンセル」のチェックを外すか、
    右クリックして「値を除外」を押して「キャンセル」のみをチェックすれば、
    発注済みデータのみを表示できます。

Knock25:注文期間を確認する

  1. シートを新しく作成します(シート名は「注文期間」)。

  2. データペインの「order.csv」のディメンションにある「注文日時」を右クリックで「マークカード」の「テキスト」にドラッグ&ドロップします。

  1. 最大値(注文日時)」を選択します。同様にして「最小値(注文日時)」も選択します。

注文期間は表示できましたが、少し表記を変更します。

  1. マークカード」の「テキスト」をクリックし、「三点リーダーのアイコン」をクリックします。
  1. 以下のように表記を変更し、「適用」を押すと、ビューの表記が変更されます。

Knock26:基本統計量を確認する

次に、「注文数」と「金額」に着目して、基本統計量を確認します。ここでの基本統計量として(1注文当たりの)平均値、中央値、最小値、最大値を採用します。

  1. シートを新しく作成します(シート名は「基本統計量」)。

  2. データペインの「order.csv」から「メジャーバリュー」を「マークカード」の「テキスト」に、「メジャーネーム」を「行シェルフ」に、それぞれドラッグ&ドロップします。

フィルターを用いてメジャーネームで不要な項目を非表示にします。

  1. フィルター」の「メジャーネーム」の▽→「フィルターの編集
  1. order.csv」と「金額」のみを選択して「適用」をクリックします。
適用後のビュー
  1. データペインの「金額」を、マークカードの下に表示された「メジャーバリュー」に右クリックでドラッグ&ドロップします。
  1. 平均(金額)」を選択します。同様にして平均値、最小値、最大値も選択していきます。

パレート図の作成

Knock27:ヒストグラムを用いて顧客別の注文金額を確認する

  1. シートを新しく作成します(シート名は「ヒストグラム(顧客別の注文金額)」)。

  2. データペインの「金額」を右クリック→「作成」→「計算フィールド」を選択します。

  1. 名前を「計算1」から「顧客別注文金額」に変更し、計算式を以下のように記述します。

ちなみに、この{FIXED ○○ : SUM(△△)}の表記はLOD計算によるものです。
詳しい解説は省いて、画面上の意味だけを説明すると、
金額の合計を顧客ID別に表示する
という命令になっています。

詳細は以下のリンクを参考にしてください。
https://st-brain.com/media/tableau_lod_fixed/

  1. 「適用」をクリックすると、データペインに新しく「顧客別注文金額」が作成されます。

次にヒストグラムを出力する前にビンの設定を変更します。ビンのサイズを大きくし、大まかな状況を把握するためです。

  1. データペインの「顧客別注文金額」→「作成」→「ビン」を選択します。
  1. ビンのサイズを「25,000」に変更します。
  1. データペインに「顧客別注文金額(ビン)」に追加されたことが確認できます。
  1. 顧客別注文金額(ビン)」を「列シェルフ」へ、ドラッグ&ドロップします。

  2. 顧客別注文金額」を「行シェルフ」へ右クリックでドラッグ&ドロップし、「カウント(顧客別注文金額)」を選択します。

このヒストグラムから、「顧客1人当たりの購入金額(顧客単価)が上昇するほど、顧客人数が減少している」ことがわかります。

Knock28:顧客単価に対する顧客数の累計比率を確認する

  1. シート「ヒストグラム(顧客別の注文金額)」を複製し、シート名を「線グラフ(累計売上比率)」、グラフタイトルを「顧客単価に対する顧客数の累計売上比率」とします。

  2. マークカードの「自動」を「」に変更します。

  1. 行シェルフにある「カウント(顧客別注文金額)」を右クリック→「表計算を追加
  1. プライマリ計算タイプを「累計」と「合計」に、セカンダリ計算タイプを「合計に対する割合」に設定します。

Knock29:パレート図を作る

Knock27, Knock28のグラフを複合したものが「パレート図」です。

  1. シート「線グラフ(累計売上比率)」を複製し、シート名を「パレート図」とします。

  2. データペインから「顧客別注文金額」を「行シェルフ」に右クリックでドラッグ&ドロップし、「カウント(顧客別注文金額)」を選択します。。

  1. 2.で追加した行シェルフの「カウント(顧客別注文金額)」(※Δがついてないほう)を右クリックし、「二重軸」を選択します。
  1. マークカードの「アカウント(顧客別注文金額)」(※Δがついてないほう)の「自動」を「」に変更します。
パレート図の完成

Knock30:顧客単価毎の累計金額を確認する

Knock29のパレート図を基に確認すると、顧客単価が0~500,000の顧客層が顧客全体の約80%をしめていることがわかります。

\bf{\textcolor{red}{記事が役に立った方は「いいね」を押していただけると、すごく喜びます \ 笑}}
ご協力のほどよろしくお願いします。

Discussion