Tableau Public実践 BIツールデータ活用100本ノック 第2章
この記事は、Tableau(タブロー) Public実践 BIツールデータ活用 100本ノックを読んで学んだことをまとめています。Knockタイトルや内容が本とは異なっている部分もありますので、あらかじめご了承ください。
この記事をきっかけにもっと勉強したいと思った方は、是非本をお手に取って読まれてください。
【リンク紹介】
・【一覧】Tableau Public実践 BIツールデータ活用100本ノック
・これまで書いたシリーズ記事一覧
この章ではデータの全体像を把握していきます。
データ準備
Knock21:データを読み込んで確認する
Knock2と同様にして
「データソース」タブ→「接続」の「テキストファイル」→「customer_master_20221231.csv」を選択します。
さらに、「item_master_20221231.csv」、「order_202001.csv」を選択してデータを読み込ませます。
※読み込ませるデータはこちらからダウンロードできます。
Knock22:注文データを縦方向に結合する(ユニオン)
order_○○.csvの名前が付いたファイルをすべて縦方向に結合します。
「ユニオンの新規作成」をダブルクリックし、「ワイルドカード(自動)」を選択してファイル名を「order*」として、「適用」を選択します。
結合が完了したら「ユニオン」を「order.csv」に変更しておきます。
Knock23:注文データにマスターデータを横に結合する(リレーション)
Knock22で作成したキャンバス上の「order.csv」に
「ファイル」の「customer_master_20221231.csv」と「item_master_20221231.csv」を
ドラッグ&ドロップで結合させます。
基本統計量の確認
Knock24:注文ステータスの発注済みデータのみを表示する
- シート1を選択します。(シート名を「発送済み数」に変更)
- データペインの「order.csv」のメジャーネームにある「注文ステータス」を、行シェルフにドラッグ&ドロップします。
- データペインのメジャーバリューにある「order.csv(カウント)」を、「マークカード」の「テキスト」にドラッグ&ドロップします。
- 行シェルフの「注文ステータス」を右クリックし、「フィルターを表示」をクリックして、フィルターを表しさせます。
- 「注文ステータス」フィルターで「キャンセル」のチェックを外すか、
右クリックして「値を除外」を押して「キャンセル」のみをチェックすれば、
発注済みデータのみを表示できます。
Knock25:注文期間を確認する
-
シートを新しく作成します(シート名は「注文期間」)。
-
データペインの「order.csv」のディメンションにある「注文日時」を右クリックで「マークカード」の「テキスト」にドラッグ&ドロップします。
- 「最大値(注文日時)」を選択します。同様にして「最小値(注文日時)」も選択します。
注文期間は表示できましたが、少し表記を変更します。
- 「マークカード」の「テキスト」をクリックし、「三点リーダーのアイコン」をクリックします。
- 以下のように表記を変更し、「適用」を押すと、ビューの表記が変更されます。
Knock26:基本統計量を確認する
次に、「注文数」と「金額」に着目して、基本統計量を確認します。ここでの基本統計量として(1注文当たりの)平均値、中央値、最小値、最大値を採用します。
-
シートを新しく作成します(シート名は「基本統計量」)。
-
データペインの「order.csv」から「メジャーバリュー」を「マークカード」の「テキスト」に、「メジャーネーム」を「行シェルフ」に、それぞれドラッグ&ドロップします。
フィルターを用いてメジャーネームで不要な項目を非表示にします。
- 「フィルター」の「メジャーネーム」の▽→「フィルターの編集」
- 「order.csv」と「金額」のみを選択して「適用」をクリックします。
適用後のビュー |
- データペインの「金額」を、マークカードの下に表示された「メジャーバリュー」に右クリックでドラッグ&ドロップします。
- 「平均(金額)」を選択します。同様にして平均値、最小値、最大値も選択していきます。
パレート図の作成
Knock27:ヒストグラムを用いて顧客別の注文金額を確認する
-
シートを新しく作成します(シート名は「ヒストグラム(顧客別の注文金額)」)。
-
データペインの「金額」を右クリック→「作成」→「計算フィールド」を選択します。
- 名前を「計算1」から「顧客別注文金額」に変更し、計算式を以下のように記述します。
ちなみに、この{FIXED ○○ : SUM(△△)}
の表記はLOD計算によるものです。
詳しい解説は省いて、画面上の意味だけを説明すると、
金額の合計を顧客ID別に表示する
という命令になっています。
詳細は以下のリンクを参考にしてください。
- 「適用」をクリックすると、データペインに新しく「顧客別注文金額」が作成されます。
次にヒストグラムを出力する前にビンの設定を変更します。ビンのサイズを大きくし、大まかな状況を把握するためです。
- データペインの「顧客別注文金額」→「作成」→「ビン」を選択します。
- ビンのサイズを「25,000」に変更します。
- データペインに「顧客別注文金額(ビン)」に追加されたことが確認できます。
-
「顧客別注文金額(ビン)」を「列シェルフ」へ、ドラッグ&ドロップします。
-
「顧客別注文金額」を「行シェルフ」へ右クリックでドラッグ&ドロップし、「カウント(顧客別注文金額)」を選択します。
このヒストグラムから、「顧客1人当たりの購入金額(顧客単価)が上昇するほど、顧客人数が減少している」ことがわかります。
Knock28:顧客単価に対する顧客数の累計比率を確認する
-
シート「ヒストグラム(顧客別の注文金額)」を複製し、シート名を「線グラフ(累計売上比率)」、グラフタイトルを「顧客単価に対する顧客数の累計売上比率」とします。
-
マークカードの「自動」を「線」に変更します。
- 行シェルフにある「カウント(顧客別注文金額)」を右クリック→「表計算を追加」
- プライマリ計算タイプを「累計」と「合計」に、セカンダリ計算タイプを「合計に対する割合」に設定します。
Knock29:パレート図を作る
Knock27, Knock28のグラフを複合したものが「パレート図」です。
-
シート「線グラフ(累計売上比率)」を複製し、シート名を「パレート図」とします。
-
データペインから「顧客別注文金額」を「行シェルフ」に右クリックでドラッグ&ドロップし、「カウント(顧客別注文金額)」を選択します。。
- 2.で追加した行シェルフの「カウント(顧客別注文金額)」(※Δがついてないほう)を右クリックし、「二重軸」を選択します。
- マークカードの「アカウント(顧客別注文金額)」(※Δがついてないほう)の「自動」を「棒」に変更します。
パレート図の完成 |
Knock30:顧客単価毎の累計金額を確認する
Knock29のパレート図を基に確認すると、顧客単価が0~500,000の顧客層が顧客全体の約80%をしめていることがわかります。
ご協力のほどよろしくお願いします。
Discussion