【Tableau】サンプルスーパーストアにおける「テーブル」カテゴリの利益率はなぜ低いのか?
はじめに
はじめまして。地方でデータサイエンティストとして働いているミヤと言います。
今回は、Tableauユーザーの永遠の謎の1つである、サンプルスーパーストアのテーブル
カテゴリはなぜ利益率が極端に低いのか、原因を突き止めたいと思います。
本題
Tableau Desktopをインストールした際に標準で備わっている「サンプルスーパーストア」というデータセットを使用していきます。
1. データセット
今回使用するデータセットの説明をします。Tableau Help上の説明は以下の通りです。
"Sample- Superstore (サンプル - スーパーストア)" データ セットは、Tableau に付属しています。これには、架空の会社内で改善が必要な重点エリアの特定に使用できる、商品や売上高、収益などに関する情報が含まれています。
サンプルデータはxls形式のファイルとなっており、データは以下の3つのシートに分かれています。
「注文」シートに10000件程度のデータが格納されており、オーダーがいつ発生したか、どのジャンルの商品が注文され、いつ・どのように出荷したか、どういう顧客が何の商品を注文したか、また、注文した商品の数量、売上、利益、割引率のデータ項目が揃っています。
「返品」シートには顧客から返品が発生したオーダーが入力されています。
「関係者」シートには各地域(~地方)の担当者名が入力されています。
2. 分析対象
Tableauを学び始める初学者が、サンプルスーパーストアを使用して初めて計算フィールドに触れる際、ほぼ必ず利益率
を算出することになるでしょう。
サンプルスーパーストアをもとにTableauを学ばれた方は一度は以下の計算式を作成したはずです。
利益率の計算式
この項目を作成後、おそらくサブカテゴリごとの利益率を可視化したことでしょう(ほとんどの教材がそうしています)。
すると、明らかにテーブル
カテゴリのみ利益率がマイナスに振り切っていることが確認できます。
サブカテゴリごとの利益率
私が今まで見てきた教材はこの事実を確認するところで止まります。なぜこのテーブル
というカテゴリが利益率が低いのか深掘りする作業に至りません。
なので今回は可能な限りこのテーブルカテゴリの利益率が低い原因を深掘りしていこうと思います。
3. 割引率の観点から見る
サンプルスーパーストアのカラムに、割引率
があります。まずは「利益が低い原因は割引をされているのではないか?」という仮説のもと、可視化を行っていきます。
まずは、サブカテゴリごとの割引率の平均を可視化します。これにより、オーダーごとに、どのくらい割引が適応されているのかがわかります。
サブカテゴリごとの平均割引率
グラフから、テーブルが購入された場合、平均して約26%の割引がなされていることがわかります。
思った通り、利益率が低い原因は「割引率」が影響されていそうです。
参考までに平均割引率と利益率の相関を可視化します。
平均割引率と利益率の相関
ここでは、サブカテゴリより少し粒度を落として、メーカー別にポイントをプロットをしています。青いポイントはテーブル
サブカテゴリに該当するメーカーです。
この図から、直感的に当然ではありますが「平均割引率」と「利益率」の間には負の相関がみられます。シンプルな単回帰ではありますが、統計的有意性も問題なさそうです。
傾向線の詳細
また、オーダー当たりにどのくらいの割合で割引が発生しているか見ていきたいと思います。
下記のように「割引フラグ」を作成し、購入の際に割引きされた割合(割引発生率)を集計、可視化します。
割引フラグ
割引発生率
テーブル
には、約90%の確率で割引が発生しています。定価で買ってもらう方が珍しいような状態ですね。
ここまで、テーブル
の製品はかなりの頻度で割引されていることがわかりました。
次からは、割引が起きている原因をさらに深掘りしていきます。
割引が発生している原因として、ここでは下記二点に原因があるのではないかと仮説を立ててみていきます。
-
テーブル
に売れ残りが発生しており、割引により在庫処分されている。 -
テーブル
に粗悪品が多く、割引をせざるを得ない状況となっている。
4. 単価、数量の観点から見る
そもそもテーブル
が売れているのか見ていきます。
サブカテゴリごとの売上数量
グラフからもわかる通り、テーブル
カテゴリはあまり売れていない商品みたいですね。
売れていない理由を少し深掘りしてみましょう。価格設定の観点で、それぞれサブカテゴリごとの単価を見ていきます。
まずは各レコードごとに、売上から数量を割ることで単価を算出していきます。
単価の計算
その上で、サブカテゴリごとの平均単価を可視化していきます。
サブカテゴリごとの平均単価
こう見ると、テーブル
カテゴリのみ平均単価が高い傾向にあることがわかります。
正直、約25,000円前後のテーブルであればそこまで高いとは思いませんが、他の家具、家電類と比較しても価格が抜けているため、来客する顧客層にとって価格感があっていないのかもしれません。
来店する顧客は高くても10,000円前後の商品を期待しているため、購入に至らないということですね。
5. 返品率の観点から見る
次に、製品の品質に問題があるのか確認していきます。テーブルの品質に問題がある場合、よく返品される傾向があるかもしれません。
よって、どのくらいの割合で返品をされているか、返品率という項目を作成し見ていきます。
返品率の計算式
サブカテゴリごとのに返品率を可視化します。
サブカテゴリごとの返品率
集計の結果、テーブル
の返品率は他カテゴリと比較して返品が頻発していることはなさそうでした。
このことから、テーブル
の製品自体は購入さえしてもらえばある程度満足してもらえる製品であることがわかります。
6. 考察
以上を踏まえ、今回の分析から得られた考察をまとめていきます。
まず、テーブル
カテゴリの利益率が低いのは、多くの製品に対して割引を行っていることが原因と思われます。テーブル
に対し、多くの割引が発生しているのは、売上数量の観点から売れ残りが発生しており、在庫処分のために割引が発生していると推察できます。
他カテゴリの単価と比較すると、製品あたりの単価が高いので、来店する顧客層と提供する製品においてアンマッチが発生している可能性があります。
ただし、全体として返品率が低いわけではないので、決して顧客満足度が低いわけではないと思われます。
これらを踏まえた改善案として、
顧客のニーズに合わせた価格帯の製品を入荷し、顧客ニーズに合わせた陳列へシフトするか、椅子などの人気商品とセット売りをするなど、とにかく顧客に対し在庫処分となる前に購入してもらえるような販促を促す施策を実施する必要があります。もしくは、明らかに利益に貢献していない商品のため、顧客ニーズから外れているのだと割り切って陳列からテーブルを外すことも考えられます。
以上が考察となります。
7. 【参考】テーブルの価格設定は適切なのか?
参考までに、テーブルが全て割引されずに売れた場合、どれくらいの利益を得ることができるのか検証してみたいと思います。
そもそも「利益を求めすぎて高い価格設定にしているのでは」という仮説のもと、適切な価格設定かどうか見ていきます。
まず、「割引前の利益率」を算出するために、「割引前の売上」と、「割引前の利益」を計算していきます。
割引前売上の計算式
割引前利益の計算式
これらを使用して、割引がされない場合の利益率を算出していきます。
割引前利益率の計算式
この利益率から、テーブル
が割引されずに売れると、どれくらい利益が出るのか見ていきます。
サブカテゴリごとの利益率(割引前)
適正価格で取引されると、テーブル
はしっかりと利益を出すことができています。
ただし、依然としてサブカテゴリの中では一番低い利益率となっています。そもそも利益が低い価格に設定されているため、これ以上テーブルの価格を安くすることは厳しそうです。
おわりに
今回は、Tableauを使用して、サンプルスーパーストアのテーブル
カテゴリにおける利益率の謎に迫りました。
本データはあくまで架空の小売業を基にしたサンプルデータのため、データに潜む背景や前提などが省かれた上での考察となるため答え合わせはできませんが、実務においてはここから導き出した仮説をもとに何かしらの改善のための施策を実行していきます。その後、実際に施策を通して売上がどのように変わったのか統計的に効果を検証するなど分析を進めていくような流れになるでしょう。
Tableauは現在代表的なBIツールとして広く普及しており、ダッシュボードを構築するだけでなく今回のようにノーコードでアドホックに分析を行うためのツールとしても活用できます。
複雑な統計処理は苦手とするところではありますが、売上データをEDAする上で手軽に実行できるのは魅力的ですね。
これからもデータサイエンス領域における技術発信をしていきます。
いい感じの題材があれば、今回のような分析をテーマに記事を書いていきます。
今のところは多少ストックがあるので、次回はPytonによるアドホックな分析記事を執筆いたします。
Discussion