🆗
【Python・Pysparkで学ぶ!】データ分析の基礎【深掘分析②エントリーの有無】
【Python・Pysparkで学ぶ!】データ分析の基礎【深掘分析②エントリーの有無】
↓エントリー情報付きトランザクションテーブル(entry_transaction_table)のサンプル
brand_id | brand_name | industory | pay_method | entry_flg | transaction_count | pay_mean_raw | pay_mean_without_tax |
---|---|---|---|---|---|---|---|
brand0001 | 佐藤レストラン | food | card | 0 | 2 | 3135 | 2850 |
brand0001 | 佐藤レストラン | food | card | 1 | 3 | 7187 | 6533 |
brand0003 | 高橋カフェ | food | cache | 0 | 1 | 1320 | 1200 |
brand0003 | 高橋カフェ | food | cache | 1 | 4 | 4020 | 3680 |
brand0003 | 高橋カフェ | food | card | 0 | 1 | 10120 | 9200 |
上記のようなエントリー者情報を付加した決済データを集約したSQLテーブルが存在すると仮定します。
◾️要望
とある日の朝会MTGにて、クライアントから次のような要望を頂きました。
『エントリー有無が購買行動に及ぼす影響を教えてほしい』
本稿では、クライアントからの要望に答えながら、 データ分析 について学びます。
よろしくお願いいたします。
◾️AsIs(現状把握)
エンジニアとクライアント間の認識に相違があるとアウトプットのイメージに相違が発生します。
はじめに、 データアセスメントの観点から論点を提示し、クライアントと集計ロジックの認識を擦り合わせるタッチポイント を設けましょう。
◾️タッチポイント議事録(分析の概要)
-
- 施策の参加ユーザーと、そのエントリー日時情報
-
- 2025年1月~3月の決済情報
-
"industory"列
- food : 飲食
- EC : オンラインショップ
- general : 雑貨屋
- 平均金額(pay_mean_raw,pay_mean_without_tax)
- 税込合計金額(pay_mean_raw) と 税抜合計金額(pay_mean_without_tax)
- 人数の集計(user_cnt)
- 各カテゴリ毎にuser_idのユニーク数をカウントする。
◾️アウトプットイメージ
タッチポイントより、クライアントとアウトプットイメージを次の通り合意いたしました。
例)
- 深堀観点①
- 論点:
- 仮説:
- ネクストアクション打診:
- 深堀観点②
- 論点:
- …
- 深堀観点N
- 論点:
- 仮説:
- ネクストアクション打診:
◾️ToBe(可視化)
タッチポイント議事録をもとに、**データをリレーショナルテーブルからグラフ・チャートを作成します。
◾️業界_エントリー有無_決済回数
業界 | エントリー無し | エントリー有り | 総計 |
---|---|---|---|
EC | 16 | 28 | 44 |
food | 34 | 117 | 151 |
general | 25 | 37 | 62 |
総計 | 75 | 182 | 257 |
業界_エントリー有無/決済回数
◾️業界_エントリー有無_平均金額
業界 | エントリー無し | エントリー有り | 総計 |
---|---|---|---|
EC | 9900 | 13530 | 23430 |
food | 17325 | 53167 | 70492 |
general | 3190 | 10157 | 13347 |
総計 | 30415 | 76854 | 107269 |
業界_エントリー有無/平均金額
◾️ブランド_決済種別_エントリー有無_決済回数
ブランド | 現金_エントリー無し | 現金_エントリー有り | カード_エントリー無し | カード_エントリー有り | コード_エントリー無し | コード_エントリー有り | 総計 |
---|---|---|---|---|---|---|---|
加藤雑貨店 | 0 | 0 | 15 | 0 | 0 | 0 | 15 |
高橋カフェ | 5 | 10 | 4 | 6 | 4 | 0 | 29 |
佐藤レストラン | 2 | 4 | 12 | 15 | 0 | 0 | 33 |
山本パン | 0 | 31 | 0 | 20 | 0 | 13 | 64 |
小林ショップ | 0 | 23 | 0 | 0 | 10 | 14 | 47 |
中村クレカ | 0 | 0 | 9 | 15 | 0 | 0 | 24 |
田中オンラインショップ | 0 | 0 | 0 | 0 | 7 | 13 | 20 |
渡辺ビール | 7 | 18 | 0 | 0 | 0 | 0 | 25 |
総計 | 14 | 86 | 40 | 56 | 21 | 40 | 257 |
ブランド_決済種別_エントリー有無/決済回数
◾️ブランド_決済種別_エントリー有無_平均金額
ブランド | 現金_エントリー無し | 現金_エントリー有り | カード_エントリー無し | カード_エントリー有り | コード_エントリー無し | コード_エントリー有り | 総計 |
---|---|---|---|---|---|---|---|
加藤雑貨店 | 0 | 0 | 440 | 0 | 0 | 0 | 440 |
高橋カフェ | 1320 | 10120 | 5500 | 7700 | 1540 | 0 | 26180 |
佐藤レストラン | 1760 | 5005 | 3135 | 7187 | 0 | 0 | 17087 |
山本パン | 0 | 10890 | 0 | 1100 | 0 | 8140 | 20130 |
小林ショップ | 0 | 3850 | 0 | 0 | 2750 | 6307 | 12907 |
中村クレカ | 0 | 0 | 6600 | 9240 | 0 | 0 | 15840 |
田中オンラインショップ | 0 | 0 | 0 | 0 | 3300 | 4290 | 7590 |
渡辺ビール | 4070 | 3025 | 0 | 0 | 0 | 0 | 7095 |
総計 | 7150 | 32890 | 15675 | 25227 | 7590 | 18737 | 107269 |
ブランド_決済種別_エントリー有無/平均金額
◾️ToBe(最終アウトプット)
-
深堀観点①
- 論点:業界別エントリー有無の決済回数
- 仮説:エントリーの有無で決済回数に差がある。エントリー者の方が決済回数が多い。
- ネクストアクション打診:Web広告やメール広告によって、エントリー促進の施策を打つ。
-
深堀観点②
- 論点:業界別エントリー有無の平均決済金額
- 仮説:エントリーの有無で平均決済金額に差がある。エントリー者の方が平均決済金額が多い。
- ネクストアクション打診:Web広告やメール広告によって、エントリー促進の施策を打つ。
-
深堀観点③
- 論点:ブランド別決済種別エントリー有無の決済回数
- 仮説:エントリーの有無で使用される決済種別に差がある。エントリー者におけるキャッシュレス決済の割合が多い
- ネクストアクション打診:現金管理のコスト減少を狙い、キャッシュレス化をこのまま進める方針をクライアント側で固める。
-
深堀観点④
- 論点:ブランド別決済種別エントリー有無の平均決済金額
- 仮説:エントリー者におけるキャッシュレス決済の平均決済金額が、キャッシュ決済より大きい。
- ネクストアクション打診:一部店舗でキャッシュ決済を不可とする期間を作る。
『結論』
◾️業界_ブランド_決済種別_エントリー有無で決済情報を分析する意義(ビジネスサイド)
- 顧客行動の理解
- 決済方法(コード決済、カード、現金)の利用傾向を把握し、顧客がどのような支払い手段を好むのかを理解する。
- キャンペーン戦略の最適化
- エントリー有無による影響を分析し、プロモーションが実際に売上や顧客獲得に結びついているかを評価。
◾️業界_ブランド_決済種別_エントリー有無で決済情報を分析する意義(コンサルサイド)
- クライアントへの戦略提案
- データに基づき、業界ごとやブランドごとに適切な決済手段を導入する提案を行う。
- 課題の発見と解決
- エントリー無しの場合の低い売上や利用率を特定し、その原因を調査・解決策を提案する。
Discussion
エントリーする人のITリテラシーだとキャッシュレス決済の割合が多そうですね