2つ以上の属性の組み合わせを分析する可視化手法 UpSet Plot
UpSet Plotとは
2つ以上の属性の組み合わせを分析、可視化する手法としてUpset Plotという手法があるのをご存知でしょうか?
わたしはこちらではじめて知りました(笑)。
ですので上記を参考にTableauでの可視化に取り組んでみました。
可視化したVizはこちら
当エントリーはその可視化に際して、手順ごとの感想や気づいた点、苦労した点などを綴ります。
※可視化手順の詳細は控えます。
可視化する内容
架空のフライト履歴データから
・ロイヤル顧客化どうか
・ビジネス目的化どうか
・フライトに満足したかどうか
上記3条件でどの組み合わせにどれくらいの顧客がいるのかを可視化する内容になります。
1.データの内容を確認
まずデータの中身を確認します。
データセットには以下のカラムが格納されています。
- Row Number
- ID
- Gender
- Age
- Is Loyal
- Is Business Travel
- Is Satisfied
2.3条件のユーザー数を棒グラフで可視化
まずひとつ目のチャートを作成します。
3条件のユーザー数を棒グラフで可視化します。
このチャートについてはとくに難しいことはないかと感じました。
3.8通りのセグメントのフィールドを作成し、棒グラフで可視化
つぎにふたつ目のチャートを作成します。
それぞれ3条件を分岐させたものを組み合わせて8通りのセグメントを作成します。
技術的に難しいことはないと思いますが、セグメント分けをする意味合いを理解するのに少し時間がかかるかもしれせん。
4.どのセグメントを含んでいるかをドットと線を使って可視化
さいごに三つ目のチャートを作成します。
各セグメントがどの条件を含んでいるかをドットの配置と線で表現します。
円と線を二重軸で結ぶというTableauでは定番の手法ですが、nullを含む場合の線の挙動に少々苦労しました。
その点については元ネタのHint内に記載があります。
5.ダッシュボードに配置する
以上、3つのチャートをダッシュボードに配置し完成です。
可視化しての感想
冒頭にも書きましたが、今回はじめてUpset Plotという手法を知り可視化した結果を通して利用できる分析対象はけっこうあるのではと感じました。
重なりを表現する場合、一般的なものにベン図があるかと思いますが、もちろんTableauでベン図を表現するのは簡単ではありませんし(そもそも可能なのか??)、重なる条件が増えるとベン図では手に負えなくなるでしょう。
その点でこのUpset Plotは多少の手間はかかりますが、セグメントの数も調整できますし、見た目も良い(重要!)のでかなり使えるのでは。
Upset Plotで検索すると出てきますが、例えば映画なんかのジャンルやTabjoにもあったようにカテゴリなど併売分析にも使えるかもしれませんね。
最後に、参考にした記事・サイト
#TableauChallenge : UpSet Plotを使ってセグメント分析をする
Tabjo Ofiicial : 【Tableau Tips】ベン図の代わりに使える!UpSet Plots
Discussion