😸

DATASaber Ord2勉強会レポート - データ可視化の多様な視点を学ぶ

に公開

概要

Kevinさんの呼びかけでDATASaberプログラムOrd2の勉強会を開催しました。今回は様々な経験レベルの参加者が集まり、データ可視化における選択肢やベストプラクティスについて活発な議論が行われました。

DATASaber Ord2は、データ可視化のベストプラクティスについて学ぶプログラムで、今回の勉強会では特にグラフタイプの選択と効果的な可視化手法について深く議論しました。

DATASaber Ord2の概要

DATA Saber Ord2は、データビジュアライゼーションの効果的な設計原則について学ぶプログラムです。このプログラムでは、以下の要素を学習します:

質問から始める重要性

視覚的分析のベストプラクティスとして最も重要なのは、何を伝えたいかを明確にすることです。今日利用できるデータの量は膨大であり、目的なしにビジュアライゼーションを作成すると、ユーザーは混乱してしまいます。

効果的なビジュアライゼーションのためには以下を検討する必要があります:

  • 対象ユーザーは誰か
  • どのような質問に答えるのか
  • その回答はどのような会話を生み出すか
  • ビューアーは時間をかけて読み取る価値があるか

正しいグラフタイプの選択

分析の目的に応じて最適なグラフタイプを選択することが重要です:

1. 経時的な傾向

  • 適切なグラフ: 折れ線グラフ、面グラフ、棒グラフ
  • 設計原則: 経過時間をX軸に、メジャーをY軸に設定

2. 比較とランク付け

  • 適切なグラフ: 棒グラフ
  • 理由: 定量的な値を1つのベースライン上での長さとしてエンコードすることで、とても簡単に値を比較できる
  • エンコードとは:データビジュアライゼーションでは、数値を視覚的要素に変換することを「エンコード」と呼びます。
    棒グラフの場合:
    数値データ → 棒の長さ にエンコード
    120万円 → 12cmの棒
    80万円 → 8cmの棒
    40万円 → 4cmの棒
    この変換により、抽象的な数字が直感的に理解できる視覚的な長さに変わります。

3. 相関性

  • 適切なグラフ: 散布図
  • 注意点: 相関性は必ずしも因果関係を保証するものではない

4. 分布

  • 適切なグラフ: 箱ひげ図、ヒストグラム
  • 箱ひげ図: 複数の分布を表示するのに優れている
  • ヒストグラム: データを時間区分でグループ化し、区分ごとの件数を表示

5. 一部と全体との関係

  • 推奨: 棒グラフ(円グラフは非推奨)
  • 円グラフの問題点: 人の視覚系はパイの見積もりに不向き、隣接するパイ同士としか比較できない

勉強会参加者(敬称略)

Apprentice

  • Naoki (Kevin)
  • Yuki (Kevin)
  • Sayaka (Kevin)
  • Yukihiro (Kevin)
  • Yasuyuki (Kevin)
  • Dinosaur Fukui (Yamawake)
  • すなこ (Chie)
  • はやし (Chie)

師匠

  • Kevin
  • 杉山 愛
  • Chie

勉強会での議論内容

同じ課題を通して他の参加者の意見を聞くことで、自分にはない視点を発見することができました。特に線グラフの使い方についての議論では、新たな気づきが得られました。

比較とランキングの可視化における線グラフの検討

議論のポイント

  • 疑問: 線グラフも比較に使える可能性があるのではないか
  • 分析結果: 結局は位置を確認することになり、線グラフ特有の利点(連続性の表現)を活用できていない
  • 制約: 連続値でない場合には使いづらい
  • 結論: 比較とランキングにおいては棒グラフが良い

この議論から、各グラフタイプには固有の強みがあり、目的に応じた適切な選択が重要であることが再確認されました。
また、棒グラフ最強と、棒グラフ📊の汎用性の高さが話題になりました。

経時変化におけるエリアチャートの利点

経時的変化を表現する際のエリアチャートについて深く掘り下げました。

エリアチャートの優位性

  • 色の面積によって割合の変化が直感的に可視化される
  • 色分けされた棒グラフを時系列で並べると、自然とエリアチャートのような表現になる

この議論により、時系列データの可視化において単純な線グラフだけでなく、面積を活用した表現の有効性が確認されました。

箱ひげ図の課題と読解リテラシー

箱ひげ図については重要な課題が指摘されました。

主な問題点

  • 解釈には統計的リテラシーが必要
  • 統計的知識を持たない読み手には理解が困難
  • ビジネス現場では説明コストが高い場合がある

この議論から、大衆向けでない統計的可視化手法を使用する際は、対象ユーザーのリテラシーレベルを考慮する必要があることが明確になりました。

円グラフの是非に関する活発な議論

円グラフについて特に活発な議論が交わされました。

円グラフの不利な点

  • 色が必要とされがち
  • 色以外を使用した分類は、Tableauでは実装が難しい場面がある
     (cf.ツールによっては、ドット、網掛けなどの凡例で表現することも可能)

円グラフが有効な場面

  • 感情的価値: 「円グラフはかわいい」という視覚的魅力
  • 強調効果: 特定の切り口を取り出して強調したい場合
  • シンプルな構成: 選択肢が少ない場合(3つ程度)
  • 継続的観測: 定点観測での活用

この議論により、円グラフも完全に排除するのではなく、適切な用途があることが確認されました。

深掘り型分析の概念整理

深掘り型の分析手法についても重要な議論が行われました。

概念の整理

  • 深掘り型分析は探索分析の一種(ドリルダウンなど)として位置づけられる
  • 探索分析には視点を変える、広げる方向での分析も含まれる
  • より包括的な概念として「探索」という用語が適切

この整理により、データ分析のアプローチ分類がより明確になりました。

ダッシュボード設計における認知負荷の考慮

シート数の基準設定

  • 初心者への説明時には明確な基準があると良い
  • 人の認知能力を考慮した適切な数を設定する必要がある

後から気づいた点

  • 推奨: 4つに分割(画面の4分割でエリア効率も良く、形も整って見やすい)
    画面を4分割で使用することで、視覚的なバランスと情報の整理が両立できると考えました。

ツールヒントの最適化

  • Preattentive Attributeで重要な要素に「動き」がある
  • Tableau動きのなかで、ツールヒントが出てくるため、ツールヒントを見やすく整理することが重要

愛さんの重要な指摘

勉強会を通じて愛さんから重要な指摘がありました:

「あくまでベストプラクティス、目的に合わせて最適なビジュアルを選択すること」

この言葉は今回の勉強会の核心を表しています。どれだけ理論的に「正しい」とされる手法であっても、実際の業務やプロジェクトの文脈において最適解は変わる可能性があります。重要なのは:

  1. 基本原則の理解: まずベストプラクティスを理解する
  2. 目的の明確化: 何を伝えたいのか、誰に伝えるのかを明確にする
  3. 柔軟な適用: 状況に応じてルールを柔軟に適用する
  4. 継続的改善: フィードバックを基に改善し続ける

まとめ

今回のDATA Saber Ord2勉強会では、データ可視化における多面的なアプローチと深い理解を得ることができました。

主要な学び

理論と実践の融合

  • Tableauのベストプラクティスガイドに基づいた体系的な学習
  • 実際のプロジェクト経験を踏まえた議論による理解の深化
  • 理論的知識と実務経験のバランスの重要性

多様な視点の価値

  • 同一課題に対する異なるアプローチの発見
  • 経験レベルの異なる参加者からの多角的な視点
  • 個人では気づけない盲点の発見

適応的思考の重要性

  • ベストプラクティスの理解と状況に応じた柔軟な適用
  • 目的と対象ユーザーに基づいた最適解の選択
  • 継続的な改善と学習の姿勢

今後への示唆

実務への応用

  1. 基本原則の習得: まず確実にベストプラクティスを身につける
  2. 文脈の考慮: プロジェクトや組織の特性を考慮した適用
  3. ユーザー中心設計: 常に最終ユーザーの視点を忘れない
  4. 反復的改善: フィードバックを基にした継続的な改善

学習コミュニティの価値

  • 定期的な議論の場の重要性
  • 多様な経験を持つメンバーとの交流の価値
  • 知識共有による全体的なスキル向上

このような学習の場があることで、個人の経験だけでは得られない多角的な視点を身につけることができ、データビジュアライゼーションの実践者として大きく成長できる機会となりました。
勉強会の中でもDATA Saberとしてどう考えるか?という話があり、早くからそういった意識を持つことの重要性を感じました。
今後もこのようなコミュニティでの学習を継続し、より効果的なデータ可視化の実現を目指していきたいと思います。


参考資料: Tableau「視覚的分析のベストプラクティス」
https://www.tableau.com/ja-jp/learn/whitepapers/tableau-visual-guidebook

DATA Saber公式サイト
https://datasaber.world/

DATA Saberプログラムについては、こちらの私の記事も参考にしてください。
https://zenn.dev/rinrin_ds_17/articles/38b704dcb6f03a

箱ひげ図についてより詳しく学びたい方は、統計学の基礎から応用まで体系的に解説している「統計WEB(BellCurve)」の箱ひげ図の記事が参考になります。四分位数の計算方法や実際のデータを使った作成手順まで、丁寧に説明されています。

https://bellcurve.jp/statistics/course/5220.html

データビジュアライゼーションをより体系的に学びたい方には、『データビジュアライゼーションの教科書』をお勧めします。理論的な基礎から実践的な手法まで、今回の勉強会で議論したような可視化の原則について詳しく解説されており、DATASaberで学んだ内容をさらに深めるのに適した書籍です。

https://amzn.to/4njJd9K

Discussion