📊

Grafanaでタイタニック号の乗客データ.csvを可視化してみた

2024/08/03に公開

はじめに

データ分析と可視化は、情報を理解しやすくするための強力な手段です。今回は、Titanic号の生存者データをGrafanaを使って可視化してみます。Grafanaは通常、時系列データの可視化に使われますが、SQLite Pluginを使うことでCSVファイルのデータも可視化できます。この記事では、その手順を詳しく説明します。

ステップ1: 必要なツールとデータの準備

まず、以下のツールとデータを準備します:

  • Grafana: 最新バージョンを公式サイトからダウンロードしてインストールします。
  • SQLite: SQLiteのデータベースエンジンをインストールします。
  • Titanic号の生存者データ.csv: Titanic号の乗客情報が含まれるCSVファイルです。このファイルは、たとえばKaggleなどからダウンロードできます。

ステップ2: SQLiteデータベースの作成とデータのインポート

  1. SQLiteデータベースの作成:
    SQLiteを使って新しいデータベースを作成します。コマンドラインで以下のコマンドを実行して、データベースファイルを作成します。

    sqlite3 titanic.db
    
  2. CSVデータのインポート:
    SQLiteシェルで以下のコマンドを実行して、CSVファイルをインポートします。

    .mode csv
    .import /path/to/titanic.csv passengers
    

    ここで、/path/to/titanic.csv は実際のCSVファイルのパスに置き換えます。また、passengersはテーブル名です。

  3. データの確認:
    データが正しくインポートされたか確認するために、次のクエリを実行します。

    SELECT * FROM passengers LIMIT 10;
    

ステップ3: Grafanaの設定

  1. Grafanaのインストールと起動:
    Grafanaをインストールし、起動します。詳細なインストール手順はGrafanaの公式サイトで確認できます。

  2. SQLite Pluginのインストール:
    Grafanaのダッシュボードにログインし、左側のメニューから「設定」→「プラグイン」を選択します。検索バーに「SQLite」と入力し、SQLite Pluginをインストールします。

  3. SQLiteデータソースの追加:

    • 「設定」→「データソース」を選択し、「データソースを追加」をクリックします。
    • 「SQLite」を選択し、データソースの設定画面で以下の情報を入力します。
      • Name: 任意の名前(例: Titanicデータ)
      • Database Path: 作成したSQLiteデータベースファイルへのパス(例: /path/to/titanic.db
  4. ダッシュボードの作成:

    • 新しいダッシュボードを作成し、「パネルを追加」をクリックします。

    • クエリエディタで以下のSQLクエリを入力して、データを可視化します。

      SELECT pclass, COUNT(*) as count
      FROM passengers
      GROUP BY pclass;
      

      このクエリは、各クラスの乗客数をカウントして表示します。

  5. 可視化のカスタマイズ:

    • 「Visualization」タブで、棒グラフや円グラフなど、適切なグラフのタイプを選択します。
    • デザインやラベルをカスタマイズして、見やすいグラフを作成します。

ステップ4: 可視化の検証と保存

作成したグラフやダッシュボードが正しく表示されるか確認します。データが正しく表示されていることを確認できたら、ダッシュボードを保存し、共有リンクを作成することもできます。

まとめ

GrafanaとSQLiteを使ってTitanic号の生存者データを可視化することで、データの理解が深まります。CSVファイルをSQLiteデータベースに変換し、Grafanaでグラフ化するこの方法は、データ分析や可視化に非常に便利です。ぜひ試してみて、自分だけのデータ可視化のスキルを磨いてください。

Discussion