AWS QuickSightでデータを視覚化しよう
課題
弊社サービスの「OFFICEDEYASAI」を運用していく中で様々なデータが蓄積しているが、
・各チームでデータの分析などができていない
・そもそも人手不足で分析するリソースがない
という課題がありました。
課題を解決する方法として、多様なデータソースに対応しておりすぐに開始できる、また弊社システムへのグラフ埋め込みのしやすさからQuckSightを選択しました。
目標
今回はcsvデータを用意し、それを取り込んで視覚化します。
視覚化されたグラフから気づきを得られるのか!トライします。
※こちらの記事はQuickSightのアカウントを持っている方向けの記事です。
データを取り込む
文字コード:UTF-8、改行コード:LFのcsvファイルを用意します。(画像は一部)
いつどの商品がサプライヤーから倉庫に納品されたのかみたいなデータですね。
QuickSightにデータを投入します。
左サイドバーの「データセット」 → 右上の「新しいデータセット」の順で開きます。
ファイルのアップロードからデータとして使用するファイルを選択して取り込みます。
文字化けや数値の桁落ちなどしてないか確認しましょう。
UTF-8、LFではない場合文字化けします。
また「設定の編集とデータの準備」を押下すると数値やテキストのデータ型を変更できます。
修正や確認が終わったら右上の「発行して視覚化」を押します。
視覚化しよう
このような画面になるので「作成」を押します。
取り込んだcsvデータのカラム名が表示されています。
「ビジュアル」の中から円グラフを選択します。
そしてデータ内の"入庫先倉庫名"をビジュアル内の「グループ/色」にドラッグ&ドロップして追加します。
するとそれぞれの入庫先倉庫名のレコードをカウントして勝手に描画してくれます。
グラフにマウスホバーするとカウント数と全体に占めるパーセンテージが表示され、クリックすると更に色を変更するウィンドウが開きます。
グラフの追加
「ビジュアル」ペインの追加を押します。
先ほど作成した円グラフの右側に新しいグラフエリアが用意されます。
今度は折れ線グラフを選択して横軸(X軸)に「入庫日」、縦軸(値)に入荷数を適応します。
すると入荷数は入庫日でグループ化された合計値としてグラフ化されます。
グラフ右側の山に何があったのかが気になったので追加でビジュアルの「色」にサプライヤーを適応してみます。
するとクリスマスイヴにアナハイムからの飛び抜けた入荷があったことが分かります。
さらにビジュアル内の「SMALL MULTIPLES」に入庫先倉庫名を追加すると倉庫別にサプライヤーごとの入荷数が日別でグラフされます。
クリスマス付近に注視すると、青心工機は24日にアナハイムから109体、
25日に統合設計局と海軍戦略研究所からそれぞれ35体、115体を仕入れています。
ではクリスマスに一番気合を入れているは青心工機なのかと疑問が湧いてきました。
今度は垂直積み上げ棒グラフで視覚化してみます。
右のプロパティからデータラベルをオンにすると各倉庫の入荷数が表示されます。
ハッピーセンターは上旬に、マンガ倉庫は中旬に、青心工機はクリスマス付近に、宇宙引越社は年末に向けて入荷が多くなっています。
フィルターの適応
別の視点から見てみます。
今度はドーナツグラフにフィルターを適応してみます。
「追加」から入庫日を選択し、開始日と終了日を設定し適応します。
するとこの期間において青心工機は全体の入荷の半分以上を占めていることが分かります。
おそらくクリスマスイベントなど行ったのでしょう。
データの編集
グラフが多くなってきたのでシートを追加します。グラフエリア上部の「+」ボタンでシートを追加できます。
またデータに不良品入荷数があるので入荷数における廃棄率をデータとして追加してみます。
画面左上の「QuickSight」を押してホーム画面を表示します。
データセットからデータリストを表示させ、現在使用しているデータを編集します。
データの編集画面が表示されます。
画面左上の追加から「計算フィールドを追加」を選択します。
計算フィールドの編集画面になるので廃棄率というタイトルで計算式を定義します。
sum({不良品入荷数}) / sum({入荷数})
画面が戻り、先ほど定義したカラムが追加されています。(使用できません。となっていますが正常にデータとして認識されています)
画面右上の「保存して公開」を押します。
左上の「QuickSight」→「分析」と画面を表示させ、使用していたアナリティクスを選択します。
先ほど定義した廃棄率の表示方法をパーセントにします。
クラスター棒コンボグラフで描画してみましょう。
サプライヤーごとの入荷数と不良品数、先ほど定義した廃棄率が表示されます。
廃棄率1%を切るサプライヤーもあれば3%近くあるサプライヤーもあることが分かります。
最後にレーダーグラフを使用してみます。
倉庫ごとのサプライヤー別入荷数です。
面積としてみることができるので各サプライヤーによる支配率のようなものが見てとれます。
アナハイムはジオン公国以外での支配が強くシェアNo.1であり、ZEONICは3つの倉庫への多く出荷しており、その中でも唯一ヤシマ重工ではアナハイムを抑えています。
おわり
自前のデータでの分析でしたが視覚化してみると、理解→新たな疑問→理解→新たな疑問...と
意外にも思考が捗りました。
これを生きているデータを行う場合はどんなデータを食べさせるか、どう整形するかなど様々な事を考慮して実務に役立てるよう調整を繰り返していくのでしょう。
次回は作成したグラフ達(ダッシュボード)をWebページに埋め込んでみます。
ありがとうございました。
Discussion