データ分析BIツール Domoを使ってみた
データ分析 BI ツールに触る機会があったのでメモ
用語のメモ
ETL
Extract Transform Load の略
要はデータの抽出、変換、入力(ロード)の 3 つ表す処理のことまたはそれらを実行するソフトウェアを指す
Domo では Magic ETL と呼ばれる物で同じことが実現可能
2021.11.15 現在では MagicETL2 が最新
ダッシュボード
掲示板みたいなモノ。可視化された Dataset(カード)を表示できる。
カード
DataSet を可視化したモノ
DataSet
Domo に取り込まれた/取り込んだデータのこと。
インポートされた DataSet は Domo で読み込めるものであればなんでもインポート可
ちなみに Domo ではほぼすべてのデータ形式に対応しており
各種 DB やテキストファイル、Excel にも対応している。
DataSetView
DataSet から作成されたビュー。SQL で言うところのクエリに近い概念
DataSet から必要な列だけを取り出し表示することが可能
DataFlow
一連の DataSet を接続したものでキャンバス上で編集できる。ETL
キャンバス
ETL の内容を編集する画面のこと。ここで作成されたモノを DataFlow と呼ぶ
ファイルをインポートする手順
ファイルをアップロード
ファイルのアップロードにはファイルの種類によって複数の手順が存在する。
ここでは「File Upload Legacy Connector 」を利用する。
「File Upload Legacy Connector 」は取り込むデータをどのように取り込むかの設定を自由に行うことができる。
具体的には
- データのヘッダとなる行数
- データバディの開始行
- 文字列エンコーディング
レガシーなシステムから出力されたデータは
文字エンコーディングを明示しておかないとマルチバイト文字列は文字化けしてしまう為、注意が必要
ファイルをアップロードする時は画面上部にある「データ」をクリック
画面が切り替わりましたら「ファイル」をクリック
検索エンジンで「File」と入力すると
右側に「File UpLoad Legacy Connector」が見つかります。
「File UpLoad Legacy Connector」をクリック
画面が切り替わりましたら「SELECT FILE」で対象のファイルを入力します。
横書きの三点リーダをクリック
ファイルを選択して OK をクリックするとアップロードが始まり
FILE TYPE が表示されます。
ちなみに更新方法というのはこれからアップロードするファイルを
既存の DataSet に追記するかまたは置き換えるかどうかのオプションになります。
今回は新規で作成するので「置き換え」を選択
Advanced
DataSet のインポート方法を決めます。
今回は Shift-JIS 形式の sample.csv をインポートするので赤枠の項目を変更
DETECT ENCODING を「No」に設定すると赤枠囲んだ項目が出現します。
※デフォルトでは「UTF-8」に設定されています。
この項目を「Shift_JIS」に変更します。
ちなみにここでヘッダの行数とデータボディの行数を変更できます。
今回はヘッダを 1 行目、データバディを 2 行目としています。
設定が完了しましたら「次へ」をクリック
DataSet の名前を決める
最後に DataSet の名前と説明を入力します。今回は
DataSet の名前を「SampleCsv」
DataSet の説明を「これは sample.csv の DataSet です」としました。
画面が切り替わって以下のように表示されれば、DataSet が Domo 上に作成されています。
終わり
これで DataSet の作成は以上です。
次回からはデータの可視化について説明します。
To Be Continued!!
Discussion