Redashで卒業論文用データ分析基盤を作成する
今年からWebエンジニアになる文系大学生です。
卒業論文を執筆する際にデータ分析をする機会があったのでいろんなツールを使ってみました。
BigQueryにデータを保存して、DigitalOceanにRedashをデプロイしたのでその時に得た知見を残しておこうと思います(とは言っても概要なのでかなりざっくりしています)。
モチベーション
主なモチベーションは以下の2つです。
- Pythonでグラフをこねくり回すスキルに乏しかったのでGUIでさくさくグラフを作りたかった
- 単純にBigQueryのようなデータウェアハウスやRedashのようなダッシュボードツールを使ってみたかった
まあ結局SQLは適宜書かないといけないですし、今回はチームメンバー間のコラボレーションやリアルタイムのデータ更新、スケジューリングといったダッシュボードツールのメリットは享受できていないので、あまりおすすめはしません。
無料で運用したい
お金はかけたくなかったので、学生特権をフル活用しました。
利用したのは学生エンジニア御用達のGitHub Student Developer PackにあるDigitalOcean
と.TECH
です。
DigitalOceanは$200のクレジットがもらえます
DigitalOcean
DigitalOceanってなんぞやって人もいると思うので軽く解説すると、AWSやAzureと同じようなクラウドサービスプロバイダです。世界シェア10位には入ってくるようなプロバイダですね。
日本でほとんど人気がないのは単純に日本リージョンがないからだと思われます(一番近いのはシンガポール)。しかし、GitHub Student Developer Packでは人気順で並べたときに2番目に来るぐらいには使われているようです。
なんでそんな物を使うのかというと、クレジットがもらえるのもそうですが、DigitalOceanにRedash専用imageがあったからです。
.TECH
これはドメインレジストラです。GitHub Student Developer Packには他にもあります。
BigQuery
BigQueryは学生関係なく、毎月10GBのストレージと1TBのクエリが無料枠として用意されています。AIの研究でもない限り、私のような学部生の研究で利用する分では十分だと思います。
セットアップ
インスタンスの作成
DigitalOceanのアカウントを作成した上で、Redash専用imageのページにアクセスして、「Create Redash Droplet」を選択します。
すると、DigitalOceanのDroplet(DigitalOceanが提供するVPS)を作成する画面に遷移するので、フォームを埋めるとすぐにRedashのインスタンスが作成できます。
デフォルトで月額$28なのでクレジットを使えば7ヶ月は無料で運用できます
カスタムドメインの設定とSSL化
詳細はドキュメントを参照してください。
SSL化に関してはこちらが非常に参考になりました。
BigQueryと接続
こちらも公式にドキュメントがあるので、詳細は省きます。
結果
画面ポチポチするだけで、こんな感じのグラフを簡単に作成できました!やった😆
Discussion