🔍

Redashで卒業論文用データ分析基盤を作成する

2024/01/15に公開

今年からWebエンジニアになる文系大学生です。
卒業論文を執筆する際にデータ分析をする機会があったのでいろんなツールを使ってみました。

BigQueryにデータを保存して、DigitalOceanにRedashをデプロイしたのでその時に得た知見を残しておこうと思います(とは言っても概要なのでかなりざっくりしています)。

モチベーション

主なモチベーションは以下の2つです。

  • Pythonでグラフをこねくり回すスキルに乏しかったのでGUIでさくさくグラフを作りたかった
  • 単純にBigQueryのようなデータウェアハウスやRedashのようなダッシュボードツールを使ってみたかった

まあ結局SQLは適宜書かないといけないですし、今回はチームメンバー間のコラボレーションやリアルタイムのデータ更新、スケジューリングといったダッシュボードツールのメリットは享受できていないので、あまりおすすめはしません。

無料で運用したい

お金はかけたくなかったので、学生特権をフル活用しました。
利用したのは学生エンジニア御用達のGitHub Student Developer PackにあるDigitalOcean.TECHです。

digital ocean
DigitalOceanは$200のクレジットがもらえます

DigitalOcean

DigitalOceanってなんぞやって人もいると思うので軽く解説すると、AWSやAzureと同じようなクラウドサービスプロバイダです。世界シェア10位には入ってくるようなプロバイダですね。
日本でほとんど人気がないのは単純に日本リージョンがないからだと思われます(一番近いのはシンガポール)。しかし、GitHub Student Developer Packでは人気順で並べたときに2番目に来るぐらいには使われているようです。

なんでそんな物を使うのかというと、クレジットがもらえるのもそうですが、DigitalOceanにRedash専用imageがあったからです。

.TECH

これはドメインレジストラです。GitHub Student Developer Packには他にもあります。

BigQuery

BigQueryは学生関係なく、毎月10GBのストレージと1TBのクエリが無料枠として用意されています。AIの研究でもない限り、私のような学部生の研究で利用する分では十分だと思います。
https://cloud.google.com/free/docs/free-cloud-features?hl=ja#bigquery

セットアップ

インスタンスの作成

DigitalOceanのアカウントを作成した上で、Redash専用imageのページにアクセスして、「Create Redash Droplet」を選択します。

https://marketplace.digitalocean.com/apps/redash

すると、DigitalOceanのDroplet(DigitalOceanが提供するVPS)を作成する画面に遷移するので、フォームを埋めるとすぐにRedashのインスタンスが作成できます。

デフォルトで月額$28なのでクレジットを使えば7ヶ月は無料で運用できます

カスタムドメインの設定とSSL化

詳細はドキュメントを参照してください。
https://docs.digitalocean.com/products/networking/dns/

SSL化に関してはこちらが非常に参考になりました。
https://gist.github.com/arikfr/64c9ff8d2f2b703d4e44fe9e45a7730e

BigQueryと接続

こちらも公式にドキュメントがあるので、詳細は省きます。
https://redash.io/help/data-sources/querying/bigquery

結果

画面ポチポチするだけで、こんな感じのグラフを簡単に作成できました!やった😆

Discussion