Closed5
分散SQLクエリエンジンTrino徹底ガイド読む

第一部
1.1.
- データウェアハウス自体を作るのが大変?そもそもウェアハウスとレイクの違いを理解しない... 🤔
- ウェアハウスとレイクの利点を組み合わせる新しいデータレイクハウスのアプローチってのもあるんだ
- 現代システムの欠点としてデータは分散していて、さまざまなシステムに格納されてそれが増え続けているということ。確かにこれらを解放できれば価値は増えそう
現代システムのデータ格納先は過去のRDBMS一つだった時代と比べてバラバラだし、分散してるし、これを統一的にクエリできるのがTrinoなのかな

1.2.
ここら辺がTrinoのすごいところらしい
- フェデレーテッドクエリ
- 並列クエリ
- 水平クラスタのスケーリング
Trinoはオープンソースの分散SQLクエリエンジン。データのサイズに関係なく、ギガバイトからペタバイトまでの異なるデータソースに対して効率的なクエリを実行するために、ゼロから設計と開発が行われてきた
TorinoってどのRDBMS,NoSQLに対してもクエリ発行できる君なのか!?

SQL方言あるなぁ

ダッシュボードや分析ツール、ビジネスインテリジェンスツールは、Trinoに集約させるのが確かにシンプルそう

データウェアハウスシステムの作成とメンテナンスね、、これ大変だよね。書いてある通り、複雑なETLプロセスと長時間のバッチジョブ。
このスクラップは2024/06/03にクローズされました