Closed7
TiDB ワークショップ 2日目
HTAP テクノロジー
- 2005年くらいにガートナーがHTAPを考えた
- 2010年代くらいから実装したDB出てきた
- トランザクション処理と分析処理を混在させているテクノロジー
- HTAPいうてもさまざまな実装方式ある
- OLTP中心にやられてはいる
OLTP と OLAP との違い
- OLTP: 大量トランザクションを捌くDB
- OLAP: 更新はほとんど考えられてなくて分析クエリが多種多様なパターンある。更新はバッチがほとんど
- TiDBが狙っているのはETLをなくしていくこと
HTAP の要件
- スケールアウトするために分散ほにゃららをサポート
TiDB の HTAP 昨日
- RAFTのフォロワーの一種として参加するのでリアルタイムに更新される
- TiDB, TiKVサーバーとして別なのでワークロード分かれる
- オプティマイザがワークロードを判断する
MPP
- 大規模並列処理
- イメージHadoo, Sparkの処理に近い
- ノード数多いほど処理時間が短くなる
- join, 集計クエリを計算するようになっている
TiFlash の主な機能
非同期レプリケーション
- リーダーになれないフォロワーでLearner
- Raftの選挙にも参加しない
- プライマリキーでアップデートされる
一貫した読み取り
- TiDBに入ったデータがTiFlashにどう入るか
- MySQLはレプリカラグある
- TiFlashは上記起こらないようにしている
- ユーザーがラグを意識しなくていいようにしている
- TiFlashに読み取りリクエスト行ったらRaftのリーダーにどこまでIndex進んでいるか聞きに行く
- ようはユーザーがラグ分待つ
このスクラップは2023/10/25にクローズされました