🐡

【セッションレポート】dbts2024[スケーラビリティの再定義:TiDBで実現するサービスプラットフォーム]に参加しました

2024/07/16に公開

はじめに

https://www.db-tech-showcase.com/2024/schedule/
本記事はdb tech showcase 2024 の2日目(7/12)で、
PingCAPの共同創業者兼CTO Ed Huangさんが講演された「スケーラビリティの再定義:TiDBで実現するサービスプラットフォーム」のレポートです。

db tech showcaseとは国内最大級のデータ技術カンファレンスで、今年のテーマは「テックギークに告ぐ。自らをファインチューニングせよ! - データ技術を鍛える100本ノック。これがdbtsの筋トレだ!- 」でした。

  • 日時:2024/7/11~2024/7/12 ※私が聴講したのは7/12のみ
  • 会場:東京都新宿区市谷八幡町8番地 TKP市ヶ谷ビル

TiDBとは

MySQL互換の分散データベースです。

公開されているセッション概要

データベースのスケーラビリティについて言及する際、多くの場合、データ量と性能を思い浮かべることでしょう。
しかし、ビジネスの成長を支えるためには、テーブル数、コネクション数、分析処理、ベクトル検索、オペレーションなど、多岐にわたるシーンで「スケール」する能力が必要です。
このセッションでは、PingCAPの共同創業者兼CTOであるEdがスケーラビリティに対する深い理解とその実現方法を共有します。

セッション内容

  • 分散システムの課題は複雑である一定になると人間が取り扱えなくなる。
    スケーラビリティはデータ量だけでなく実際には複雑です。
    データ量以外にもボトルネックはある。例えばストレージはスケーラビリティ可能だけどコンピュートエンジンはできないなどといった課題もあると思う。
  • TiDBは水平方向に負荷を分散するシャーディングを行うことなくスケーラブルなデータベースを実現することができる。ダウンタイムもなくスケールアップ、スケールダウンが可能である。
  • OLTPとOLAPの両方のワークロードを処理することができ、ETLツールにより、データの移行、運用・保守コストの削減を行うことができる。
  • DXF(Distributed eXecution Framework)
    バックグラウンドをTiDBクラスターで分散して実行可能。
    例えば、大量データを保存しているテーブルにインデックスを作成する際に、オンラインで作成可能である。複数のノードで分散して処理を実行することができる。
  • TiUPという運用ツールもありユーザ中心のツールだ。デプロイ、起動、停止、スケーリング、アップグレードなどデータベース操作を簡単に実行できる。

所感

TiDBは、シャーディングの問題を解決しているため運用の課題を解決しているありがたいDBだということが分かりました。
MySQLと100%ではないが互換性があるため現行DBがMySQLやAurora MySQLを使用している場合、
移行先として採用されることは増えるかもしれません。

また、本セッションでは、TiDBはHTAP機能をサポートしておりOLTPとOLAPの両方のワークロードを処理することができるため、
TiDBを採用すればオンラインDBをOracle、分析用DBをSnowflakeといったDBを二つ用意してETLなどのツールでデータ連携することも不要になると言っていました。
TiDB CloudでTiDB Serverlessという無料で使えるサービルもあるため、手軽に検証できることから今後もユーザ数が増えるのではと期待しています。

Discussion