🕌

TiDBの始め方

kei忍者

2024/07/29に公開

概要

対象者:
データベースの技術に興味があるエンジニアや開発者

内容:
オープンソースの分散SQLデータベース「TiDB」の特徴、HTAPの概念、実際の導入手順やチュートリアルの紹介

記事を読むとわかること:
TiDBの基本的な特徴と利点、HTAPの概念、分散SQLデータベースの仕組み、実際の導入手順とチュートリアルの流れ

序章

みなさんTiDB（「たいディービィー）はご存知でしょうか？
TiDBは何と言っても、ハイブリッドトランザクションおよび分析処理 (HTAP) ワークロードをサポートするオープンソースの分散 SQL データベースです。
今日はその導入の紹介をします。

HTAPについて

「ハイブリッドトランザクションおよび分析処理」を英語にすると
Hybrid Transactional and Analytical Processingです。
この頭文字をとってHTAPと呼びます。
「ハイブリッドトランザクション」ではなく、トランザクションと分析処理のハイブリットという意味です。
では次に、トランザクションとは？分析処理とは？を説明します

トランザクション処理

OLTP: Online Transaction Processingとも呼ばれます。
データベースにデータを頻繁に書き込み、更新する操作を行います。
例えば、銀行の取引やオンラインショッピングの購入処理などが含まれます。

分析処理

OLAP: Online Analytical Processingとも呼ばれます。
データベースから大量のデータを読み込み、集計や分析を行います。
例えば、売上データの分析や顧客行動の分析などが含まれます。

HTAPの利点

HTAPのメリットを説明します。

一元化
トランザクションデータと分析データを同じデータベースで管理できるため、データの一貫性が保たれます。
リアルタイム分析
トランザクションデータが即座に分析処理に利用できるため、リアルタイムでの意思決定が可能です。
コスト削減
トランザクション処理用と分析処理用の二重のデータベース管理が不要となり、システムのコストが削減されます。

つまり、HTAPを導入すると、トランザクション処理用と分析処理用のデータベースを別に管理する必要がなくなり、データの一貫性やリアルタイム性、運用コストを抑えられるというお話です。

分散SQLデータベースについて

分散SQLデータベースとは、分散型アーキテクチャを採用したsqlDBです。
では、分散型アーキテクチャとはなんでしょうか？
分散型アーキテクチャとは、データを複数のサーバーに分散して保存・処理する仕組みです。
一つのサーバーにかかる負荷を軽減し、システム全体のパフォーマンスや信頼性を向上させることができます。
特にTiDBでは、TiDBサーバ、TiKVサーバ、PDの３つのコンポーネントで構成されています。
(下の図を先に見るとイメージしやすいかも)