MySQL/Postgres におけるトランザクション分離レベルと発生するアノマリーを整理する
読者対象
- ANSI 定義の古典的なトランザクション分離レベルとアノマリーは概ね理解している
- MySQL/Postgres では理論的な部分がどうなっているのかを知りたい
理論面の前提知識
2022-08-19 追記:
社内勉強会向けのスライドを作成しました。先にスライドを見てから,引用文献およびこの記事を読むと理解が深まると思います。
まず ANSI 定義の古典的な定義を聞いたことが無い方は,以下のリンクを参照されたい。 ANSI 定義に対応する解説はこれらのサイト以外にもたくさんあるため,自分にとって読みやすいと感じる情報をあたってほしい。(既に熟知されている方は十分)
次点で読んでいただきたいのが, @kumagi さんの以下の記事。古典的には 4 つの分離レベルと 3 つのアノマリーだけで説明されていたものの,不十分であることが学術的に指摘され,解像度を上げようとする流れが後になって起こってきた。
なお上の記事中で言及されている 2-Phase Locking (2PL) に関する説明としては,本人の解説記事および英語版の Wikipedia が分かりやすい。
これらの記事を踏まえた上で,問題提起の発端となった論文に対する以下の解説記事を読むと,理解が深まると思われる。
以下での具体面へのアプローチは,ここまでの知識がインプットされている前提であるとする。
MySQL/Postgres の実装はどうなっているか?
参考文献
論文で提唱されているトランザクション分離レベルを MySQL と Postgres にどう対応させるかについては,以下の記事を参考にした。
更に Postgres の実装詳細については,以下の記事が大きく理解を助けることになった。
これらから得た知識をもとに,表および箇条書きの形式で要点をまとめる。
共通事項
Anomaly
ANSI 定義より後に新しく登場したものは太字で表現する。ANSI 定義では読み取りの不整合にしか着目されていなかったが,新しい定義では更新競合と直列化異常にも関心が広げられている。更に定義上,実際に発生はしないものの,書き込み不整合を Dirty Write として据えることになった。
グルーピング | 現象 |
---|---|
書き込み不整合 | Dirty Write |
読み取り不整合 | Dirty Read Fuzzy Read Phantom Read Read Skew |
更新競合 |
Cursor Lost Update Lost Update |
直列化異常 |
Write Skew Observe Skew |
以下では,それぞれのアノマリーがどういった現象を指しているのかを説明する。
現象 | 意味 |
---|---|
Dirty Write | 他のトランザクションでコミットされていない変更を上書きしてしまう |
Dirty Read | 他のトランザクションでコミットされていない変更を参照してしまう |
Fuzzy Read Phantom Read Read Skew |
他のトランザクションでコミットされた変更を参照してしまう |
Cursor Lost Update | 他のトランザクションで Locking Read されているにも関わらず, コミットされた変更を上書きしてしまう |
Lost Update | 他のトランザクションでコミットされた変更を上書きしてしまう |
Write Skew | トランザクション トランザクション すれ違いざまに相手の変更前の値に依存した更新を行ってしまう |
Observe Skew | 2 つだけであれば直列化可能であったはずのトランザクション 途中状態を |
- MySQL/Postgres とも, MVCC (Multi Version Concurrency Control) が採用されているがゆえに Fuzzy Read と Phantom Read はセットで考えることができ,新規・更新・削除の区別を意識する機会は少ない。ここでは簡単のため 1 つにまとめる。
- 2 値の読み取り整合性違反となる Read Skew については,1 つの値を複数回読み取る際の不整合である Fuzzy Read と現象の内容が似ている。これも簡単のために 1 つにまとめる。
- Observe Skew については Read Only Anomaly, Read Only Skew, Batch Processing などさまざまな呼称が存在するが,どれも意味が伝わりにくいので,この記事で Observe Skew という名称を新しく提案する。(論文の中で提案されているものではない)
MVCC
発行する SQL 文の種類によって,スナップショットと現在のデータ本体 (Current) のどちらを参照するかが異なっている。
文法 | アクション | 参照先 | ロック |
---|---|---|---|
SELECT |
Consistent Read | Snapshot | - |
SELECT ... FOR SHARE |
Locking Read | Current | Shared |
SELECT ... FOR UPDATE |
Locking Read | Current | Exclusive |
INSERT UPDATE DELETE
|
Write | Current | Exclusive |
- 一貫性読み取り (Consistent Read) では,最新のデータ本体に依存しないある時点での スナップショット をロックせずに取得する。
- ロック読み取り (Locking Read) では,最新のデータ本体をロックして取得する。
MySQL
Anomaly
現象\分離レベル | READ UNCOMMITTED |
READ COMMITTED |
REPEATABLE READ [Default] |
SERIALIZABLE |
---|---|---|---|---|
Dirty Write | ✅ | ✅ | ✅ | ✅ |
Dirty Read | ❌ | ✅ | ✅ | ✅ |
Fuzzy Read Phantom Read Read Skew |
❌ | ❌ | 🔺 Broken on Mixed Read |
✅ |
Cursor Lost Update | ✅ | ✅ | ✅ | ✅ |
Lost Update | ❌ | ❌ | ❌ | ✅ |
Write Skew | ❌ | ❌ | ❌ | ✅ |
Observe Skew | ❌ | ❌ | ❌ | ✅ |
ここでの Mixed Read とは, Consistent Read と Locking Read/Write の混在を指す。
Locking
アクション\分離レベル | READ UNCOMMITTED READ COMMITTED |
REPEATABLE READ [Default] |
SERIALIZABLE |
---|---|---|---|
Consistent Read | - | - | 全て Locking Read 化 |
Locking Read/Write | レコードロック | レコードロック ギャップロック |
レコードロック ギャップロック |
Errors
原因 | メッセージ例 |
---|---|
デッドロック | ERROR 1213 (40001): Deadlock found when trying to get lock; try restarting transaction |
解説
MySQL は以下のような特徴を持つ。
- ロック処理は全て 悲観的制御 である。
- 分離レベルによらず,トランザクションは常に 後勝ち で処理される。悲観ロックにより競合したトランザクションは,先行トランザクションがコミットするまで待機させれ,それに続いて後続トランザクションが上書きするように処理を続行する。
そのほか,トランザクション分離レベルごとに以下のような特徴がある。
-
READ COMMITTED
以下では,- 毎回の操作で最新状態に基づいたスナップショットを取得する。
-
REPEATABLE READ
以上では,- レコードロックでは担保できない現在レコードが存在しない範囲のロックに関しては, ギャップロック で解決している。
-
SELECT
実行で取得したスナップショットバージョン を,自身が変更しない限りはトランザクションの終了まで保持し続ける。同じクエリに対しては同じ結果が保証される。もしBEGIN
の代わりにSTART TRANSACTION WITH CONSISTENT SNAPSHOT
を使用すると,トランザクション開始と同時にスナップショットを取得するが,実運用上大きな差はない。 - Locking Read/Write で分離レベルのダウングレードが発生するため,論文で提唱される SNAPSHOT ISOLATION 分離レベルを満たしていない。 この点は後述されるように Postgres の
REPEATABLE READ
とは明確に異なる。
-
SERIALIZABLE
では,- Consistent Read はすべて Locking Read に変換される ため,実質的に存在しない。
- Lost Update, Write Skew, Observe Skew という直列化異常を全て防ぐことができる。逆に言えば,これらを防ぎたければ Locking Read または
SERIALIZABLE
分離レベルを使用しなければならない。
総評
MySQL は MVCC を採用しつつも,基本的な戦略を 「悲観的制御」 「後勝ちトランザクション」 に寄せているシンプルな RDBMS だと言える。 Locking Read で分離レベルをダウングレードさせるなど,思い切った設計にしている面はあるが,それらを受け入れた上で気をつけて使いたい。 SERIALIZABLE
は悲観ロック処理が重すぎてほぼ実用性なし。
Postgres
Anomaly
現象\分離レベル |
READ COMMITTED [Default] |
REPEATABLE READ | SERIALIZABLE |
---|---|---|---|
Dirty Write | ✅ | ✅ | ✅ |
Dirty Read | ✅ | ✅ | ✅ |
Fuzzy Read Phantom Read Read Skew |
❌ | ✅ | ✅ |
Cursor Lost Update | ✅ | ✅ | ✅ |
Lost Update | ❌ | ✅ Concurrent Update Error Detection |
✅ Concurrent Update Error Detection |
Write Skew | ❌ | ❌ | ✅ R/W Dependencies Error Detection |
Observe Skew | ❌ | ❌ | ✅ R/W Dependencies Error Detection |
Locking
アクション\分離レベル |
READ COMMITTED [Default] |
REPEATABLE READ | SERIALIZABLE |
---|---|---|---|
Consistent Read | - | - | SIRead ロック |
Locking Read/Write | レコードロック | レコードロック 更新競合検査 |
レコードロック 更新競合検査 SIRead ロック |
Errors
原因 | メッセージ例 |
---|---|
デッドロック | ERROR: deadlock detected DETAIL: Process 37542 waits for ShareLock on transaction 2995; blocked by process 37541. Process 37541 waits for ShareLock on transaction 2996; blocked by process 37542. |
更新競合 | ERROR: could not serialize access due to concurrent update |
直列化異常 | ERROR: could not serialize access due to read/write dependencies among transactions DETAIL: Reason code: Canceled on identification as a pivot, during commit attempt. |
解説
Postgres は以下のような特徴を持つ。
- 悲観的制御はレコードロックのみに抑え,それ以外は軽量な楽観的制御で実現するために 更新競合検査 と SIRead ロック を導入している。
- 悲観的制御で競合したトランザクションは,後勝ち で処理される。先行トランザクションがコミットするまで待機させれ,それに続いて後続トランザクションが処理を続行する。
- 楽観的制御で競合したトランザクションは,先勝ち で処理される。先行トランザクションが競合するデータをコミットしている場合,後続トランザクションは中止される。
楽観的制御については,表面的な動きだけに着目するのであれば, 「トランザクション開始時から全テーブル・全レコードに対して楽観ロックによるバージョンコントロールを開始する」 と考えても差し支えない。そのほか,トランザクション分離レベルごとに以下のような特徴がある。
-
READ COMMITTED
以下では,- 毎回の操作で最新状態に基づいたスナップショットを取得する。
-
REPEATABLE READ
以上では,-
SELECT
実行で取得したスナップショットバージョン を,自身が変更しない限りはトランザクションの終了まで保持し続ける。同じクエリに対しては同じ結果が保証される。 MySQL のようにBEGIN
と同時にスナップショットを取得するオプションはない。 - レコードロックでは担保できない現在レコードが存在しない範囲のロックに関しては, 更新競合検査 で解決している。更新しようとした内容が更新競合検査に引っかかった場合,トランザクションを更新競合エラーとして中止する。
- これら 2 つの特性があることにより, Postgres の
REPEATABLE READ
は論文で提唱されている SNAPSHOT ISOLATION 分離レベルも満たしている と言える。厳密にはBEGIN
と同時にスナップショットを取得する要件もあるが,実用上の問題は無いため考慮しない考え方が一般的であるようだ。
-
-
SERIALIZABLE
では,- レコードロックと更新競合検査でも検知できない直列化異常に関しては, SIRead ロック で解決している。更新しようとした内容が SIRead ロックに引っかかった場合,トランザクションを直列化異常エラーとして中止する。
- Lost Update, Write Skew, Observe Skew という直列化異常を全て防ぐことができる。逆に言えば,これらを防ぎたければ Locking Read または
SERIALIZABLE
分離レベルを使用しなければならない。
総評
Postgres は READ COMMITTED
までは MySQL に似た動きをする一方, REPEATABLE READ
以上では悲観的制御に加えて 楽観的制御 の仕組みも RDBMS 側に取り入れている。 SERIALIZABLE
も実用的に使用できる。但しチューニングのために結局気をつけることが増える上に,高頻度な更新処理には適さないため,活躍できるシーンは限られると考えられる。
ロック戦略はどうすればよいか?
どのトランザクション分離レベルを選択すればよいか?以下は個人的な意見。
共通
- 基本的には
READ COMMITTED
をベースにした上で Locking Read を活用せよ。通常はNO WAIT
オプションを付与してブロッキングを回避し,即時失敗させるとよい。 - Locking Read は空振りするとレコードロックが取得できないので,その懸念がある場合は アドバイザリーロック の併用を検討するとよい。
MySQL
- デフォルトの
REPEATABLE READ
からREAD COMMITTED
に変更して使用せよ。 - もし
REPEATABLE READ
のまま使用する場合,- ギャップロック に注意せよ。 レコードロックの空振り で意図せず発生させてしまわないように注意。
- Consistent Read と Locking Read/Write の混在 に注意せよ。一貫性が欲しい部分でそれらを併用してはならない。
-
SERIALIZABLE
は並列実行性が著しく落ちるため,実用性は薄い。 -
READ UNCOMMITTED
の出番は基本的には無い。
Postgres
- デフォルトの
READ COMMITTED
のまま使用せよ。 - 競合頻度が低い場合,
REPEATABLE READ
以上で観測される 楽観的制御 の振る舞いに身を任せたほうがパフォーマンスが出る場合があると考えられる。トレードオフとして,リトライもしくはリトライを促すための処理をアプリケーション側で書く必要となる。- 業務システムの管理画面等では多少活躍の機会はあるか?と思われたが,
NO WAIT
を付ければそれだけでロック読み取りの欠点であるブロッキングは排除できるので,あまり明確な優位性は無いと感じられる。 - 特に
SERIALIZABLE
についてはチューニングの知識も求められるため,インフラも含めるとかえって学習コストが上がってしまう懸念がある。無理をして使うよりは,素直にREAD COMMITTED
で Locking Read を用いるほうが汎用性は高い。
- 業務システムの管理画面等では多少活躍の機会はあるか?と思われたが,
コラム
謝辞
この記事を執筆するにあたり, Twitter で相談に乗っていただいた皆様に感謝いたします。
以下敬称略
Discussion
この記事が書き上がるまでの推敲過程↓
現在Cursor Lost UpdateについてMySQLのREAD UNCOMMITTEDで再現しようとしているのですが再現することができません。できれば、Cursor Lost UpdateをWhat is and how to produce "cursor lost update" in MySQL?で再現していただけないでしょうか?
大変確認遅れてすみません!既に解決しているようですが,誤植である可能性が高いです。追って修正させていただきます。
修正後、もし時間と心に余裕がありましたら、What is and how to produce "cursor lost update" in MySQL?に投稿よろしくお願いします。より多くのより良い投稿が、より強い説得力を生み出しますので、解決した・解決していないに関わらず、よろしくお願いします。
非常に有益な記事をありがとうございます。
更新競合検査とは具体的にこのドキュメントの13.2.2. リピータブルリード分離レベルの第四段落あたりの説明のことを指していますか?
Googleで検索してもこの記事しかヒットせず、英語名がある場合はそれもご享受いただけると幸いです。