🌊

PostgreSQLでORDER BY idが速い!?理由

2025/02/15に公開

PostgreSQLでORDER BY idを指定すると、結果が高速に取得できるケースがあります。その理由を解説します。

 1. idがプライマリキーまたはインデックスの場合idがプライマリキー（PRIMARY KEY）である場合、自動的にB-Treeインデックスが作成されます。このインデックスは、データを論理的にソートした状態で管理するため、ORDER BY idを指定した際に追加のソート処理が不要になり、高速なデータ取得が可能になります。
具体的な例:
CREATE TABLE my_table (
    id SERIAL PRIMARY KEY,
    name TEXT
);
この場合、ORDER BY idのクエリでは、B-Treeインデックスを利用して順序どおりに取得できるため、ソートコストが発生しません。

 2. ソート処理の回避一般に、SQLのORDER BY句を使うと、PostgreSQLはデータをソートするための計算を行います。しかし、idがインデックスに従ってソート済みの場合、PostgreSQLは余計なソート処理をスキップできます。

 インデックススキャンの活用例えば、以下のクエリを実行すると、
EXPLAIN ANALYZE SELECT * FROM my_table ORDER BY id;
Index Scanが使用されていることが確認できます。
もし、idがインデックス化されていない場合は、Seq Scan（シーケンシャルスキャン）が発生し、ソート処理に時間がかかる可能性があります。

 3. 物理データ配置との関係PostgreSQLのヒープテーブルでは、データの物理的な配置は必ずしも挿入順序と一致しません。しかし、

idが連番（SERIALやBIGSERIAL）である
データが増分挿入される
といった条件下では、物理配置がID順に近くなり、ORDER BY idの処理が最適化されやすくなります。

 4. ディスクI/Oとメモリ使用量の最適化通常、ソート処理にはメモリ（work_mem）が使用され、メモリが不足するとディスクに一時ファイルを書き出します。ORDER BY idがインデックスを活用できる場合、
余計なメモリ消費が減る
ディスクI/Oが抑えられる
結果として、パフォーマンスが向上します。

 まとめORDER BY idが速い理由は、主に以下のポイントに集約されます。
idがインデックス化されていれば、追加のソート処理が不要
PostgreSQLは最適なクエリプランを選択し、インデックススキャンを活用
データの挿入順とインデックス順が一致しやすいため、物理スキャンの効率が良い
不要なメモリ使用やディスクI/Oを抑えられるため、全体的な処理が軽量化
このように、ORDER BY idを適切に利用することで、PostgreSQLのパフォーマンスを最大限に引き出すことが可能です。

PostgreSQLでORDER BY idが速い!?理由

1. `id`がプライマリキーまたはインデックスの場合

2. ソート処理の回避

インデックススキャンの活用

3. 物理データ配置との関係

4. ディスクI/Oとメモリ使用量の最適化

まとめ

Discussion