インデックスに関して

作成日時：2024-09-22
更新日時：2024-09-22

クラスタ化インデックス

インデックス上に実データが格納されているもの。
MySQLのInnoDBなど。

インデックスキーの列に加えて、非キー列（付加列）をインデックスに含める機能。
key => PK + 追加情報。
効果的にカバリングインデックスを作成できる。

部分インデックス
特定のカラムにのみ、インデックスを貼る。

CREATE INDEX idx_active_users ON users (username)
WHERE is_active = true;

SELECT username
FROM users
WHERE is_active = true AND username LIKE 'A%';

PostgreSQLには(いまのところ)無い。

MySQLのinnoDBなどのクラスタ化インデックスにおける。
セカンダリインデックスを使用して検索をする場合、

と、2段階アクセスが発生し、パフォーマンスがよくない。

この主キー検索を高速化するためにアダプティブハッシュインデックスがある。
イメージとしてはkeyがセカンダリインデックスの検索値のハッシュ、valueがレコードへのポインタ。
ハッシュなので等価検索のときにのみ使われる。
バッファプール上に作られる。

{GROUP BY指定カラム, 集計対象値}でインデックスを貼っているとした時、下記のスキャンが行われる。

インデックスを使用してGROUP BYクエリを解決

集計対象値のMINやMAXならば、各GROUP BY指定カラムの先頭のインデックスデータを見ればすぐわかる。

(A, 1),(A, 2),(A, 3),(B, 4),(B, 5)
ならば先頭のカラムの値、つまり1と4のカラムだけを見ればいいから
パフォーマンスはよい。

MIN()を取ろうとすれば、A1,B4が返却される。

ページがツリー構造になっている。

ルートノード -> インターナルノード -> リーフノード