基礎インデックスの種類

B-treeインデックス

定義

B-treeインデックスとは、値をソートした平衡木構造で保持し、ルートから葉ノードへ辿ることで対数時間で目的の値に到達できるインデックス方式である。

B-treeは「ソートされた分岐する索引」

B-treeは、キーをソート順に保持しながら1つのノードから複数の子に分岐する木構造です。ルートから葉に向けて辿っていくだけで、目的の値に対数時間で到達できます。以下のインタラクティブ図解で、実際に探索の動きを見てみましょう。

B-treeインデックス（探索・挿入）

探すキー：

最大キー数：

状況

「1ステップ」でノードを1つずつ辿る、または「自動再生」で連続再生。

この木は「1ノードあたり最大3キー」の設定。実際のRDBのB-treeはノードあたり数百キー入るため、数億件でも数段の辿りで済む。

本記事の図解はデフォルトでノードあたり最大3キーに設定していますが（上のコントロールで変更可能）、実際のRDBMSではノードあたり数百〜数千キーが入ります。そのため、10億件のデータでも木の高さはわずか3〜4段程度で済み、ディスクI/Oが極めて少ない探索が可能です。

「挿入モード」に切り替えて値を追加してみてください。ノードのキー数が上限を超えると、中央値を親に押し上げて分割する動きが見られます。こうして木の高さは最小限に保たれ、常にバランスした状態が維持されます。

B-treeの葉ノードには、検索キーそのものだけでなく、そのキーが指す実データがどのページにあるかを示す行IDが入っています。つまり検索の流れは「B-treeを数段辿る」→「行IDを取得」→「そのページを1回読む」の3ステップ。

B-treeの葉ノードから実データへ

なぜ「対数時間」で1件を取り出せるか、これで物理的に見えてきます。 B-treeを辿るのに数ページ、そこから行IDを得てテーブル本体を1ページ読む。合計でも数回のページ読み取りで済むため、1000万件でも数ミリ秒で1件が引ける。

いずれも「ソート順が使えなくなる」ため、B-treeを辿ることができずフルスキャンに落ちます。

Q.なぜB-treeはこんなに速いのですか？

A.1つのノードから複数の子ノードに分岐するので、木の高さがデータ件数の対数（O(log N)）にしかならないためです。1億件でも数段の辿りで済みます。

Q.B-treeとB+treeの違いは？

A.B+treeは葉ノードにだけ実データ（へのポインタ）を持ち、葉同士がリンクリストで繋がっている点が特徴です。範囲検索が高速化されるため、実際のRDBMSの多くはB+treeを採用しています。

Q.B-treeインデックスが効かないクエリは？

A.先頭ワイルドカードのLIKE検索（例: LIKE '%abc'）、関数を通した比較（WHERE UPPER(name) = ...）、暗黙の型変換を伴う比較などです。これらではソート順に沿った探索ができません。

本セクションはAmazonアソシエイトのリンクを含みます。購入いただくと運営者に紹介料が入る場合があります。

オンライン個別指導

たいてっくが、SQL・データベース設計・パフォーマンスチューニング・ IPAデータベーススペシャリスト対策まで、1対1で学習をサポートします。まずは無料相談から。