B+-дерево
BB-дерева, сбалансированное -арное дерево поиска с переменным, но зачастую большим количеством потомков в узле. B -деревья имеют очень высокий коэффициент ветвления (число указателей из родительского узла на дочерние, обычно порядка 100 или более), что снижает количество операций ввода-вывода, требующих поиска элемента в дереве.
-дерево (англ. B -tree) — структура данных на основеГде используется
Изначально структура предназначалась для эффективного поиска в блочно-ориентированной среде хранения — в частности, для файловых систем. Структура широко применяется в таких файловых системах, как NTFS[1], ReiserFS[2], NSS[3], JFS[4], ReFS[5]. Различные реляционные системы управления базами данных, такие как Microsoft SQL Server[6], Oracle Database[7], SQLite[8] используют B -деревья для табличных индексов.
Отличия от B-дерева
В B-дереве во всех вершинах хранятся ключи вместе с сопутствующей информацией. В B
-деревьях вся информация хранится в листьях, а во внутренних узлах хранятся только копии ключей. Таким образом удается получить максимально возможную степень ветвления во внутренних узлах. Кроме того, листовой узел может включать в себя указатель на следующий листовой узел для ускорения последовательного доступа, что решает одну из главных проблем B-деревьев.Структура
Свойства B свойствам B-дерева (с учетом отличий описанных выше).
дерева аналогичныСтруктура узла
struct Node bool leaf // является ли узел листом int key_num // количество ключей узла int key[] // ключи узла Node p // указатель на отца Node c[] // указатели на детей узла Node next // указатели на следующий элемент (для внутренних вершин = null)
Структура дерева
struct BPlusTree int t // минимальная степень дерева Node root // указатель на корень дерева
Оценка высоты дерева
Теорема: |
Если , то для B -дерева c узлами и минимальной степенью
|
Доказательство: |
Так как , то корень B -дерева содержит хотя бы один ключ, а все остальные узлы — хотя бы ключей. имеет хотя бы узла на высоте , не менее узлов на глубине , и так далее. То есть на глубине , оно имеет хотя бы узлов. Так как сами ключи хранятся только в листах, а во внутренних вершинах лишь их копии, то для ключей |
Как можно заметить, высота Bвысоты B-дерева, то есть хранение информации только в листах почти не ухудшает эффективность дерева
-дерева не более чем на 1 отличается отОперации
B
-деревья являются сбалансированными, поэтому время выполнения стандартных операций в них пропорционально высоте.Поиск
Определяем интервал и переходим к соответствующему сыну. Повторяем пока не дошли до листа.
Node find(T: BPlusTree, k: int): Node now = T.root while !now.leaf for i = 0 to key.num if i == now.key_num or key < now.key[i] now = now.ch[i] break return now