B+-дерево — различия между версиями

Версия 02:22, 1 апреля 2018

B[math]^{+}[/math]-дерево (англ. B[math]^{+}[/math]-tree) — структура данных на основе B-дерева, сбалансированное [math]n[/math]-арное дерево поиска с переменным, но зачастую большим количеством потомков в узле. B[math]^{+}[/math]-деревья имеют очень высокий коэффициент ветвления (число указателей из родительского узла на дочерние, обычно порядка [math]100[/math] или более), что снижает количество операций ввода-вывода, требующих поиска элемента в дереве.

Содержание

1 Где используется
2 Отличия от B-дерева
3 Оценка высоты дерева
4 Структура
- 4.1 Структура узла
- 4.2 Структура дерева
5 Операции
6 См. также
7 Примeчания
8 Источники информации

Где используется

Изначально структура предназначалась для эффективного поиска в блочно-ориентированной среде хранения — в частности, для файловых систем. Структура широко применяется в таких файловых системах, как NTFS^[1], ReiserFS^[2], NSS^[3], JFS^[4], ReFS^[5]. Различные реляционные системы управления базами данных, такие как Microsoft SQL Server^[6], Oracle Database^[7], SQLite^[8] используют B[math]^{+}[/math]-деревья для табличных индексов.

Отличия от B-дерева

В B-дереве во всех вершинах хранятся ключи вместе с сопутствующей информацией. В B[math]^{+}[/math]-деревьях вся информация хранится в листьях, а во внутренних узлах хранятся только копии ключей. Таким образом удается получить максимально возможную степень ветвления во внутренних узлах. Кроме того, листовой узел может включать в себя указатель на следующий листовой узел для ускорения последовательного доступа, что решает одну из главных проблем B-деревьев.

Оценка высоты дерева

Теорема:

Если , то для B-дерева c узлами и минимальной степенью высота

Доказательство:

Так как [math]n \geqslant 1[/math], то корень B[math]^{+}[/math]-дерева [math]T[/math] содержит хотя бы один ключ, а все остальные узлы — хотя бы [math]t - 1[/math] ключей. [math]T[/math] имеет хотя бы [math]2[/math] узла на высоте [math]1[/math], не менее [math]2t[/math] узлов на глубине [math]2[/math], и так далее. То есть на глубине [math]h[/math], оно имеет хотя бы [math]2t^{h-1}[/math] узлов. Так как сами ключи хранятся только в листах, а во внутренних вершинах лишь их копии, то для [math]n[/math] ключей [math]n \geqslant 2t^{h-1}[/math]

Как можно заметить, высота B[math]^{+}[/math]-дерева не более чем на [math]1[/math] отличается от высоты B-дерева, то есть хранение информации только в листах почти не ухудшает эффективность дерева

Структура

Свойства B[math]^{+}[/math] дерева аналогичны свойствам B-дерева (с учетом отличий описанных выше).

Структура узла

struct Node
   bool leaf       // является ли узел листом
   int  key_num    // количество ключей узла
   int  key[]      // ключи узла
   Node parent     // указатель на отца
   Node child[]    // указатели на детей узла
   Info pointers[] // если лист — указатели на данные
   Node left       // указатель на левого брата
   Node right      // указатель на правого брата

Структура дерева

struct BPlusTree
   int  t          // минимальная степень дерева
   Node root       // указатель на корень дерева

Операции

B[math]^{+}[/math]-деревья являются сбалансированными, поэтому время выполнения стандартных операций в них пропорционально высоте.

Поиск листа

Напишем вспомогательную функцию, которая будет возвращать лист, в котором должен находится переданный ей ключ. Определяем интервал и переходим к соответствующему сыну. Повторяем пока не дошли до листа.

Node find_leaf(T: BPlusTree, key: int):
    now = T.root
    while now.leaf [math]\neq[/math] true
        for i = 0 to now.key_num
            if i == now.key_num or key < now.key[i]
                now = now.child[i]
                break
    return now

Поиск

Находим нужный лист через [math]find[/math]_[math]leaf[/math] и ищем нужный ключ в нем

Добавление ключа

Ищем лист, в который можно добавить ключ и добавляем его в список ключей. Если узел не заполнен, то добавление завершено. Иначе разбиваем узел на два узла. Будем считать, что в дереве не может находиться [math]2[/math] одинаковых ключа, поэтому [math]insert[/math] будет возвращать был ли добавлен ключ.

bool insert(T: BPlusTree, key: int, value: Info):
    leaf = find_key(T, key)
    for i = 0 to leaf.key_num
        if key == leaf.key[i]
            return false 
    pos = 0
    while pos < leaf.key_num and leaf.key[pos] < key
        ++pos
    for i = leaf.key_num downto pos + 1 
        leaf.key[i] = leaf.key[i - 1]
        leaf.pointers[i] = leaf.pointer[i - 1]
    leaf.key[pos] = key
    leaf.pointers[pos] = value
    ++leaf.key_num
    if leaf.key_num == 2 * t              // t — степень дерева
        split(T, leaf)                   // Разбиваем узел
    return true

Разбиение узла

Разбиение на два узла происходит следующим образом: в первый добавляем первые [math]t - 1[/math] ключей, во второй последние [math]t[/math]. Если узел — лист, то оставшийся ключ также добавляется в левое поддерево, а его копия отправляется в родительский в родительский узел, где становится разделительной точкой для двух новых поддеревьев.

Если и родительский узел заполнен — поступаем аналогично, но не копируем, а просто перемещаем оставшийся перемещаем ключ в родительский узел, так как это просто копия. Повторяем пока не встретим незаполненный узел или не дойдем до корня. В последнем случае корень разбивается на два узла и высота дерева увеличивается.

void split(T: BPlusTree, node: Node):
    new_node = new_Node()                  //Создаем новый узел
    new_node.right = node.right
    node.right.left = new_node
    node.right = new_node
    new_node.left = node
    mid_key = node.key[t - 1]
    new_node.key_num = t
    
    for i = 0 to new_node.key_num - 1
        new_node.key[i] = node.key[i + t]
        new_node.pointers[i] = node.pointers[i + t]  
        new_node.child[i] = node.child[i + t]    
    new_node.child[new_node.key_num] = node.child[2 * t]  
    node.key_num = t - 1
    
    if node.leaf
        ++node.key_num
        new_node.leaf = true
        mid_key = node.key[t]
    
    if node == T.root
        T.root = new_Node()
        T.root.key[0] = mid_key
        T.root.child[0] = node
        T.root.child[1] = new_node
        T.root.key_num = 1;
        node.parent = T.root
        new_node.parent = T.root
    else
        new_node.parent = node.parent
        parent = node.parent
        pos = 0
        while pos < parent.key_num and parent.key[pos] < mid_key
            ++pos
        for i = parent.key_num downto pos + 1 
            parent.key[i] = parent.key[i - 1]
        for i = parent.key_num + 1 downto pos + 2 
            parent.child[i] = parent.child[i - 1]
        parent.key[pos] = mid_key
        parent.child[pos + 1] = new_node
        ++parent.key_num
        
        if parent.key_num == 2 * t 
            split(T, parent)

Удаление

Поскольку все ключи находятся в листах, для удаления в первую очередь необходимо найти листовой узел, в котором он находится. Если узел содержит не менее [math]t - 1[/math] ключей, где [math]t[/math] — это степень дерева, то удаление завершено. Иначе необходимо выполнить попытку перераспределения элементов, то есть добавить в узел элемент из левого или правого брата (не забыв обновить информацию в родителе). Если это невозможно, необходимо выполнить слияние с братом и удалить ключ, который указывает на удалённый узел. Объединение может распространяться на корень, тогда происходит уменьшение высоты дерева. Так как мы считаем, что в дереве не может находиться [math]2[/math] одинаковых ключей, то [math]delete[/math] будет возвращать был ли удален ключ.

bool delete(T: BPlusTree, key: int):
    leaf = find_key(T, key)
    pos = 0
    while pos < leaf.key_num and leaf.key[pos] < key
        ++pos
    if pos == leaf.key_num or leaf.key[pos] [math]\neq[/math] key
        return false
    else 
        delete_in_node(leaf, key)                    // Удалить ключ из вершины
        return true

void delete_in_node(tec: Node, key: int):
    pos = 0
    while pos < tec.key_num and tec.key[pos] < key
        ++pos
    if pos == tec.key_num or tec.key[pos] [math]\neq[/math] key
        return
    for i = pos to tec.key_num - 1 
        tec.key[i] = tec.key[i + 1]
        tec.pointers[i] = tec.pointer[i + 1]
    for i = pos + 1 to tec.key_num 
        tec.child[i] = tec.child[i + 1]
    --tec.key_num
    
    if leaf.key_num < t - 1
        right_sibling = tec.right
        left_sibling = tec.left
        if left_sibling [math]\neq[/math] null and left_sibling.key_num > t - 1
            --left_sibling.key_num
            ++tec.key_num
            for i = 1 to tec.key_num - 1 
                tec.key[i] = tec.key[i - 1]
                tec.pointers[i] = tec.pointer[i - 1] 
                tec.child[i] = tec.child[i - 1]
            tec.child[tec.key_num] = tec.child[tec.key_num - 1]
            tec.key[0] = left_sibling.key[left_sibling.key_num]
            tec.pointers[0] = left_sibling.pointers[left_sibling.key_num]
            tec.child[0] = left_sibling.child [left_sibling.key_num + 1]
            update(tec)                                                        // Обновить ключи на пути к корню
        
        else if right_sibling [math]\neq[/math] null and right_sibling.key_num > t - 1
            --right_sibling.key_num
            ++tec.key_num
            tec.key[tec.key_num - 1] = right_sibling.key[0]
            tec.pointers[tec.key_num - 1] = right_sibling.child[0]
            tec.child[tec.key_num - 1] = right_sibling.pointers[0]
            update(tec)  
         
        else
            if left_sibling [math]\neq[/math] null 
                left_sibling.right = tec.right
                tec.right.left = left_sibling 
                for i = 0 to tec.key_num - 1
                    left_sibling.key[left_sibling.key_num] = tec.key[i]
                    left_sibling.pointers[left_sibling.key_num] = tec.pointers[i]
                    left_sibling.child[left_sibling.key_num + 1] = tec.child[i]
                    ++left_sibling.key_num
                left_sibling.child[left_sibling.key_num + 1] = tec.child[tec.key_num]
                update(left_sibling) 
                delete_in_node(left_sibling.parent, max_key(left_sibling))      // Удаляем разделительный ключ в отце
             
            else
                right_sibling.right.left = tec 
                tec.right = right_sibling.right
                for i = 0 to tec.key_num - 1
                    tec.key[tec.key_num] = right_sibling.key[i]
                    tec.pointers[tec.key_num] = right_sibling.pointers[i]
                    tec.child[tec.key_num + 1] = right_sibling.child[i]
                    ++tec.key_num
                tec.child[tec.key_num + 1] = right_sibling.child[right_sibling.key_num]
                update(tec)
                delete_in_node(tec.parent, max_key(tec)) 
        if T.root.key_num == 1
            T.root = T.root.child[0]

См. также

Примeчания

Источники информации

Д. Кнут «Искусство программирования. Сортировка и поиск», часть 6.2.4
Wikipedia — B[math]^{+}[/math]-tree
Wikipedia — B-tree
B[math]^{+}[/math]-tree visualization

[1] Wikipedia — NTFS

[2] Wikipedia — ReiserFS

[3] Wikipedia — NSS

[4] Wikipedia — JFS

[5] Wikipedia — ReFS

[6] Wikipedia — Microsoft SQL Server

[7] Wikipedia — Oracle Database

[8] Wikipedia — SQLite

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

@@ Строка 214: / Строка 214: @@
           '''if''' T.root.key_num == 1
               T.root = T.root.child[0]
+== См. также ==
+* [[B-дерево]]
+* [[2-3 дерево]]
 == Примeчания ==
 <references/>
+== Источники информации ==
+* Д. Кнут «Искусство программирования. Сортировка и поиск», часть 6.2.4
+* [https://en.wikipedia.org/wiki/B%2B_tree Wikipedia {{---}} B<tex>^{+}</tex>-tree]
+* [https://en.wikipedia.org/wiki/B-tree Wikipedia {{---}} B-tree]
+* [https://www.cs.usfca.edu/~galles/visualization/BPlusTree.html B<tex>^{+}</tex>-tree visualization]
+[[Категория: Дискретная математика и алгоритмы]]
+[[Категория: Структуры данных]]
+[[Категория: Деревья поиска]]

B+-дерево — различия между версиями

Версия 02:22, 1 апреля 2018

Содержание

Где используется

Отличия от B-дерева

Оценка высоты дерева

Структура

Структура узла

Структура дерева

Операции

Поиск листа

Поиск

Добавление ключа

Разбиение узла

Удаление

См. также

Примeчания

Источники информации

Навигация

Персональные инструменты

Пространства имён

Варианты

Просмотры

Ещё

Поиск

Навигация

Инструменты