2-3 дерево — различия между версиями

Версия 21:23, 11 мая 2015

Пример 2-3 дерева

2-3 дерево (англ. 2-3 tree) — структура данных, представляющая собой сбалансированное дерево поиска, такое что из каждого узла может выходить две или три ветви и глубина всех листьев одинакова. Является частным случаем B+ дерева.

Свойства

2-3 дерево — сбалансированное дерево поиска, обладающее следующими свойствами:

нелистовые вершины имеют либо [math]2[/math], либо [math]3[/math] сына,
нелистовая вершина, имеющая двух сыновей, хранит максимум левого поддерева. Нелистовая вершина, имеющая трех сыновей, хранит два значения. Первое значение хранит максимум левого поддерева, второе максимум центрального поддерева,
сыновья упорядочены по значению максимума поддерева сына,
все листья лежат на одной глубине,
Высота 2-3 дерева [math]O(\log{n})[/math], где [math] n [/math] — количество элементов в дереве.

Операции

Введем следующие обозначения:

[math]\mathtt{root}[/math] — корень 2-3 дерева.

Каждый узел дерева обладает полями:

[math]\mathtt{parent}[/math] — родитель узла,
[math]\mathtt{sons}[/math] — сыновья узла,
[math]\mathtt{keys}[/math] — ключи узла,
[math]\mathtt{length}[/math] — количество сыновей.

Поиск

[math]x[/math] — искомое значение,
[math]t[/math] — текущая вершина в дереве.

Изначально [math]t = \mathtt{root}[/math]. Будем просматривать ключи в узлах, пока узел не является листом. Рассмотрим два случая:

у текущей вершины два сына. Если её значение меньше [math]x[/math], то [math]t = \mathtt{t.sons[1]}[/math], иначе [math]t = \mathtt{t.sons[0]}[/math].

у текущей вершины три сына. Если второе значение меньше [math]x[/math], то [math]t = \mathtt{t.sons[2]}[/math]. Если первое значение меньше [math]x[/math], то [math]t = \mathtt{t.sons[1]}[/math], иначе [math]t = \mathtt{t.sons[0]}[/math].

T search(T x):
  Node t = root
  while (t не является листом)
    if (t.length == 2)
      if (t.keys[0] < x)
        t = t.sons[1]
      else t = t.sons[0]
    else if (t.keys[1] < x)
      t = t.sons[2]
    else if (t.keys[0] < x)
      t = t.sons[1]
    else t = t.sons[0]
  return t.keys[0]

Пример поиска в 2-3 дереве, так как элемент [math]6[/math] существует, то был возвращен корректный узел, так как элемента [math]10[/math] нет, возвращается некорректный узел. На основе этого можно сделать метод [math]\mathtt{exist}[/math], проверяющий наличии элемента в дереве.

Поиск элемента 2

Вставка элемента

[math]x[/math] — добавляемое значение,
[math]t[/math] — текущая вершина в дереве. Изначально [math]t = \mathtt{root}[/math].

Если корня не существует — дерево пустое, то новый элемент и будет корнем (одновременно и листом). Иначе поступим следующим образом:

Найдем сперва, где бы находился элемент, применив [math]\mathtt{search(x)}[/math]. Далее проверим есть ли у этого узла родитель, если его нет, то в дереве всего один элемент — лист. Возьмем этот лист и новый узел, и создадим для них родителя, лист и новый узел расположим в порядке возрастания.

Если родитель существует, то подвесим к нему ещё одного сына. Если сыновей стало [math]4[/math], то разделим родителя на два узла, и повторим разделение теперь для его родителя, ведь у него тоже могло быть уже [math]3[/math] сына, а мы разделили и у него стало на [math]1[/math] сына больше. (перед разделением обновим ключи).

function splitParent(Node t):
 if (t.length > 3) 
   Node a = Node(sons = {t.sons[2], t.sons[3]}, keys = {t.keys[2]}, parent = t.parent, a.length = 2)
   t.sons[2].parent = a
   t.sons[3].parent = a
   t.length = 2
   t.sons[2] = null
   t.sons[3] = null
   if (t.parent != null)
     t.parent[t.length] = a
     t.length++
     сортируем сыновей у t.parent
     splitParent(t.parent)
   else                   // мы расщепили корень, надо подвесить его к общему родителю, который будет новым корнем
    Node t = root
    root.sons[0] = t
    root.sons[1] = a
    t.parent = root
    a.parent = root
    root.length = 2
    сортируем сыновей у root

Если сыновей стало [math]3[/math], то ничего не делаем. Далее необходимо восстановить ключи на пути от новой вершины до корня:

function updateKeys(Node t): 
  Node a = t.parent
  while (a != null)
   for i = 0 .. a.length - 1
     a.keys[i] = max(a.sons[i]) // max — возвращает максимальное значение в поддереве.
   a = a.parent                 // Примечание: max легко находить, если хранить максимум 
                                // правого поддерева в каждом узле — это значение и будет max(a.sons[i])

[math]\mathtt{updateKeys}[/math] необходимо запускать от нового узла. Добавление элемента:

function insert(T x):
  Node n = Node(x)
  if (root == null) 
   root = n
   return
  Node a = search(x)
  if (a.parent == null) 
    Node t = root
    root.sons[0] = t
    root.sons[1] = n
    t.parent = root
    n.parent = root
    root.length = 2
    сортируем сыновей у root
  else 
    Node p = a.parent
    p.sons[p.length] = n
    p.length++
    n.parent = p
    сортируем сыновей у p
    updateKeys(n) 
    split(n)
  updateKeys(n)

Так как мы спускаемся один раз, и поднимаемся вверх при расщеплении родителей не более одного раза, то [math]\mathtt{insert}[/math] работает за [math]O(\log{n})[/math].

Примеры добавления:

Добавление элемента с ключом 6

Удаление элемента

[math]x[/math] — значение удаляемого узла,
[math]t[/math] — текущий узел.
[math]b[/math] — любой брат [math]t[/math].

Пусть изначально [math]t = \mathtt{search(x)}[/math] — узел, где находится [math]x[/math].

Если у [math]t[/math] не существует родителя, то это корень. Удалим его.

Если у [math]t[/math] существует родитель, и у него строго больше [math]2[/math] сыновей, то просто удалим [math]t[/math], а у [math]\mathtt{t.parent}[/math] уменьшим количество детей.

Если у родителя [math]\mathtt{t}[/math] [math]2[/math] сына, то найдем у любого соседнего листа его родителя, обозначим его за [math]p[/math]. Обозначим отца соседнего листа за [math]p[/math].Рассмотрим возможные случаи:

[math]p[/math] не существует, тогда мы удаляем одного из сыновей корня, тогда другой сын становится новым корнем,
у [math]\mathtt{t.parent}[/math] оказалось [math]2[/math] сына, у [math]p[/math] оказалось 2 сына. Подвесим [math]b[/math] к [math]p[/math] и удалим [math]t[/math], но у отца [math]\mathtt{t.parent}[/math] не изменим количество детей. Так у отца [math]\mathtt{t.parent}[/math] оказалось тоже два сына,повторяем для него такие же рассуждения.
у [math]\mathtt{t.parent}[/math] оказалось [math]2[/math] сына, у [math]p[/math] оказалось 2 сына. Подвесим [math]b[/math] к [math]p[/math] и удалим [math]t[/math], а у отца уменьшим количество детей. Так как у [math]p[/math] оказалось четыре сына, то необходимо его расщепить. Теперь у отца [math]\mathtt{t.parent}[/math] оказалось два сына и все узлы 2-3 дерева корректны.
у [math]\mathtt{t.parent}[/math] оказалось [math]3[/math] сына, у [math]p[/math] оказалось 2 сына. Подвесим [math]b[/math] к [math]p[/math] и удалим [math]t[/math], а у отца уменьшим количество детей. Так как у [math]p[/math] оказалось три сына, а у отца [math]\mathtt{t.parent}[/math] все ещё больше одного сына, то все узлы 2-3 дерева корректны.
у [math]\mathtt{t.parent}[/math] оказалось [math]3[/math] сына, у [math]p[/math] оказалось 3 сына. Подвесим [math]b[/math] к [math]p[/math] и удалим [math]t[/math], а у отца уменьшим количество детей. Так как у [math]p[/math] оказалось четыре сына, то расщепим его, теперь у отца [math]\mathtt{t.parent}[/math] вновь три сына и все узлы 2-3 дерева корректны.

Обобщим алгоритм при удалении когда у родителя [math]\mathtt{t}[/math] два сына(ниже мы никогда не уменьшаем количество детей у [math]\mathtt{t.parent}[/math]):

Если p не существует, то оказывается, что мы сейчас удаляем какого-то из сыновей корня (для определенности далее левого, с правым аналогично). Тогда теперь правый сын становится корнем. На этом удаление заканчивается.

Если p существует, то удалим [math]t[/math], а его брата ([math]b[/math]) перецепим к [math]p[/math]. Теперь у [math]p[/math] могло оказаться [math]4[/math] сына, поэтому повторим аналогичные действия из [math]\mathtt{insert}[/math]: вызовем [math]\mathtt{updateKeys}(b)[/math] и [math]\mathtt{splitParent}(p)[/math]. Теперь рекурсивно удалим [math]\mathtt{t.parent}[/math].

В результате мы получаем корректное по структуре 2-3 дерево, но у нас есть нарушение в ключах в узлах, исправим их с помощью [math]\mathtt{updateKeys()}[/math], запустившись от [math]b[/math].

Удаление элемента с ключом 2

Следующий и предыдущий

[math]x[/math] — поисковый параметр,
[math]t[/math] — текущий узел.

В силу того, что наши узлы отсортированы по максимуму в поддереве, то следующий объект это соседний лист справа. Попасть туда можно следующим образом: будем подниматься вверх, пока у нас не появится первой возможности свернуть направо вниз. Как только мы свернули направо вниз, будем идти всегда влево. Таким образом, мы окажемся в соседнем листе. Если мы не смогли ни разу свернуть направо вниз, и пришли в корень, то следующего объекта не существует. Случай с предыдущим симметричен.

 T next(T x)
   Node t = search(x)
   if (t.keys[0] > x) //x не было в дереве, и мы нашли следующий сразу
     return t
   while (t != null)
     t = t.parent
     if (можно свернуть направо вниз)
      в t помещаем вершину, в которую свернули
      while (пока t — не лист)
       t = t.sons[0]
       return t
   return t.keys[0];

Путь при поиске следующего элемента после 2

Нахождение m следующих элементов

B+ деревья, поддерживают операцию [math]\mathtt{find}[/math], которая позволяет находить m следующих элементов. Наивная реализация выглядит следующим образом: будем вызывать [math]m[/math] раз поиск следующего элемента, такое решение работает за [math]O(m \log{n})[/math]. Но 2-3 деревья, позволяют находить m следующих элементов за [math]O(m + \log{n})[/math], что значительно ускоряет поиск при больших [math]m[/math]. По построению, все листья у нас отсортированы в порядке возрастания, воспользуемся этим для нахождения m элементов. Нам необходимо связать листья, для этого модифицируем [math]\mathtt{insert}[/math] и [math]\mathtt{delete}[/math]. Добавим к узлам следующие поля:

[math]\mathtt{right}[/math] — указывает на правый лист,
[math]\mathtt{left}[/math] — указывает на левый лист.

Пусть [math]t[/math] — добавленный узел. Изменим [math]\mathtt{insert}[/math] следующим образом: в самом конце, после того как мы уже обновили все ключи, найдем [math]\mathtt{next(t)}[/math] и запишем ссылку на него в [math]\mathtt{t.right}[/math]. Аналогично с левым.

Пусть [math]t[/math] — удаляемый узел. Изменим [math]\mathtt{delete}[/math] следующим образом: в самом начале, до удаления [math]t[/math], найдем следующий [math]\mathtt{next}[/math] и запишем в [math]\mathtt{next.left}[/math] правый лист относительно [math]t[/math]. С левым поступим аналогично.

В итоге, мы имеем двусвязный список в листьях, и чтобы нам вывести [math]m[/math] элементов, нам достаточно один раз найти нужный элемент и пробежаться вправо на [math]m[/math] элементов.

thumb

См. также

Источники информации

is.ifmo.ru — Визуализатор 2-3 дерева
rain.ifmo.ru — Визуализатор 2-3 дерева
Википедия — 2-3 дерево
Д. Кнут «Искусство программирования. Сортировка и поиск» — стр. 508 - 509

@@ Строка 53: / Строка 53: @@
   '''function''' splitParent('''Node''' t):
    '''if''' (t.length > 3)
-     Node a;
+     Node a = Node(sons = {t.sons[2], t.sons[3]}, keys = {t.keys[2]}, parent = t.parent, a.length = 2)
-    a.sons[0] = t.sons[2]
-    a.sons[1] = t.sons[3]
      t.sons[2].parent = a
      t.sons[3].parent = a
-    a.keys[0] = t.keys[2]
-    a.length = 2
      t.length = 2
      t.sons[2] = '''null'''
@@ Строка 68: / Строка 64: @@
        сортируем сыновей у t.parent
        splitParent(t.parent)
-     '''else'''                   //мы расщепили корень, надо подвесить его к общему родителю, который будет новым корнем
+     '''else'''                   <font color=green>// мы расщепили корень, надо подвесить его к общему родителю, который будет новым корнем</font>
       Node t = root
       root.sons[0] = t
@@ Строка 81: / Строка 77: @@
     '''while''' (a != '''null''')
      '''for''' i = 0 .. a.length - 1
-       a.keys[i] = max(a.sons[i]) //max {{---}} возвращает максимальное значение в поддереве.
+       a.keys[i] = max(a.sons[i]) <font color=green>// max {{---}} возвращает максимальное значение в поддереве.</font>
-     a = a.parent                 //Примечание: max легко находить, если хранить максимум
+     a = a.parent                 <font color=green>// Примечание: max легко находить, если хранить максимум </font>
-                                  //правого поддерева в каждом узле {{---}} это значение и будет max(a.sons[i])
+                                  <font color=green>// правого поддерева в каждом узле {{---}} это значение и будет max(a.sons[i])</font>
 <tex>\mathtt{updateKeys}</tex> необходимо запускать от нового узла.

2-3 дерево — различия между версиями

Версия 21:23, 11 мая 2015

Содержание

Свойства

Операции

Поиск

Вставка элемента

Удаление элемента

Следующий и предыдущий

Нахождение m следующих элементов

См. также

Источники информации

Навигация

Персональные инструменты

Пространства имён

Варианты

Просмотры

Ещё

Поиск

Навигация

Инструменты