2-3 дерево — различия между версиями
Shersh (обсуждение | вклад) м (→Слияние двух деревьев) |
Flanir1 (обсуждение | вклад) |
||
| Строка 1: | Строка 1: | ||
| − | + | ''' 2-3 дерево ''' — структура данных, представляющая собой сбалансированное дерево поиска, такое что из каждого узла может выходить две или три ветви и глубина всех листьев одинакова. Является частным случаем [[B-дерево#B.2B-.D0.B4.D0.B5.D1.80.D0.B5.D0.B2.D0.BE|B+ дерева]], когда нелистовые вершины могут иметь только 2 или 3 сыновей. | |
| − | ''' 2-3 дерево ''' — структура данных, представляющая собой сбалансированное дерево поиска, такое что из каждого узла может выходить две или три ветви и глубина всех листьев одинакова. | + | == Свойства == |
| − | + | 2-3 дерево {{---}} сбалансированное дерево поиска, обладающее следующими свойствами: | |
| − | == | + | *нелистовые вершины имеют либо 2, либо 3 сына, |
| − | + | *нелистовая вершина, имеющая двух сыновей, хранит максимум левого поддерева. Нелистовая вершина, имеющая трех сыновей, хранит два значения. Первое значение хранит максимум левого поддерева, второе максимум центрального поддерева, | |
| − | : | + | *сыновья упорядочены по значению максимума поддерева сына, |
| − | + | *все листья лежат на одной глубине, | |
| − | + | *Высота 2-3 дерева <tex>O(\log{n})</tex>, где <tex> n </tex> - количество элементов в дереве. | |
| − | |||
| − | |||
== Операции == | == Операции == | ||
| + | Введем следующие обозначения: | ||
| + | *<tex>\mathtt{root}</tex> {{---}} корень 2-3 дерева. | ||
| + | Каждый узел дерева обладает полями: | ||
| + | *<tex>\mathtt{parent}</tex> {{---}} родитель узла, | ||
| + | *<tex>\mathtt{sons}</tex> {{---}} сыновья узла, | ||
| + | *<tex>\mathtt{keys}</tex> {{---}} ключи узла, | ||
| + | *<tex>\mathtt{length}</tex> {{---}} количество сыновей. | ||
=== Поиск === | === Поиск === | ||
| − | + | *<tex>x</tex> {{---}} искомое значение, | |
| − | + | *<tex>t</tex> {{---}} текущая вершина в дереве. Изначально <tex>t = \mathtt{root}</tex>. | |
| − | + | Будем просматривать ключи в узлах, пока узел не является листом. Рассмотрим два случая: | |
| − | то | + | 1)у текущей вершины два сына. Если её значение меньше <tex>x</tex>, то <tex>t = \mathtt{t.sons[1]}</tex>, иначе <tex>t = \mathtt{t.sons[0]}</tex>. |
| − | + | ||
| − | + | 2)у текущей вершины три сына. Если второе значение меньше <tex>x</tex>, то <tex>t = \mathtt{t.sons[2]}</tex>. Если первое значение меньше <tex>x</tex>, то <tex>t = \mathtt{t.sons[1]}</tex>, иначе <tex>t = \mathtt{t.sons[0]}</tex>. | |
| − | в | + | |
| + | '''Node''' search('''int''' x): | ||
| + | Node t = root | ||
| + | '''while''' (t не является листом) | ||
| + | '''if''' (t.length == 2) | ||
| + | '''if''' (t.keys[0] < x) | ||
| + | t = t.sons[1] | ||
| + | '''else''' t = t.sons[0] | ||
| + | '''else''' | ||
| + | '''if''' (t.keys[1] < x) | ||
| + | t = t.sons[2] | ||
| + | '''else''' | ||
| + | '''if''' (t.keys[0] < x) | ||
| + | t = t.sons[1] | ||
| + | '''else''' t = t.sons[0] | ||
| + | '''return''' t | ||
| + | Пример поиска в 2-3 дереве, так как элемент 6 существует, то был возвращен корректный узел, так как элемента 10 нет, возвращается некорректный узел. На основе этого можно сделать метод <tex>\mathtt{exist}</tex>, проверяющий наличии элемента в дереве | ||
| + | |||
| + | [[Файл:23treesearch.png|border]] | ||
| − | === Вставка элемента === | + | === Вставка элемента === |
| − | + | *<tex>x</tex> {{---}} добавляемое значение, | |
| + | *<tex>t</tex> {{---}} текущая вершина в дереве. Изначально <tex>t = \mathtt{root}</tex>. | ||
| + | Если корня не существует {{---}} дерево пустое, то новый элемент и будет корнем (одновременно и листом). Иначе поступим следующим образом: | ||
| − | + | Найдем сперва, где бы находился элемент, применив search(x). Далее проверим есть ли у этого узла родитель, если его нет, то в дереве всего один элемент {{---}} лист. Возьмем этот лист и новый узел, и создадим для них родителя, лист и новый узел расположим в порядке возрастания. | |
| − | + | Если родитель существует, то подвесим к нему ещё одного сына. Если сыновей стало 4, то разделим родителя на два узла, и повторим разделение теперь для его родителя(перед разделением обновим ключи). | |
| − | 2) | + | splitParent('''Node''' t): |
| + | '''if''' (t.length > 3) | ||
| + | Node a; | ||
| + | a.sons[0] = t.sons[2] | ||
| + | a.sons[1] = t.sons[3] | ||
| + | t.sons[2].parent = a | ||
| + | t.sons[3].parent = a | ||
| + | a.keys[0] = t.keys[2] | ||
| + | a.length = 2 | ||
| + | t.length = 2 | ||
| + | t.sons[2] = '''null''' | ||
| + | t.sons[3] = '''null''' | ||
| + | '''if''' (t.parent != '''null''') | ||
| + | t.parent[t.length] = a | ||
| + | t.length++ | ||
| + | сортируем сыновей у t.parent | ||
| + | splitParent(t.parent) | ||
| + | '''else''' //мы расщепили корень, надо подвесить его к общему родителю, который будет новым корнем | ||
| + | Node t = root | ||
| + | root.sons[0] = t | ||
| + | root.sons[1] = a | ||
| + | t.parent = root | ||
| + | a.parent = root | ||
| + | root.length = 2 | ||
| + | сортируем сыновей у root | ||
| + | Если сыновей стало 3, то ничего не делаем. Далее необходимо восстановить ключи на пути от новой вершины до корня: | ||
| + | updateKeys('''Node''' t): | ||
| + | Node a = t.parent | ||
| + | '''while''' (a != '''null''') | ||
| + | '''for''' i = 0 .. a.length - 1 | ||
| + | a.keys[i] = max(a.sons[i]) //max - возвращает максимальное значение в поддереве. | ||
| + | a = a.parent //Примечание: max легко находить, если хранить максимум | ||
| + | //правого поддерева в каждом узле {{---}} это значение и будет max(a.sons[i]) | ||
| − | + | <tex>\mathtt{updateKeys}</tex> необходимо запускать от нового узла. | |
| + | Добавление элемента: | ||
| + | insert('''int''' x): | ||
| + | Node n = Node(x) | ||
| + | '''if''' (root == null) | ||
| + | root = n | ||
| + | return | ||
| + | Node a = search(x) | ||
| + | '''if''' (a.parent == '''null''') | ||
| + | Node t = root | ||
| + | root.sons[0] = t | ||
| + | root.sons[1] = n | ||
| + | t.parent = root | ||
| + | n.parent = root | ||
| + | root.length = 2 | ||
| + | сортируем сыновей у root | ||
| + | '''else''' | ||
| + | Node p = a.parent | ||
| + | p.sons[p.length] = n | ||
| + | p.length++ | ||
| + | n.parent = p | ||
| + | сортируем сыновей у p | ||
| + | updateKeys(n) | ||
| + | split(n) | ||
| + | updateKeys(n) | ||
| + | Так как мы спускаемся один раз, и поднимаемся вверх при расщеплении родителей не более одного раза, то <tex>\mathtt{insert}</tex> работает за <tex>O(\log{n})</tex>. | ||
| − | + | Примеры добавления: | |
| − | |||
| − | + | [[Файл:23treeinsert.png|border|600px]] | |
| − | + | [[Файл:23treeinsert2.png|800px|border]] | |
| − | [[Файл: | + | [[Файл:23treeinsert3.png|800px|border]] |
| − | + | === Удаление элемента === | |
| + | *<tex>x</tex> {{---}} значение удаляемого узла, | ||
| + | *<tex>t</tex> {{---}} текущий узел. | ||
| + | Пусть изначально <tex>t = \mathtt{search(x)}</tex> {{---}} узел, где находится x. | ||
| − | + | Если у <tex>t</tex> не существует родителя, то это корень. Удалим его. | |
| − | + | Если у <tex>t</tex> существует родитель, и у него 3 сына, то просто удалим t. Обновим ключи, запустив <tex>\mathtt{updateKeys}</tex> от любого брата <tex>t</tex>. | |
| − | |||
| − | + | Если у родителя(<tex>\mathtt{t.parent}</tex>) 2 сына, то удалим <tex>t</tex>, а его брата(<tex>b</tex> перецепим к родителю соседнего листа(обозначим его за <tex>p</tex>). Вызовем <tex>updateKey(b)</tex> и <tex>splitParent(p)</tex>, так как у <tex>p</tex> могло оказаться 4 сына. Удалим теперь и <tex>\mathtt{t.parent}</tex>. После возврата из рекурсии обновим все ключи с помощью <tex>\mathtt{updateKeys()}</tex>, запустившись от <tex>b</tex>. | |
| + | [[Файл:Treedelete.png|border|1150px]] | ||
| − | [[Файл: | + | === Следующий и предыдущий === |
| + | *<tex>x</tex> {{---}} поисковый параметр, | ||
| + | *<tex>t</tex> {{---}} текущий узел. | ||
| + | В силу того, что наши узлы отсортированы по максимуму в поддереве, то следующий объект это соседний лист справа. Попасть туда можно следующим образом: | ||
| + | Будем подниматься вверх, пока у нас не появится первой возможности свернуть направо вниз. Как только мы свернули направо вниз, будем идти всегда налево. Таким образом мы окажемся в соседнем листе. Если мы не смогли ни разу свернуть направо вниз, и пришли в корень, то следующего объекта не существует. Симметрично разбирается и случай с предыдущим. | ||
| + | Node next('''int x''') | ||
| + | Node t = search(x) | ||
| + | '''if''' (t.keys[0] > x) //x не было в дереве, и мы нашли следующий сразу | ||
| + | '''return''' t | ||
| + | '''while''' (t != '''null''') | ||
| + | t = t.parent | ||
| + | if (можно свернуть направо вниз) | ||
| + | в t помещаем вершину, в которую свернули | ||
| + | '''while''' (пока t {{---}} не лист) | ||
| + | t = t.sons[0] | ||
| + | '''return''' t | ||
| + | '''return''' t; | ||
| + | |||
| + | [[Файл:Treenext.png|border|325px]] [[Файл:Treeprev.png|border|300px]] | ||
| − | + | === Find === | |
| + | B+ деревья, поддерживают операцию <tex>\mathtt{find}</tex>, которая позволяет находить m следующих элементов. Так как все листья отсортированы в порядке возрастания, то просто свяжем каждый лист с соседями. | ||
| + | *<tex>\mathtt{right}</tex> - правый лист, | ||
| + | *<tex>\mathtt{left}</tex> - левый лист. | ||
| + | Доработаем добавление. Когда мы уже добавили элемент и обновили ключи, найдем для него следующий, и запишем на него ссылку в <tex>\mathtt{right}</tex>, найдем предыдущий и запишем на него ссылку в <tex>\mathtt{left}</tex>,так же и его соседям укажем ссылка на него. | ||
| + | Доработаем удаление. При удалении элемента, мы просто связываем его соседей за <tex>O(1)</tex>. | ||
| − | [[Файл: | + | [[Файл:23treefind.png|border]] |
== Cсылки == | == Cсылки == | ||
Версия 18:08, 10 мая 2015
2-3 дерево — структура данных, представляющая собой сбалансированное дерево поиска, такое что из каждого узла может выходить две или три ветви и глубина всех листьев одинакова. Является частным случаем B+ дерева, когда нелистовые вершины могут иметь только 2 или 3 сыновей.
Содержание
Свойства
2-3 дерево — сбалансированное дерево поиска, обладающее следующими свойствами:
- нелистовые вершины имеют либо 2, либо 3 сына,
- нелистовая вершина, имеющая двух сыновей, хранит максимум левого поддерева. Нелистовая вершина, имеющая трех сыновей, хранит два значения. Первое значение хранит максимум левого поддерева, второе максимум центрального поддерева,
- сыновья упорядочены по значению максимума поддерева сына,
- все листья лежат на одной глубине,
- Высота 2-3 дерева , где - количество элементов в дереве.
Операции
Введем следующие обозначения:
- — корень 2-3 дерева.
Каждый узел дерева обладает полями:
- — родитель узла,
- — сыновья узла,
- — ключи узла,
- — количество сыновей.
Поиск
- — искомое значение,
- — текущая вершина в дереве. Изначально .
Будем просматривать ключи в узлах, пока узел не является листом. Рассмотрим два случая: 1)у текущей вершины два сына. Если её значение меньше , то , иначе .
2)у текущей вершины три сына. Если второе значение меньше , то . Если первое значение меньше , то , иначе .
Node search(int x):
Node t = root
while (t не является листом)
if (t.length == 2)
if (t.keys[0] < x)
t = t.sons[1]
else t = t.sons[0]
else
if (t.keys[1] < x)
t = t.sons[2]
else
if (t.keys[0] < x)
t = t.sons[1]
else t = t.sons[0]
return t
Пример поиска в 2-3 дереве, так как элемент 6 существует, то был возвращен корректный узел, так как элемента 10 нет, возвращается некорректный узел. На основе этого можно сделать метод , проверяющий наличии элемента в дереве
Вставка элемента
- — добавляемое значение,
- — текущая вершина в дереве. Изначально .
Если корня не существует — дерево пустое, то новый элемент и будет корнем (одновременно и листом). Иначе поступим следующим образом:
Найдем сперва, где бы находился элемент, применив search(x). Далее проверим есть ли у этого узла родитель, если его нет, то в дереве всего один элемент — лист. Возьмем этот лист и новый узел, и создадим для них родителя, лист и новый узел расположим в порядке возрастания.
Если родитель существует, то подвесим к нему ещё одного сына. Если сыновей стало 4, то разделим родителя на два узла, и повторим разделение теперь для его родителя(перед разделением обновим ключи).
splitParent(Node t):
if (t.length > 3)
Node a;
a.sons[0] = t.sons[2]
a.sons[1] = t.sons[3]
t.sons[2].parent = a
t.sons[3].parent = a
a.keys[0] = t.keys[2]
a.length = 2
t.length = 2
t.sons[2] = null
t.sons[3] = null
if (t.parent != null)
t.parent[t.length] = a
t.length++
сортируем сыновей у t.parent
splitParent(t.parent)
else //мы расщепили корень, надо подвесить его к общему родителю, который будет новым корнем
Node t = root
root.sons[0] = t
root.sons[1] = a
t.parent = root
a.parent = root
root.length = 2
сортируем сыновей у root
Если сыновей стало 3, то ничего не делаем. Далее необходимо восстановить ключи на пути от новой вершины до корня:
updateKeys(Node t):
Node a = t.parent
while (a != null)
for i = 0 .. a.length - 1
a.keys[i] = max(a.sons[i]) //max - возвращает максимальное значение в поддереве.
a = a.parent //Примечание: max легко находить, если хранить максимум
//правого поддерева в каждом узле — это значение и будет max(a.sons[i])
необходимо запускать от нового узла. Добавление элемента:
insert(int x): Node n = Node(x) if (root == null) root = n return Node a = search(x) if (a.parent == null) Node t = root root.sons[0] = t root.sons[1] = n t.parent = root n.parent = root root.length = 2 сортируем сыновей у root else Node p = a.parent p.sons[p.length] = n p.length++ n.parent = p сортируем сыновей у p updateKeys(n) split(n) updateKeys(n)
Так как мы спускаемся один раз, и поднимаемся вверх при расщеплении родителей не более одного раза, то работает за .
Примеры добавления:
Удаление элемента
- — значение удаляемого узла,
- — текущий узел.
Пусть изначально — узел, где находится x.
Если у не существует родителя, то это корень. Удалим его.
Если у существует родитель, и у него 3 сына, то просто удалим t. Обновим ключи, запустив от любого брата .
Если у родителя() 2 сына, то удалим , а его брата( перецепим к родителю соседнего листа(обозначим его за ). Вызовем и , так как у могло оказаться 4 сына. Удалим теперь и . После возврата из рекурсии обновим все ключи с помощью , запустившись от .
Следующий и предыдущий
- — поисковый параметр,
- — текущий узел.
В силу того, что наши узлы отсортированы по максимуму в поддереве, то следующий объект это соседний лист справа. Попасть туда можно следующим образом: Будем подниматься вверх, пока у нас не появится первой возможности свернуть направо вниз. Как только мы свернули направо вниз, будем идти всегда налево. Таким образом мы окажемся в соседнем листе. Если мы не смогли ни разу свернуть направо вниз, и пришли в корень, то следующего объекта не существует. Симметрично разбирается и случай с предыдущим.
Node next(int x)
Node t = search(x)
if (t.keys[0] > x) //x не было в дереве, и мы нашли следующий сразу
return t
while (t != null)
t = t.parent
if (можно свернуть направо вниз)
в t помещаем вершину, в которую свернули
while (пока t — не лист)
t = t.sons[0]
return t
return t;
Find
B+ деревья, поддерживают операцию , которая позволяет находить m следующих элементов. Так как все листья отсортированы в порядке возрастания, то просто свяжем каждый лист с соседями.
- - правый лист,
- - левый лист.
Доработаем добавление. Когда мы уже добавили элемент и обновили ключи, найдем для него следующий, и запишем на него ссылку в , найдем предыдущий и запишем на него ссылку в ,так же и его соседям укажем ссылка на него. Доработаем удаление. При удалении элемента, мы просто связываем его соседей за .
Cсылки
- is.ifmo.ru - Визуализатор 2-3 дерева — 1
- rain.ifmo.ru - Визуализатор 2-3 дерева — 2
- Википедия — 2-3 дерево
- Д. Кнут «Искусство программирования. Сортировка и поиск», часть 6.2.4

