Участник:Flanir1 — различия между версиями
Flanir1 (обсуждение | вклад) |
Flanir1 (обсуждение | вклад) (→Поиск) |
||
(не показаны 22 промежуточные версии этого же участника) | |||
Строка 1: | Строка 1: | ||
− | ''' 2-3 дерево ''' — структура данных, представляющая собой сбалансированное дерево поиска, такое что из каждого узла может выходить две или три ветви и глубина всех листьев одинакова. | + | ''' 2-3 дерево ''' — структура данных, представляющая собой сбалансированное дерево поиска, такое что из каждого узла может выходить две или три ветви и глубина всех листьев одинакова. Является частным случаем [[B-дерево#B.2B-.D0.B4.D0.B5.D1.80.D0.B5.D0.B2.D0.BE|B+ дерева]], когда нелистовые вершины могут иметь только 2 или 3 сыновей. |
== Свойства == | == Свойства == | ||
2-3 дерево {{---}} сбалансированное дерево поиска, обладающее следующими свойствами: | 2-3 дерево {{---}} сбалансированное дерево поиска, обладающее следующими свойствами: | ||
*нелистовые вершины имеют либо 2, либо 3 сына, | *нелистовые вершины имеют либо 2, либо 3 сына, | ||
− | *нелистовая вершина, имеющая двух сыновей, хранит максимум левого поддерева. Нелистовая вершина, имеющая трех сыновей, хранит два значения.Первое значение хранит максимум левого поддерева, второе максимум центрального поддерева, | + | *нелистовая вершина, имеющая двух сыновей, хранит максимум левого поддерева. Нелистовая вершина, имеющая трех сыновей, хранит два значения. Первое значение хранит максимум левого поддерева, второе максимум центрального поддерева, |
*сыновья упорядочены по значению максимума поддерева сына, | *сыновья упорядочены по значению максимума поддерева сына, | ||
*все листья лежат на одной глубине, | *все листья лежат на одной глубине, | ||
*Высота 2-3 дерева <tex>O(\log{n})</tex>, где <tex> n </tex> - количество элементов в дереве. | *Высота 2-3 дерева <tex>O(\log{n})</tex>, где <tex> n </tex> - количество элементов в дереве. | ||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
== Операции == | == Операции == | ||
Введем следующие обозначения: | Введем следующие обозначения: | ||
− | *<tex>\mathtt{root}</tex> - корень 2-3 дерева | + | *<tex>\mathtt{root}</tex> {{---}} корень 2-3 дерева. |
Каждый узел дерева обладает полями: | Каждый узел дерева обладает полями: | ||
− | *<tex>\mathtt{sons}</tex> - сыновья узла, | + | *<tex>\mathtt{parent}</tex> {{---}} родитель узла, |
− | *<tex>\mathtt{keys}</tex> - ключи узла, | + | *<tex>\mathtt{sons}</tex> {{---}} сыновья узла, |
− | *<tex>\mathtt{length}</tex> - количество сыновей. | + | *<tex>\mathtt{keys}</tex> {{---}} ключи узла, |
+ | *<tex>\mathtt{length}</tex> {{---}} количество сыновей. | ||
=== Поиск === | === Поиск === | ||
− | *<tex>x</tex> - искомое значение | + | *<tex>x</tex> {{---}} искомое значение, |
− | *<tex>t</tex> - текущая вершина в дереве. Изначально <tex>t = \mathtt{root}</tex> | + | *<tex>t</tex> {{---}} текущая вершина в дереве. Изначально <tex>t = \mathtt{root}</tex>. |
− | Будем просматривать ключи в узлах, пока узел не является листом.Рассмотрим два случая: | + | Будем просматривать ключи в узлах, пока узел не является листом. Рассмотрим два случая: |
− | |||
1)у текущей вершины два сына. Если её значение меньше <tex>x</tex>, то <tex>t = \mathtt{t.sons[1]}</tex>, иначе <tex>t = \mathtt{t.sons[0]}</tex>. | 1)у текущей вершины два сына. Если её значение меньше <tex>x</tex>, то <tex>t = \mathtt{t.sons[1]}</tex>, иначе <tex>t = \mathtt{t.sons[0]}</tex>. | ||
Строка 45: | Строка 39: | ||
'''else''' t = t.sons[0] | '''else''' t = t.sons[0] | ||
'''return''' t | '''return''' t | ||
− | === Вставка элемента === | + | Пример поиска в 2-3 дереве, так как элемент 6 существует, то был возвращен корректный узел, так как элемента 10 нет, возвращается некорректный узел. На основе этого можно сделать метод <tex>\mathtt{exist}</tex>, проверяющий наличии элемента в дереве. |
+ | |||
+ | [[Файл:23treesearch.png|border]] | ||
+ | |||
+ | === Вставка элемента === | ||
+ | *<tex>x</tex> {{---}} добавляемое значение, | ||
+ | *<tex>t</tex> {{---}} текущая вершина в дереве. Изначально <tex>t = \mathtt{root}</tex>. | ||
+ | Если корня не существует {{---}} дерево пустое, то новый элемент и будет корнем (одновременно и листом). Иначе поступим следующим образом: | ||
+ | |||
+ | Найдем сперва, где бы находился элемент, применив search(x). Далее проверим есть ли у этого узла родитель, если его нет, то в дереве всего один элемент {{---}} лист. Возьмем этот лист и новый узел, и создадим для них родителя, лист и новый узел расположим в порядке возрастания. | ||
+ | |||
+ | Если родитель существует, то подвесим к нему ещё одного сына. Если сыновей стало 4, то разделим родителя на два узла, и повторим разделение теперь для его родителя (перед разделением обновим ключи). | ||
+ | |||
+ | splitParent('''Node''' t): | ||
+ | '''if''' (t.length > 3) | ||
+ | Node a; | ||
+ | a.sons[0] = t.sons[2] | ||
+ | a.sons[1] = t.sons[3] | ||
+ | t.sons[2].parent = a | ||
+ | t.sons[3].parent = a | ||
+ | a.keys[0] = t.keys[2] | ||
+ | a.length = 2 | ||
+ | t.length = 2 | ||
+ | t.sons[2] = '''null''' | ||
+ | t.sons[3] = '''null''' | ||
+ | '''if''' (t.parent != '''null''') | ||
+ | t.parent[t.length] = a | ||
+ | t.length++ | ||
+ | сортируем сыновей у t.parent | ||
+ | splitParent(t.parent) | ||
+ | '''else''' //мы расщепили корень, надо подвесить его к общему родителю, который будет новым корнем | ||
+ | Node t = root | ||
+ | root.sons[0] = t | ||
+ | root.sons[1] = a | ||
+ | t.parent = root | ||
+ | a.parent = root | ||
+ | root.length = 2 | ||
+ | сортируем сыновей у root | ||
+ | Если сыновей стало 3, то ничего не делаем. Далее необходимо восстановить ключи на пути от новой вершины до корня: | ||
+ | updateKeys('''Node''' t): | ||
+ | Node a = t.parent | ||
+ | '''while''' (a != '''null''') | ||
+ | '''for''' i = 0 .. a.length - 1 | ||
+ | a.keys[i] = max(a.sons[i]) //max - возвращает максимальное значение в поддереве. | ||
+ | a = a.parent //Примечание: max легко находить, если хранить максимум | ||
+ | //правого поддерева в каждом узле {{---}} это значение и будет max(a.sons[i]) | ||
+ | |||
+ | <tex>\mathtt{updateKeys}</tex> необходимо запускать от нового узла. | ||
+ | Добавление элемента: | ||
+ | insert('''int''' x): | ||
+ | Node n = Node(x) | ||
+ | '''if''' (root == null) | ||
+ | root = n | ||
+ | return | ||
+ | Node a = search(x) | ||
+ | '''if''' (a.parent == '''null''') | ||
+ | Node t = root | ||
+ | root.sons[0] = t | ||
+ | root.sons[1] = n | ||
+ | t.parent = root | ||
+ | n.parent = root | ||
+ | root.length = 2 | ||
+ | сортируем сыновей у root | ||
+ | '''else''' | ||
+ | Node p = a.parent | ||
+ | p.sons[p.length] = n | ||
+ | p.length++ | ||
+ | n.parent = p | ||
+ | сортируем сыновей у p | ||
+ | updateKeys(n) | ||
+ | split(n) | ||
+ | updateKeys(n) | ||
+ | Так как мы спускаемся один раз, и поднимаемся вверх при расщеплении родителей не более одного раза, то <tex>\mathtt{insert}</tex> работает за <tex>O(\log{n})</tex>. | ||
+ | |||
+ | Примеры добавления: | ||
+ | |||
+ | [[Файл:23treeinsert.png|border|600px]] | ||
+ | |||
+ | [[Файл:23treeinsert2.png|800px|border]] | ||
+ | |||
+ | [[Файл:23treeinsert3.png|800px|border]] | ||
=== Удаление элемента === | === Удаление элемента === | ||
+ | *<tex>x</tex> {{---}} значение удаляемого узла, | ||
+ | *<tex>t</tex> {{---}} текущий узел. | ||
+ | Пусть изначально <tex>t = \mathtt{search(x)}</tex> {{---}} узел, где находится x. | ||
+ | |||
+ | Если у <tex>t</tex> не существует родителя, то это корень. Удалим его. | ||
+ | |||
+ | Если у <tex>t</tex> существует родитель, и у него 3 сына, то просто удалим t. Обновим ключи, запустив <tex>\mathtt{updateKeys}</tex> от любого брата <tex>t</tex>. | ||
+ | |||
+ | Если у родителя(<tex>\mathtt{t.parent}</tex>) 2 сына, то удалим <tex>t</tex>, а его брата(<tex>b</tex> перецепим к родителю соседнего листа(обозначим его за <tex>p</tex>). Вызовем <tex>updateKey(b)</tex> и <tex>splitParent(p)</tex>, так как у <tex>p</tex> могло оказаться 4 сына. Удалим теперь и <tex>\mathtt{t.parent}</tex>. После возврата из рекурсии обновим все ключи с помощью <tex>\mathtt{updateKeys()}</tex>, запустившись от <tex>b</tex>. | ||
+ | [[Файл:Treedelete.png|border|1150px]] | ||
− | === | + | === Следующий и предыдущий === |
+ | *<tex>x</tex> {{---}} поисковый параметр, | ||
+ | *<tex>t</tex> {{---}} текущий узел. | ||
+ | В силу того, что наши узлы отсортированы по максимуму в поддереве, то следующий объект это соседний лист справа. Попасть туда можно следующим образом: | ||
+ | будем подниматься вверх, пока у нас не появится первой возможности свернуть направо вниз. Как только мы свернули направо вниз, будем идти всегда влево. Таким образом, мы окажемся в соседнем листе. Если мы не смогли ни разу свернуть направо вниз, и пришли в корень, то следующего объекта не существует. Случай с предыдущим симметричен. | ||
+ | Node next('''int x''') | ||
+ | Node t = search(x) | ||
+ | '''if''' (t.keys[0] > x) //x не было в дереве, и мы нашли следующий сразу | ||
+ | '''return''' t | ||
+ | '''while''' (t != '''null''') | ||
+ | t = t.parent | ||
+ | if (можно свернуть направо вниз) | ||
+ | в t помещаем вершину, в которую свернули | ||
+ | '''while''' (пока t {{---}} не лист) | ||
+ | t = t.sons[0] | ||
+ | '''return''' t | ||
+ | '''return''' t; | ||
+ | |||
+ | [[Файл:Treenext.png|border|325px]] [[Файл:Treeprev.png|border|300px]] | ||
− | == | + | === Find === |
− | * [http://is.ifmo.ru/vis/tree23/tree23_ru.html is.ifmo.ru - Визуализатор 2-3 дерева | + | B+ деревья, поддерживают операцию <tex>\mathtt{find}</tex>, которая позволяет находить m следующих элементов. Так как все листья отсортированы в порядке возрастания, то просто свяжем каждый лист с соседями. |
− | * [http://rain.ifmo.ru/cat/view.php/vis/trees/2-3-2002 rain.ifmo.ru - Визуализатор 2-3 дерева | + | *<tex>\mathtt{right}</tex> - правый лист, |
− | * [http://ru.wikipedia.org/wiki/2-3-дерево Википедия | + | *<tex>\mathtt{left}</tex> - левый лист. |
+ | Доработаем добавление. Когда мы уже добавили элемент и обновили ключи, найдем для него следующий, и запишем на него ссылку в <tex>\mathtt{right}</tex>, найдем предыдущий и запишем на него ссылку в <tex>\mathtt{left}</tex>,так же и его соседям укажем ссылка на него. | ||
+ | |||
+ | Доработаем удаление. При удалении элемента, мы просто связываем его соседей за <tex>O(1)</tex>. | ||
+ | |||
+ | [[Файл:23treefind.png|border]] | ||
+ | |||
+ | == Источники информации == | ||
+ | * [http://is.ifmo.ru/vis/tree23/tree23_ru.html is.ifmo.ru {{---}} Визуализатор 2-3 дерева] | ||
+ | * [http://rain.ifmo.ru/cat/view.php/vis/trees/2-3-2002 rain.ifmo.ru {{---}} Визуализатор 2-3 дерева] | ||
+ | * [http://ru.wikipedia.org/wiki/2-3-дерево Википедия {{---}} 2-3 дерево] | ||
* Д. Кнут «Искусство программирования. Сортировка и поиск», часть 6.2.4 | * Д. Кнут «Искусство программирования. Сортировка и поиск», часть 6.2.4 | ||
+ | |||
== См. также == | == См. также == | ||
* [[B-дерево]] | * [[B-дерево]] |
Текущая версия на 18:16, 10 мая 2015
2-3 дерево — структура данных, представляющая собой сбалансированное дерево поиска, такое что из каждого узла может выходить две или три ветви и глубина всех листьев одинакова. Является частным случаем B+ дерева, когда нелистовые вершины могут иметь только 2 или 3 сыновей.
Содержание
Свойства
2-3 дерево — сбалансированное дерево поиска, обладающее следующими свойствами:
- нелистовые вершины имеют либо 2, либо 3 сына,
- нелистовая вершина, имеющая двух сыновей, хранит максимум левого поддерева. Нелистовая вершина, имеющая трех сыновей, хранит два значения. Первое значение хранит максимум левого поддерева, второе максимум центрального поддерева,
- сыновья упорядочены по значению максимума поддерева сына,
- все листья лежат на одной глубине,
- Высота 2-3 дерева , где - количество элементов в дереве.
Операции
Введем следующие обозначения:
- — корень 2-3 дерева.
Каждый узел дерева обладает полями:
- — родитель узла,
- — сыновья узла,
- — ключи узла,
- — количество сыновей.
Поиск
- — искомое значение,
- — текущая вершина в дереве. Изначально .
Будем просматривать ключи в узлах, пока узел не является листом. Рассмотрим два случая: 1)у текущей вершины два сына. Если её значение меньше
, то , иначе .2)у текущей вершины три сына. Если второе значение меньше
, то . Если первое значение меньше , то , иначе .Node search(int x): Node t = root while (t не является листом) if (t.length == 2) if (t.keys[0] < x) t = t.sons[1] else t = t.sons[0] else if (t.keys[1] < x) t = t.sons[2] else if (t.keys[0] < x) t = t.sons[1] else t = t.sons[0] return t
Пример поиска в 2-3 дереве, так как элемент 6 существует, то был возвращен корректный узел, так как элемента 10 нет, возвращается некорректный узел. На основе этого можно сделать метод
, проверяющий наличии элемента в дереве.Вставка элемента
- — добавляемое значение,
- — текущая вершина в дереве. Изначально .
Если корня не существует — дерево пустое, то новый элемент и будет корнем (одновременно и листом). Иначе поступим следующим образом:
Найдем сперва, где бы находился элемент, применив search(x). Далее проверим есть ли у этого узла родитель, если его нет, то в дереве всего один элемент — лист. Возьмем этот лист и новый узел, и создадим для них родителя, лист и новый узел расположим в порядке возрастания.
Если родитель существует, то подвесим к нему ещё одного сына. Если сыновей стало 4, то разделим родителя на два узла, и повторим разделение теперь для его родителя (перед разделением обновим ключи).
splitParent(Node t): if (t.length > 3) Node a; a.sons[0] = t.sons[2] a.sons[1] = t.sons[3] t.sons[2].parent = a t.sons[3].parent = a a.keys[0] = t.keys[2] a.length = 2 t.length = 2 t.sons[2] = null t.sons[3] = null if (t.parent != null) t.parent[t.length] = a t.length++ сортируем сыновей у t.parent splitParent(t.parent) else //мы расщепили корень, надо подвесить его к общему родителю, который будет новым корнем Node t = root root.sons[0] = t root.sons[1] = a t.parent = root a.parent = root root.length = 2 сортируем сыновей у root
Если сыновей стало 3, то ничего не делаем. Далее необходимо восстановить ключи на пути от новой вершины до корня:
updateKeys(Node t): Node a = t.parent while (a != null) for i = 0 .. a.length - 1 a.keys[i] = max(a.sons[i]) //max - возвращает максимальное значение в поддереве. a = a.parent //Примечание: max легко находить, если хранить максимум //правого поддерева в каждом узле — это значение и будет max(a.sons[i])
необходимо запускать от нового узла. Добавление элемента:
insert(int x): Node n = Node(x) if (root == null) root = n return Node a = search(x) if (a.parent == null) Node t = root root.sons[0] = t root.sons[1] = n t.parent = root n.parent = root root.length = 2 сортируем сыновей у root else Node p = a.parent p.sons[p.length] = n p.length++ n.parent = p сортируем сыновей у p updateKeys(n) split(n) updateKeys(n)
Так как мы спускаемся один раз, и поднимаемся вверх при расщеплении родителей не более одного раза, то
работает за .Примеры добавления:
Удаление элемента
- — значение удаляемого узла,
- — текущий узел.
Пусть изначально
— узел, где находится x.Если у
не существует родителя, то это корень. Удалим его.Если у
существует родитель, и у него 3 сына, то просто удалим t. Обновим ключи, запустив от любого брата . ) 2 сына, то удалим , а его брата( перецепим к родителю соседнего листа(обозначим его за ). Вызовем и , так как у могло оказаться 4 сына. Удалим теперь и . После возврата из рекурсии обновим все ключи с помощью , запустившись от .Следующий и предыдущий
- — поисковый параметр,
- — текущий узел.
В силу того, что наши узлы отсортированы по максимуму в поддереве, то следующий объект это соседний лист справа. Попасть туда можно следующим образом: будем подниматься вверх, пока у нас не появится первой возможности свернуть направо вниз. Как только мы свернули направо вниз, будем идти всегда влево. Таким образом, мы окажемся в соседнем листе. Если мы не смогли ни разу свернуть направо вниз, и пришли в корень, то следующего объекта не существует. Случай с предыдущим симметричен.
Node next(int x) Node t = search(x) if (t.keys[0] > x) //x не было в дереве, и мы нашли следующий сразу return t while (t != null) t = t.parent if (можно свернуть направо вниз) в t помещаем вершину, в которую свернули while (пока t — не лист) t = t.sons[0] return t return t;
Find
B+ деревья, поддерживают операцию
, которая позволяет находить m следующих элементов. Так как все листья отсортированы в порядке возрастания, то просто свяжем каждый лист с соседями.- - правый лист,
- - левый лист.
Доработаем добавление. Когда мы уже добавили элемент и обновили ключи, найдем для него следующий, и запишем на него ссылку в
, найдем предыдущий и запишем на него ссылку в ,так же и его соседям укажем ссылка на него.Доработаем удаление. При удалении элемента, мы просто связываем его соседей за
.Источники информации
- is.ifmo.ru — Визуализатор 2-3 дерева
- rain.ifmo.ru — Визуализатор 2-3 дерева
- Википедия — 2-3 дерево
- Д. Кнут «Искусство программирования. Сортировка и поиск», часть 6.2.4