Изменения

Взвешенное дерево

2414 байт добавлено, 16:14, 22 июня 2017

→‎Структура вершины n

'''Scapegoat-tree''' {{---}} сбалансированное [[Дерево поиска, наивная реализация | двоичное дерево поиска]], обеспечивающее наихудшее время поиска {{---}} <tex>O(\log N)</tex>, и амортизирующее время вставки и удаления элемента {{---}} <tex>O(\log N)</tex>.

В отличие от большинства других самобалансирующихся бинарных деревьев поиска , которые обеспечивают худшем случае <tex>O(\log N)</tex> время поиска, Scapegoat деревья не требуют дополнительной памяти в узлах по сравнению с обычным двоичным деревом поиска: узел хранит только ключ и два указателя на своих потомков.

== Операции ==<center>{| class="wikitable"

|-

! rowspan="2" |Операции

! colspan="2" | Insert

! colspan="2" | Delete

! colspan="2" | Search

! colspan="2" | Память

~~! rowspan="2" | Описание~~

|-

! style="background: #ddffdd;" | Среднее

|-

| Scapegoat-tree

| align="center" style="background: #ddffdd;" | <tex>O(log\ n)</tex>

| align="center" style="background: #ffdddd;" | Амортизировано <tex>O(log\ n)</tex>

| align="center" style="background: #ddffdd;" | <tex>O(log n)</tex>

| colspan="2" align="center" style="background: #ffffdd;" | <tex>O(n)</tex>

| align="center" | Сбалансированное [[Дерево поиска, наивная реализация | двоичное дерево поиска]]. В отличие от большинства других самобалансирующихся бинарных деревьев поиска не требует дополнительной памяти в узлах по сравнению с обычным двоичным деревом поиска: узел хранит только ключ и два указателя на своих потомков.

|}

~~== Операции ==~~</center>

===Обозначения и Определения===

Квадратные скобки в обозначениях означают, что хранится это значение явно, а значит можно взять за время <tex>O(1)</tex>. Круглые скобки означают, что значение будет вычисляться по ходу дела то есть память не расходуется, но зато нужно время на вычисление.

<tex>\mathtt{T}</tex> — обозначение дерева,

<tex>\mathtt{root[T]}</tex> — корень дерева <tex>T</tex>,

<tex>\mathtt{left[x]}</tex> — левый сын вершины <tex>x</tex>,

<tex>\mathtt{right[x]}</tex> — правый сын вершины <tex>x</tex>,

<tex>\mathtt{brother(x)}</tex> — брат вершины <tex>x</tex> (вершина, которая имеет с <tex>x</tex> общего родителя),

<tex>\mathtt{depth(x)}</tex> — глубина вершины <tex>x</tex>(количество рёбер от нее до корня),

<tex>\mathtt{height(T)}</tex> — глубина дерева <tex>T</tex>(глубина самой глубокой вершины дерева <tex>T</tex>),

<tex>\mathtt{weight(x)}</tex> — вес вершины <tex>x</tex>(количество всех её дочерних вершин плюс <tex>1</tex> {{---}} она сама),

<tex>\mathtt{weight[T]}</tex> — размер дерева <tex>T</tex>(количество вершин в нём),

<tex>\mathtt{maxweight[T]}</tex> — максимальный размер дерева(максимальное значение, которое параметр <tex>\mathtt{weight[T]}</tex> принимал с момента последней перебалансировки, то есть если перебалансировка произошла только что, то <tex>\mathtt{maxweight[T]} = \mathtt{weight[T]}</tex>

[[Файл:0ce162a62b624da8ba02233b4b254f23.png|380px|right]]

Коэффициeнт <tex>\alpha</tex> — это число в диапазоне от <tex>[0.5; 1)</tex>, определяющее требуемую степень качества балансировки дерева.

{{Определение

|definition=Некоторая вершина <tex>x</tex> называется '''<tex>\alpha</tex>-сбалансированной по весу''', если <tex>\mathtt{weight(left[x])} \leqslant \alpha \cdot \mathtt{weight(x)}</tex> и <tex>\mathtt{weight(right[x])} \leqslant \alpha \cdot ~~size~~\mathtt{weight(x)}</tex>.}}

Перед тем как приступить к работе с деревом, выбирается параметр <tex>\alpha</tex> в диапазоне <tex>[0.5; 1)</tex>. Также нужно завести две переменные для хранения текущих значений <tex>\mathtt {weight[T]}</tex> и <tex>\mathtt{maxweight[T]}</tex> и обнулить их. === Структура вершины === '''struct''' Node: '''T''' key //значение в вершине '''Node''' left //левый ребенок вершины '''Node''' right //правый ребенок вершины '''Node''' height //высота поддерева данной вершины '''Node''' depth //глубина вершины '''Node''' parent //ссылка на родителя '''Node''' sibling //ссылки на "братьев" данной вершины

=== Поиск элемента ===

Пусть требуется найти в данном Scapegoat дереве какой-то элемент. Поиск происходит так же, как и в обычном дереве поиска, поскольку не меняет дерево, но его время работы составляет <tex>O(\log_\frac{1}{\alpha} (N))</tex>.

Таким образом, сложность получается логарифмическая, НО'''но! ''' При <tex>\alpha</tex> близком к <tex>0.5</tex> мы получаем двоичный (или почти двоичный) логарифм, что означает практически идеальную скорость поиска. При <tex>\alpha</tex> близком к единице основание логарифма стремится к единице, а значит общая сложность стремится к <tex>O(N)</tex>.

*<tex>root</tex> {{---}} корень дерева или поддерева, в котором происходит поиск.

'''Search'''(root, k):

'''if ''' root = ~~null~~ <tex>\varnothing</tex> or root.key = k:

'''return ''' root

'''else if ''' k ≤ <tex>\leqslant</tex> root.left.key:

'''return ''' Search(root.left, k)

'''else''':

=== Вставка элемента ===

Классический алгоритм вставки нового элемента: поиском ищем место, куда бы подвесить новую вершину, ну и подвешиваем. Легко понять, что это действие могло нарушить <tex>\alpha</tex>-балансировку по весу для одной или более вершин дерева. И вот теперь начинается то, что и дало название нашей структуре данных: требуется найти Scapegoat-вершину — вершину, для которой потерян <tex>\alpha</tex>-баланс и её поддерево должно быть перестроено. Сама только что вставленная вершина, хотя и виновата в потере баланса, Scapegoat-вершиной стать не может — у неё ещё нет потомков, а значит её баланс идеален. Соответственно, нужно пройти по дереву от этой вершины к корню, пересчитывая веса для каждой вершины по пути. Может возникнуть вопрос {{- --}} нужно ли хранить ссылки на родителей? Поскольку к месту вставки новой вершины пришли из корня дерева — есть стек, в котором находится весь путь от корня к новой вершине. Берутся ~~родителей~~ родители из него. Если на этом пути от нашей вершины к корню встретится вершина, для которой критерий <tex>\alpha</tex>-сбалансированности по весу нарушился — тогда полностью перестраивается соответствующее ей поддерево так, чтобы восстановить <tex>\alpha</tex>-сбалансированность по весу.

Сразу появляется вопрос {{---}} как делать перебалансировку найденной Scapegoat-вершины?

Есть <tex>2 </tex> способа перебалансировки, {{---}} тривиальный и чуть более сложный.

====Тривиальный способ перебалансировки====

# совершается обход всего поддерева Scapegoat-вершины (включая её саму) с помощью in-order обхода — на выходе получается отсортированный список (свойство In-order обхода бинарного дерева поиска).

# Для «левого» и «правого» поддерева рекурсивно повторяется та же операция.

Данный способ требует <tex>O\mathtt{(weight(Scapegoat-root))}</tex> времени и столько же памяти.

==== Получение списка ====

*<tex>root</tex> {{---}} корень дерева, которое будет преобразовано в список.

'''FlattenTree'''(root, head):

'''if''' root = <tex>\varnothing</tex>:

'''return''' head

root.right = FlattenTree(root.right, head)

'''return''' FlattenTree(root.left, root)

==== Построение дерева ====

*<tex>size</tex> {{---}} число вершин в списке.

*<tex>head</tex> {{---}} первая вершина в списке.

BuildHeightBalancedTree(size, head):

'''if''' size = 1 then:

return head

'''else if''' size = 2 then:

(head.right).left = head

'''return''' head.right

root = (BuildHeightBalancedTree(⌊(size − 1)/2⌋, head)).right

last = BuildHeightBalancedTree(⌊(size − 1)/2⌋, root.right)

root.left = head

'''return''' last

==== Перестроение дерева ====

*<tex>size</tex> {{---}} число вершин в поддереве.

*<tex>scapegoat</tex> {{---}} вершина, которая испортила баланс.

'''RebuildTree'''(size, scapegoat):

head = '''FlattenTree'''(scapegoat, <tex>\varnothing</tex>)

'''BuildHeightBalancedTree'''(size, head)

'''while''' head.parent <tex>\ne \varnothing </tex>

head = head.parent

'''return''' head

====Более сложный способ перебалансировки====

Время работы перебалансировки вряд ли улучшится — всё-таки каждую вершину нужно «подвесить» в новое место. Но можно попробовать сэкономить память. Давайте посмотрим на <tex>1 </tex> способ алгоритма внимательнее. ~~Вот выбирается медиану~~Выбирается медиана, подвешивается в корень, дерево делится на два поддерева — и делится весьма однозначно. Никак нельзя выбрать «какую-то другую медиану» или подвесить «правое» поддерево вместо левого. Та же самая однозначность преследует и на каждом из следующих шагов. ~~Т.е.~~ То есть для некоторого списка вершин, отсортированных в возрастающем порядке, будет ровно одно порождённое данным алгоритмом дерево. А откуда же берется отсортированный список вершин? Из in-order обхода изначального дерева. То есть каждой вершине, найденной по ходу in-order обхода перебалансируемого дерева соответствует одна конкретная позиция в новом дереве. И можно эту позицию рассчитать и без создания самого отсортированного списка. А рассчитав — сразу её туда записать. Возникает только одна проблема — этим затирается какая-то (возможно ещё не просмотренная) вершина — что же делать? Хранить её. Где? Ответ прост: выделять для списка таких вершин память. Но этой памяти нужно будет уже не <tex>O(weight(N))</tex>, а всего лишь <tex>O(\log N)</tex>.

Представьте себе в уме дерево, состоящее из трёх вершин — корня и двух подвешенных как «левые» сыновья вершин. In-order обход вернёт нам эти вершины в порядке от самой «глубокой» до корня, но хранить в отдельной памяти по ходу этого обхода нам придётся всего одну вершину (самую глубокую), поскольку когда мы придём во вторую вершину, мы уже будем знать, что это медиана и она будет корнем, а остальные две вершины — её детьми. ~~Т.е.~~ То есть расход памяти здесь — на хранение одной вершины, что согласуется с верхней оценкой для дерева из трёх вершин — <tex>\log(3)</tex>.Таким образом, если нужно сэкономить память, то <tex>2 </tex> способ перебалансировки дерева {{---}} лучший вариант.

<~~gallery align="~~center~~" mode~~>{| cellpadding="~~packed~~0" ~~heights="160px">~~| [[Файл:Good_insert_1.png|400px|thumb|Вставка без нарушения баланса 1]] || [[Файл:Good_insert_2.png|400px|thumb|Вставка без нарушения баланса 2]]|}{| cellpadding="0"|align="center"|[[Файл:Bad_insert.png|595px|thumb|Вставка с нарушением баланса. Вершина 5 стала Scapegoat, будет запущена перебалансировка]]|}</~~gallery~~center>

====Псевдокод====

size = 1

height = 0

'''while''' (n.parent <tex>\ne \varnothing</tex> ~~null)~~:

height = height + 1

totalSize = 1 + size + n.sibling.size()

'''if''' height <tex> ~~⌊log1/α~~> \lfloor \log_\frac{1}{\alpha} (totalSize)⌋\rfloor</tex>:

'''return''' n.parent

n = n.parent

Удаляется элемент из дерева обычным удалением вершины бинарного дерева поиска (поиск элемента, удаление, возможное переподвешивание детей).

Далее следует проверка выполнения условия:

:<tex>\mathtt {weight[T] } < \alpha \cdot \mathtt {maxweight[T]}</tex>;Если оно выполняется — дерево могло потерять <tex>\alpha</tex> - балансировку по весу, а значит нужно выполнить полную перебалансировку дерева (начиная с корня) и присвоить::<tex>\mathtt {maxweight[T]} = \mathtt {weight[T]}</tex>; ====Псевдокод==== Функция <tex>Delete(k)</tex> удаляет элемент, аналогично удалению в бинарном дереве, и возвращает глубину удаленного элемента. *<tex>k</tex> {{---}} ключ, который будет удален. '''Delete'''(k): deleted = '''DeleteKey'''(k) '''if''' deleted: '''if''' T.size < (T.α · T.maxSize): '''RebuildTree'''(T.size, T.root)

==Сравнение с другими деревьями==

[[Категория: Алгоритмы и структуры данных]]

[[Категория: Деревья поиска]]

Анонимный участник

194.85.161.2

Изменения

Взвешенное дерево

Навигация

Персональные инструменты

Пространства имён

Варианты

Просмотры

Ещё

Поиск

Навигация

Инструменты