Изменения

Перейти к: навигация, поиск

Двоичная куча

3987 байт добавлено, 19:30, 4 сентября 2022
м
rollbackEdits.php mass rollback
==Определение==
 
{{Определение
|definition=
'''Двоичная куча''' или '''пирамида''' (англ. ''Binary heap'') — такое двоичное [[Дерево, эквивалентные определения|подвешенное дерево]], для которого выполнены следующие три условия:
* Значение в любой вершине не меньше, больше (если куча для максимумаминимума), чем значения её потомков.
* На <tex>i</tex>-ом слое <tex>2^i</tex> вершин, кроме последнего. Слои нумеруются с нуля.
* Последний слой заполнен слева направо (как показано на рисунке)
}}
 [[Файл:HeapMin_heap.pngpng‎|thumb|325px|Пример кучи для максимумаминимума]][[Файл:Min_heap_array.png‎|thumb|325px|Хранение кучи в массиве, красная стрелка {{---}} левый сын, зеленая {{---}} правый]]Удобнее всего двоичную кучу хранить в виде массива <tex>Aa[0..n-1]</tex>, у которого нулевой элемент, <tex>Aa[0]</tex> — элемент в корне, а потомками элемента <tex>Aa[i]</tex> являются <tex>Aa[2i+1]</tex> и <tex>Aa[2i+2]</tex>. Высота кучи определяется как высота двоичного дерева. То есть она равна количеству рёбер в самом длинном простом пути, соединяющем корень кучи с одним из её листьев. Высота кучи есть <tex>O(\log{Nn})</tex>, где <tex>Nn</tex> — количество узлов дерева.
Чаще всего используют кучи для минимума (когда предок не больше детей) и для максимума (когда предок не меньше детей).
Двоичные кучи используют, например, для того, чтобы извлекать минимум из набора чисел за <tex>O(\log{Nn})</tex>. Двоичные кучи — частный случай Они являются частным случаем приоритетных очередей. '''Приоритетная очередь''' {{---}} это структура данных, которая позволяет хранить пары (значение и ключ) и поддерживает операции добавления пары, поиска пары с минимальным ключом и ее извлечение.
==Базовые процедуры==
===Восстановление свойств кучи===
Если в куче изменяется один из элементов, то она может перестать удовлетворять свойству упорядоченности. Для восстановления этого свойства служат процедуры sift_down <tex> \mathrm {siftDown} </tex> (просеивание вниз)и sift_up <tex> \mathrm {siftUp} </tex> (просеивание вверх).  ====siftDown====Если значение измененного элемента увеличивается, то свойства кучи восстанавливаются функцией sift_down(i).Работа процедуры: если <tex>i</tex>-й элемент меньше, чем его сыновья, всё поддерево уже является кучей, и делать ничего не надо. В противном случае меняем местами <tex>i</tex>-й элемент с наименьшим из его сыновей, после чего выполняем sift_down() для этого сына.Процедура выполняется за время <tex>O(\logmathrm {NsiftDown})</tex>.
Работа процедуры: если <tex>i</tex>-й элемент меньше, чем его сыновья, всё поддерево уже является кучей, и делать ничего не надо. В противном случае меняем местами <tex>i</tex>-й элемент с наименьшим из его сыновей, после чего выполняем <tex> \mathrm {siftDown} </tex> для этого сына.Процедура выполняется за время <tex>O(\log{n})</tex>. <codestyle="display:inline-block"> sift_down'''function''' siftDown(i: '''int'''): '''while''' 2 * i + 1 < a.heapSize <font color = "green">// heap_size heapSize {{- --}} количество элементов в куче if (2 * i + 1 <= A.heap_size) /font> left = A[2 * i + 1] <font color = "green">// left {{---}} левый сын</font> else left right = inf if (2 * i + 2 <font color = A.heap_size) right = A[2 * i + 2] "green">// right {{---}} правый сын</font> else right j = inf if (left == right == inf) return '''if (''' right <= left && a.heapSize '''and''' a[right ] < Aa[ileft]) swap(A j = right '''if''' a[2 * i + 2], A<= a[ij]) sift_down(2 * i + 2) '''break''' if (left < A[i]) swap(Aa[2 * i + 1], Aa[ij]) sift_down(2 * i + 1) = j
</code>
Если значение измененного элемента уменьшается, то свойства кучи восстанавливаются функцией sift_up(i).
Работа процедуры: если элемент больше своего отца, условие 1 соблюдено для всего дерева, и больше ничего делать не нужно. Иначе, мы меняем местами его с отцом. После чего выполняем sift_up====siftUp====для этого отца. Иными словамиЕсли значение измененного элемента уменьшается, слишком большой элемент всплывает наверх.Процедура выполняется за время то свойства кучи восстанавливаются функцией <tex>O(\logmathrm {NsiftUp})</tex>.
Работа процедуры: если элемент больше своего отца, условие 1 соблюдено для всего дерева, и больше ничего делать не нужно. Иначе, мы меняем местами его с отцом. После чего выполняем <tex> \mathrm {siftUp} <code/tex> sift_upдля этого отца. Иными словами, слишком маленький элемент всплывает наверх.Процедура выполняется за время <tex>O(i\log{n})</tex>. <code style="display:inline-block"> if '''function''' siftUp(i == 0: '''int''') return //Мы в корне: if (A '''while''' a[i] < Aa[(i - 1) / 2]) <font color = "green">// i <tex>==</tex> 0 {{---}} мы в корне</font> swap(Aa[i], Aa[(i - 1) / 2]); sift_up i = (i - 1) / 2)
</code>
===Извлечение минимального элемента===
Выполняет извлечение минимального элемента из кучи за время <tex>O(\log{Nn})</tex>.
Извлечение выполняется в четыре этапа:
# Значение корневого элемента (он и является минимальным) сохраняется для последующего возврата.
# Последний элемент копируется в корень, после чего удаляется из кучи.
# Вызывается sift_down(i) <math> \mathrm {siftDown} </math> для корня.
# Сохранённый элемент возвращается.
<code> extract_min'''int''' extractMin(): '''int''' min = Aa[0] A a[0] = Aa[Aa.heap_size heapSize - 1] A a.heap_size heapSize = Aa.heap_size heapSize - 1 sift_down siftDown(0) '''return ''' min</code>
===Добавление нового элемента===
Выполняет добавление элемента в кучу за время <tex>O(\log{Nn})</tex>.Добавление произвольного элемента в конец кучи, и восстановление свойства упорядоченности с помощью процедуры sift_up<math> \mathrm {siftUp} </math>.
<codestyle="display:inline-block"> '''function''' insert(key: '''int'''): A a.heap_size heapSize = Aa.heap_size heapSize + 1 A a[Aa.heap_size heapSize - 1] = key sift_up siftUp(Aa.heap_size heapSize - 1)
</code>
===Построение кучи за O(Nn) ===
{{Определение | definition =
'''<tex>d - D</tex> -куча''' {{---}} это куча , в которой не 2 потомкау каждого элемента, кроме, возможно, элементов на последнем уровне, ровно <tex>d</tex> потомков. }} Дан массив <tex>a[0.. n - 1].</tex> Требуется построить <tex>d</tex>-кучу с минимумом в корне. Наиболее очевидный способ построить такую кучу из неупорядоченного массива {{---}} сделать нулевой элемент массива корнем, а дальше по очереди добавить все его элементы в конец кучи и запускать от каждого добавленного элемента <math>\mathrm {siftUp}</math>. Временная оценка такого алгоритма <tex> O(n\log{n})</tex>. Однако можно построить кучу еще быстрее — за <tex> O(n) </tex>.  Представим, что в массиве хранится дерево (<tex>a[0] - </tex> корень, а потомками элемента <tex>a[i]</tex> являются <tex>a[di+1]...a[di+d]</tex>). Сделаем <tex> \mathrm {siftDown} </tex> для вершин, имеющих хотя бы одного потомка: от <texdpi=140> \dfrac{n}{d }</tex> до <tex>0</tex> ,{{---}} так как поддеревья, состоящие из одной вершины без потомков, уже упорядочены.{{Лемма|statement= На выходе получим искомую кучу. |proof= До вызова <tex> \mathrm {siftDown} </tex> для вершины, ее поддеревья являются кучами. После выполнения <tex> \mathrm {siftDown} </tex> эта вершина с ее поддеревьями будут также являться кучей. Значит, после выполнения всех <tex> \mathrm {siftDown} </tex> получится куча.
}}
Дан массив <tex> A[0.. n - 1]. </tex> Требуется построить <tex> d - </tex> кучу с минимумом в корне. Наиболее очевидный способ построить кучу из неупорядоченного массива – это по очереди добавить все его элементы (сделать sift_down). Временная оценка такого алгоритма <tex> O(N\log{N})</tex>. Однако можно построить кучу еще быстрее — за <tex> O(N) </tex>.
Представим, что в массиве хранится дерево ( <tex>A[0]</tex> — корень, а потомками элемента <tex>A[i]</tex> являются <tex>A[2i+1]...A[2i+d]</tex>). Делаем sift_down для вершин имеющих хотя бы одного потомка (так как поддеревья, состоящие из одной вершины без потомков, уже упорядочены). На выходе получим искомую кучу.
{{Лемма
|statement= Время работы этого алгоритма <tex> O(Nn) </tex>.|proof=Число вершин на высоте <tex>h</tex> в куче из <tex>n</tex> элементов не превосходит <tex dpi = "160"> \left \lceil \frac{n}{d^h} \right \rceil </tex>. Высота кучи не превосходит <tex> \log_{d} n </tex>. Обозначим за <tex> H </tex> высоту дерева, тогда время построения не превосходит <tex dpi = "160"> \sum_{h = 1}^H \limits\frac{n}{d^h} \cdot d </tex> <tex dpi = "150"> \cdot h </tex> <tex dpi = "160"> = n \cdot d \cdot {\sum_{h = 1}^H \limits}\frac{h}{d^h}. </tex>
<tex dpi = "160"> \sum_{h = 1}^H \limits\frac{n}{d^h} \cdot d </tex> <tex dpi = "150"> \cdot h </tex> <tex dpi = "160"> = n \cdot d \cdot {\sum_{h = 1}^H \limits}\frac{h}{d^h}Докажем вспомогательную лемму о сумме ряда. </tex>
{{Лемма
|statement= <tex dpi = "160"> {\sum_{h = 1}^\infty \limits}\frac{h}{d^h} = \frac{d}{(d - 1)^2} . </tex>
|proof=
Обозначим за <tex>s</tex> сумму ряда. Заметим, что
<tex dpi = "160"> \frac{n}{d^n} = \frac{1}{d} \cdot \frac{n - 1}{d ^{n - 1}} + \frac{1}{d^n}. </tex>
<tex dpi = "160">{\sum_{n = 1}^\infty \limits}\frac{1}{d^n}</tex> {{---}} это сумма бесконечной убывающей геометрической прогрессии, и она равна <tex dpi = "160">
\frac{\frac{1}{d}}{1 - \frac{1}{d}} = \frac{1}{d - 1}. </tex>
Получаем <tex>s</tex> <tex dpi = "160" >=\frac{1}{d}</tex> <tex>\cdot s +</tex> <tex dpi = "160" > \frac{1}{d - 1}. </tex> Откуда <tex>s</tex> <tex dpi = "160"> = \frac{d}{(d - 1)^2}. </tex>
}}
Подставляя в нашу формулу результат леммы, получаем <tex >n</tex> <tex dpi = "160">\cdot (\frac {d}{d - 1})^2 </tex> <tex> \leqslant 4 \cdot n </tex> <tex>=O(n).</tex>
}}
Псевдокод алгоритма:
<code style="display:inline-block">
'''function''' buldHeap():
'''for''' i = a.heapSize / 2 '''downto''' 0
siftDown(i)
</code>
===Слияние двух куч===
Даны две кучи <tex>a</tex> и <tex>b</tex>, размерами <tex>n</tex> и <tex>m</tex>, требуется объединить эти две кучи.
====Наивная реализация====
Поочередно добавим все элементы из <tex>b</tex> в <tex>a</tex>. Время работы {{---}} <tex>O(m \log(n+m))</tex>.
<code style="display:inline-block">
'''function''' merge(a, b : '''Heap'''):
'''while''' b.heapSize > 0
a.insert(b.extractMin())
</code>
Здесь появился множитель ====Реализация с помощью построения кучи====Добавим все элементы кучи <tex> d b</tex> в конец массива <tex>a</tex> из-за того, что поиск минимума в sift_down происходит после чего вызовем функцию построения кучи. Процедура выполняется за время <tex> d O(n + m)</tex>.
Посчитаем ряд <tex dpi code style= "160display:inline-block"> {\sum_{n '''function''' merge(a, b : '''Heap'''): '''for''' i = 0 '''to''' b.heapSize - 1}^\infty \limits}\frac{n}{d^n} a.heapSize = a.heapSize + 1 a[a. heapSize - 1] = b[i] a.heapify()</texcode> Обозначим за  ===Поиск k-ого элемента (очень коряво расписано с неверными индексами)===Требуется найти <tex> Sk</tex> сумму ряда. Заметим, что<tex dpi = "160"> \frac{n}{d^n} = \frac{1}{d} \cdot \frac{n - 1}{d ^{n - 1}} + \frac{1}{d^n}ый по величине элемент в куче. </tex>
# Создаем новую кучу, в которой будем хранить пару <tex dpi = "160">{\sum_langle \mathtt{n = 1value}^, \infty \limitsmathtt{index}\frac{1}{d^n} - rangle</tex> это сумма бесконечной убывающей геометрической прогрессии, ее сумма равна где <tex dpi = "160"> \fracmathtt{\frac{1value}</tex> {d}}{1 - \frac{1--}{d}} = значение элемента, а <tex>\fracmathtt{1index}</tex> {d {--- 1}} индекс элемента в основном массиве, и добавляем в нее корень кучи. # Возьмем корень новой кучи и добавим её детей из основной кучи, после чего удалим корень. Проделаем этот шаг <tex>k - 1</tex> раз.# В корне новой кучи будет находиться ответ.
Получаем <tex> S </tex> <tex dpi = "160" >= \fracВремя работы алгоритма {1}{d}</tex> <tex>\cdot S</tex> <tex dpi = "160" > + \frac{1---}{d - 1}. </tex> Откуда <tex> S</tex> <tex dpi = "160"> = O(k \frac{d}{(d - 1log k)^2}. </tex>.
Подставляя в формулу для суммы получаем <tex > N При </tex> <tex dpi = "160">n \cdot (lessapprox k \frac {d}{d - 1})^2 </tex> <tex> < 5 \cdot N log k </tex>выгоднее запускать [[поиск k-ой порядковой статистики]].([[Файл:Min_heap_kth.png‎|thumb|center|650px|Пример при <tex>d k = 25</tex> это есть двоичная куча), красные {{---}} уже удаленные из кучи элементы, зеленые находятся в куче, а голубые {{---}} еще не рассмотрены. ]]
Получаем время работы <tex> O(N)== См. </tex>также ==* [[Биномиальная куча]]* [[Фибоначчиева куча]]* [[Левосторонняя куча]]
== Источники информации ==* [http[wikipedia://ru.wikipedia.org/wiki/Min:Двоичная куча|Википедия {{---heap }} Двоичная куча — Wikipedia]]* [http[wikipedia://ru.wikipedia.org/wiki/%D0%9E%D1%87%D0%B5%D1%80%D0%B5%D0%B4%D1%8C_%D1%81_%D0%BF%D1%80%D0%B8%D0%BE%D1%80%D0%B8%D1%82%D0%B5%D1%82%D0%BE%D0%BC :Очередь с приоритетом|Википедия {{---}} Очередь с приоритетом ]]* [[wikipedia:en:Binary heap|Wikipedia {{---}} Binary heap]]* [[wikipedia:en:Priority queue|Wikipedia{{---}} Priority queue]]
[[Категория: Дискретная математика и алгоритмы]]
[[Категория: Приоритетные очереди]]
[[Категория: Структуры данных]]
1632
правки

Навигация