Двоичная куча — различия между версиями

Текущая версия на 19:30, 4 сентября 2022

Содержание

1 Определение
2 Базовые процедуры
3 См. также
4 Источники информации

Определение

Определение:

Двоичная куча или пирамида (англ. Binary heap) — такое двоичное подвешенное дерево, для которого выполнены следующие три условия:

Значение в любой вершине не больше (если куча для минимума), чем значения её потомков.
На [math]i[/math]-ом слое [math]2^i[/math] вершин, кроме последнего. Слои нумеруются с нуля.
Последний слой заполнен слева направо (как показано на рисунке)

Пример кучи для минимума

Хранение кучи в массиве, красная стрелка — левый сын, зеленая — правый

Удобнее всего двоичную кучу хранить в виде массива [math]a[0..n-1][/math], у которого нулевой элемент, [math]a[0][/math] — элемент в корне, а потомками элемента [math]a[i][/math] являются [math]a[2i+1][/math] и [math]a[2i+2][/math]. Высота кучи определяется как высота двоичного дерева. То есть она равна количеству рёбер в самом длинном простом пути, соединяющем корень кучи с одним из её листьев. Высота кучи есть [math]O(\log{n})[/math], где [math]n[/math] — количество узлов дерева.

Чаще всего используют кучи для минимума (когда предок не больше детей) и для максимума (когда предок не меньше детей).

Двоичные кучи используют, например, для того, чтобы извлекать минимум из набора чисел за [math]O(\log{n})[/math]. Они являются частным случаем приоритетных очередей.

Базовые процедуры

Восстановление свойств кучи

Если в куче изменяется один из элементов, то она может перестать удовлетворять свойству упорядоченности. Для восстановления этого свойства служат процедуры [math] \mathrm {siftDown} [/math] (просеивание вниз) и [math] \mathrm {siftUp} [/math] (просеивание вверх).

siftDown

Если значение измененного элемента увеличивается, то свойства кучи восстанавливаются функцией [math] \mathrm {siftDown} [/math].

Работа процедуры: если [math]i[/math]-й элемент меньше, чем его сыновья, всё поддерево уже является кучей, и делать ничего не надо. В противном случае меняем местами [math]i[/math]-й элемент с наименьшим из его сыновей, после чего выполняем [math] \mathrm {siftDown} [/math] для этого сына. Процедура выполняется за время [math]O(\log{n})[/math].


function siftDown(i : int):
    while 2 * i + 1 < a.heapSize     // heapSize — количество элементов в куче
        left = 2 * i + 1             // left — левый сын
        right = 2 * i + 2            // right — правый сын
        j = left
        if right < a.heapSize and a[right] < a[left]
            j = right
        if a[i] <= a[j]
            break
        swap(a[i], a[j])
        i = j

siftUp

Если значение измененного элемента уменьшается, то свойства кучи восстанавливаются функцией [math] \mathrm {siftUp} [/math].

Работа процедуры: если элемент больше своего отца, условие 1 соблюдено для всего дерева, и больше ничего делать не нужно. Иначе, мы меняем местами его с отцом. После чего выполняем [math] \mathrm {siftUp} [/math] для этого отца. Иными словами, слишком маленький элемент всплывает наверх. Процедура выполняется за время [math]O(\log{n})[/math].


function siftUp(i : int):
    while a[i] < a[(i - 1) / 2]     // i [math]==[/math] 0 — мы в корне
        swap(a[i], a[(i - 1) / 2])
        i = (i - 1) / 2

Извлечение минимального элемента

Выполняет извлечение минимального элемента из кучи за время [math]O(\log{n})[/math]. Извлечение выполняется в четыре этапа:

Значение корневого элемента (он и является минимальным) сохраняется для последующего возврата.
Последний элемент копируется в корень, после чего удаляется из кучи.
Вызывается [math] \mathrm {siftDown} [/math] для корня.
Сохранённый элемент возвращается.

int extractMin():
    int min = a[0]
    a[0] = a[a.heapSize - 1]
    a.heapSize = a.heapSize - 1
    siftDown(0)
    return min

Добавление нового элемента

Выполняет добавление элемента в кучу за время [math]O(\log{n})[/math]. Добавление произвольного элемента в конец кучи, и восстановление свойства упорядоченности с помощью процедуры [math] \mathrm {siftUp} [/math].


function insert(key : int):
    a.heapSize = a.heapSize + 1
    a[a.heapSize - 1] = key
    siftUp(a.heapSize - 1)

Построение кучи за O(n)

Определение:

[math]D[/math]-куча — это куча, в которой у каждого элемента, кроме, возможно, элементов на последнем уровне, ровно потомков.

Дан массив [math]a[0.. n - 1].[/math] Требуется построить [math]d[/math]-кучу с минимумом в корне. Наиболее очевидный способ построить такую кучу из неупорядоченного массива — сделать нулевой элемент массива корнем, а дальше по очереди добавить все его элементы в конец кучи и запускать от каждого добавленного элемента [math]\mathrm {siftUp}[/math]. Временная оценка такого алгоритма [math] O(n\log{n})[/math]. Однако можно построить кучу еще быстрее — за [math] O(n) [/math].

Представим, что в массиве хранится дерево ([math]a[0] - [/math] корень, а потомками элемента [math]a[i][/math] являются [math]a[di+1]...a[di+d][/math]). Сделаем [math] \mathrm {siftDown} [/math] для вершин, имеющих хотя бы одного потомка: от [math]\dfrac{n}{d}[/math] до [math]0[/math],— так как поддеревья, состоящие из одной вершины без потомков, уже упорядочены.

Лемма:

На выходе получим искомую кучу.

Доказательство:

До вызова для вершины, ее поддеревья являются кучами. После выполнения эта вершина с ее поддеревьями будут также являться кучей. Значит, после выполнения всех получится куча.

Лемма:

Время работы этого алгоритма .

Доказательство:

Число вершин на высоте [math]h[/math] в куче из [math]n[/math] элементов не превосходит . Высота кучи не превосходит [math] \log_{d}n [/math]. Обозначим за [math] H [/math] высоту дерева, тогда время построения не превосходит

[math] \cdot h [/math]

Докажем вспомогательную лемму о сумме ряда.

Лемма:

Доказательство:

Обозначим за [math]s[/math] сумму ряда. Заметим, что

— это сумма бесконечной убывающей геометрической прогрессии, и она равна

Получаем Откуда

Подставляя в нашу формулу результат леммы, получаем

Псевдокод алгоритма:


function buldHeap():
    for i = a.heapSize / 2 downto 0
        siftDown(i)

Слияние двух куч

Даны две кучи [math]a[/math] и [math]b[/math], размерами [math]n[/math] и [math]m[/math], требуется объединить эти две кучи.

Наивная реализация

Поочередно добавим все элементы из [math]b[/math] в [math]a[/math]. Время работы — [math]O(m \log(n+m))[/math].


function merge(a, b : Heap):
    while b.heapSize > 0  
        a.insert(b.extractMin())

Реализация с помощью построения кучи

Добавим все элементы кучи [math]b[/math] в конец массива [math]a[/math], после чего вызовем функцию построения кучи. Процедура выполняется за время [math]O(n + m)[/math].


function merge(a, b : Heap):
    for i = 0 to b.heapSize - 1  
        a.heapSize = a.heapSize + 1
        a[a.heapSize - 1] = b[i]
    a.heapify()

Поиск k-ого элемента (очень коряво расписано с неверными индексами)

Требуется найти [math]k[/math]-ый по величине элемент в куче.

Создаем новую кучу, в которой будем хранить пару , где [math]\mathtt{value}[/math] — значение элемента, а [math]\mathtt{index}[/math] — индекс элемента в основном массиве, и добавляем в нее корень кучи.
Возьмем корень новой кучи и добавим её детей из основной кучи, после чего удалим корень. Проделаем этот шаг [math]k - 1[/math] раз.
В корне новой кучи будет находиться ответ.

Время работы алгоритма — [math]O(k \log k)[/math].

При [math]n \lessapprox k \log k [/math] выгоднее запускать поиск k-ой порядковой статистики.

Пример при , красные — уже удаленные из кучи элементы, зеленые находятся в куче, а голубые — еще не рассмотрены.

См. также

Источники информации

@@ Строка 4: / Строка 4: @@
 '''Двоичная куча''' или '''пирамида''' (англ. ''Binary heap'') — такое двоичное [[Дерево, эквивалентные определения|подвешенное дерево]], для которого выполнены следующие три условия:
-* Значение в любой вершине не меньше, (если куча для максимума), чем значения её потомков.
+* Значение в любой вершине не больше (если куча для минимума), чем значения её потомков.
 * На <tex>i</tex>-ом слое <tex>2^i</tex> вершин, кроме последнего. Слои нумеруются с нуля.
 * Последний слой заполнен слева направо (как показано на рисунке)
@@ Строка 22: / Строка 22: @@
 Если в куче изменяется один из элементов, то она может перестать удовлетворять свойству упорядоченности. Для восстановления этого свойства служат процедуры <tex> \mathrm {siftDown} </tex> (просеивание вниз)
 и <tex> \mathrm {siftUp} </tex> (просеивание вверх).
+====siftDown====
 Если значение измененного элемента увеличивается, то свойства кучи восстанавливаются функцией <tex> \mathrm {siftDown} </tex>.
 Работа процедуры: если <tex>i</tex>-й элемент меньше, чем его сыновья, всё поддерево уже является кучей, и делать ничего не надо. В противном случае меняем местами <tex>i</tex>-й элемент с наименьшим из его сыновей, после чего выполняем <tex> \mathrm {siftDown} </tex> для этого сына.
 Процедура выполняется за время <tex>O(\log{n})</tex>.
-====siftDown====
 <code style="display:inline-block">
   '''function''' siftDown(i : '''int'''):
-      '''while''' 2 * i + 1 <tex><</tex> a.heapSize     <font color = "green">// heapSize {{---}} количество элементов в куче</font>
+      '''while''' 2 * i + 1 < a.heapSize     <font color = "green">// heapSize {{---}} количество элементов в куче</font>
           left = 2 * i + 1             <font color = "green">// left {{---}} левый сын</font>
           right = 2 * i + 2            <font color = "green">// right {{---}} правый сын</font>
           j = left
-          '''if''' right <tex><</tex> a.heapSize '''and''' a[right] <tex><</tex> A[left]
+          '''if''' right < a.heapSize '''and''' a[right] < a[left]
               j = right
-          '''if''' a[i] <tex>\leqslant</tex> a[j]
+          '''if''' a[i] <= a[j]
               '''break'''
           swap(a[i], a[j])
@@ Строка 48: / Строка 51: @@
 <code style="display:inline-block">
   '''function''' siftUp(i : '''int'''):
-      '''while''' a[i] <tex><</tex> a[(i - 1) / 2]     <font color = "green">// i <tex>==</tex> 0 {{---}} мы в корне</font>
+      '''while''' a[i] < a[(i - 1) / 2]     <font color = "green">// i <tex>==</tex> 0 {{---}} мы в корне</font>
           swap(a[i], a[(i - 1) / 2])
           i = (i - 1) / 2
@@ Строка 62: / Строка 65: @@
 # Сохранённый элемент возвращается.
-<code style="display:inline-block">
   '''int''' extractMin():
       '''int''' min = a[0]
@@ Строка 69: / Строка 71: @@
       siftDown(0)
       '''return''' min
-</code>
 ===Добавление нового элемента===
@@ Строка 90: / Строка 91: @@
 Дан массив <tex>a[0.. n - 1].</tex> Требуется построить <tex>d</tex>-кучу с минимумом в корне. Наиболее очевидный способ построить такую кучу из неупорядоченного массива {{---}} сделать нулевой элемент массива корнем, а дальше по очереди добавить все его элементы в конец кучи и запускать от каждого добавленного элемента <math>\mathrm {siftUp}</math>. Временная оценка такого алгоритма <tex> O(n\log{n})</tex>. Однако можно построить кучу еще быстрее — за <tex> O(n) </tex>.
-Представим, что в массиве хранится дерево (<tex>a[0] - </tex>  корень, а потомками элемента <tex>a[i]</tex> являются <tex>a[2i+1]...a[2i+d]</tex>). Сделаем <tex> \mathrm {siftDown} </tex> для вершин, имеющих хотя бы одного потомка: от <tex dpi=140>\dfrac{n}{d}</tex> до <tex>0</tex>,{{---}} так как поддеревья, состоящие из одной вершины без потомков, уже упорядочены.
+Представим, что в массиве хранится дерево (<tex>a[0] - </tex>  корень, а потомками элемента <tex>a[i]</tex> являются <tex>a[di+1]...a[di+d]</tex>). Сделаем <tex> \mathrm {siftDown} </tex> для вершин, имеющих хотя бы одного потомка: от <tex dpi=140>\dfrac{n}{d}</tex> до <tex>0</tex>,{{---}} так как поддеревья, состоящие из одной вершины без потомков, уже упорядочены.
 {{Лемма
 |statement= На выходе получим искомую кучу.
-|proof= При вызове <tex> \mathrm {siftDown} </tex> для вершины, ее поддеревья являются кучами. После выполнения <tex> \mathrm {siftDown} </tex> эта вершина с ее поддеревьями будут также являться кучей.  Значит, после выполнения всех <tex> \mathrm {siftDown} </tex> получится куча.
+|proof= До вызова <tex> \mathrm {siftDown} </tex> для вершины, ее поддеревья являются кучами. После выполнения <tex> \mathrm {siftDown} </tex> эта вершина с ее поддеревьями будут также являться кучей.  Значит, после выполнения всех <tex> \mathrm {siftDown} </tex> получится куча.
 }}
 {{Лемма
@@ Строка 120: / Строка 121: @@
 Псевдокод алгоритма:
 <code style="display:inline-block">
-  '''function''' heapify():
+  '''function''' buldHeap():
       '''for''' i = a.heapSize / 2 '''downto''' 0
           siftDown(i)
@@ Строка 131: / Строка 132: @@
 <code style="display:inline-block">
   '''function''' merge(a, b : '''Heap'''):
-      '''while''' b.heapSize <tex>\neq</tex> 0
+      '''while''' b.heapSize > 0
           a.insert(b.extractMin())
 </code>
 ====Реализация с помощью построения кучи====
 Добавим все элементы кучи <tex>b</tex> в конец массива <tex>a</tex>, после чего вызовем функцию построения кучи. Процедура выполняется за время <tex>O(n + m)</tex>.
@@ Строка 145: / Строка 147: @@
 </code>
-===Поиск k-ого элемента===
+===Поиск k-ого элемента (очень коряво расписано с неверными индексами)===
 Требуется найти <tex>k</tex>-ый по величине элемент в куче.
@@ Строка 153: / Строка 155: @@
 Время работы алгоритма {{---}} <tex>O(k \log k)</tex>.
+При <tex>n \lessapprox k \log k </tex> выгоднее запускать [[поиск k-ой порядковой статистики]].
 [[Файл:Min_heap_kth.png‎|thumb|center|650px|Пример при <tex>k = 5</tex>, красные {{---}} уже удаленные из кучи элементы, зеленые находятся в куче, а голубые {{---}} еще не рассмотрены.]]

Двоичная куча — различия между версиями

Текущая версия на 19:30, 4 сентября 2022

Содержание

Определение

Базовые процедуры

Восстановление свойств кучи

siftDown

siftUp

Извлечение минимального элемента

Добавление нового элемента

Построение кучи за O(n)

Слияние двух куч

Наивная реализация

Реализация с помощью построения кучи

Поиск k-ого элемента (очень коряво расписано с неверными индексами)

См. также

Источники информации

Навигация

Персональные инструменты

Пространства имён

Варианты

Просмотры

Ещё

Поиск

Навигация

Инструменты