Двоичная куча

Материал из Викиконспекты
Перейти к: навигация, поиск

Определение

Определение:
Двоичная куча, пирамида или сортирующее дерево — такое двоичное подвешенное дерево, для которого выполнены следующие три условия:
  • Значение в любой вершине не меньше, (если куча для максимум), чем значения её потомков.
  • На каждом [math]i[/math]-ом слое [math]2^i-1[/math] вершин, кроме последнего. Слои нумеруются с единицы.
  • Последний слой заполнена слева направо (как показано на рисунке)


Пример кучи для максимума

Удобная структура данных для сортирующего дерева — массив [math]A[/math], у которого первый элемент, [math]A[1][/math] — элемент в корне, а потомками элемента [math]A[i][/math] являются [math]A[2i][/math] и [math]A[2i+1][/math]. Высота кучи определяется как высота двоичного дерева. То есть она равна количеству рёбер в самом длинном простом пути, соединяющем корень кучи с одним из её листьев. Высота кучи есть [math]O(\log{N})[/math], где [math]N[/math] — количество узлов дерева.

Чаще всего используют кучи для минимума (когда предок не больше детей) и для максимума (когда предок не меньше детей).

Двоичные кучи используют, например, для того, чтобы извлекать минимум из набора чисел за [math]O(\log{N})[/math]. Двоичные кучи — частный случай приоритетных очередей. Приоритетная очередь — это структура данных, которая позволяет хранить пары (значение и ключ) и поддерживает операции добавления пары, поиска пары с минимальным ключом и ее извлечение.

Базовые процедуры

Восстановление свойств кучи

Если в куче изменяется один из элементов, то она может перестать удовлетворять свойству упорядоченности. Для восстановления этого свойства служат процедуры sift_down (просеивание вниз) и sift_up (просеивание вверх). Если значение измененного элемента увеличивается, то свойства кучи восстанавливаются функцией sift_down(i)'. Работа процедуры: если [math]i[/math]-й элемент меньше, чем его сыновья, всё поддерево уже является кучей, и делать ничего не надо. В противном случае меняем местами [math]i[/math]-й элемент с наименьшим из его сыновей, после чего выполняем sift_down() для этого сына. Процедура выполняется за время [math]O(\log{N})[/math].

sift_down(i)
 left = 2 * i // левый сын
 right = 2 * i + 1 // правый сын
 // heap_size - количество элементов в куче
 If (left <= A.heap_size) and (A[left] < A[i])  
   min = left
 else
   min = i
 If (right <= A.heap_size) and (A[right] < A[i])  
   min = right
 else
   min = i
 If (min <> i) 
   Поменять A[i] и A[minimum]
   sift_down(min)

Если значение измененного элемента уменьшается, то свойства кучи восстанавливаются функцией sift_up(i).

Работа процедуры: если элемент больше своего отца, условие 1 соблюдено для всего дерева, и больше ничего делать не нужно. Иначе, мы меняем местами его с отцом. После чего выполняем sift_up для этого отца. Иными словами, слишком большой элемент всплывает наверх. Процедура выполняется за время [math]O(\log{N})[/math].

sift_up(i)
 If (A[i] < A[i / 2])
   Поменять A[i] и A[i / 2]
   sift_up(i / 2)

Извлечение минимального элемента

Выполняет извлечение минимального элемента из кучи за время [math]O(\log{N})[/math]. Извлечение выполняется в четыре этапа:

  1. Значение корневого элемента (он и является минимальным) сохраняется для последующего возврата.
  2. Последний элемент копируется в корень, после чего удаляется из кучи.
  3. Вызывается sift_down(i) для корня.
  4. Сохранённый элемент возвращается.

extract_min()
 min = A[1]
 A[1] = A[A.heap_size]
 A.heap_size = A.heap_size - 1
 sift_down(1)
 return min

Добавление нового элемента

Выполняет добавление элемента в кучу за время [math]O(\log{N})[/math]. Добавление произвольного элемента в конец кучи, и восстановление свойства упорядоченности с помощью

insert(key)
 A.heap_size = A.heap_size + 1
 A[A.heap_size] = key
 sift_up(A.heap_size)

Источники