Двоичная куча — различия между версиями
Sergej (обсуждение | вклад) (→Построение кучи за O(N)) |
Sergej (обсуждение | вклад) (→Построение кучи за O(N)) |
||
Строка 98: | Строка 98: | ||
Число вершин на высоте <tex>h</tex> в куче из n элементов не превосходит <tex dpi = "160"> \left [ \frac{n}{2^h} \right ] </tex>. Высота кучи не превосходит <tex> \log_{2} n </tex> Обозначим за <tex> H </tex> высоту дерева, тогда время построения не превосходит <tex dpi = "160"> \sum_{h = 1}^H \limits\frac{n}{2^h} \cdot h = n \cdot {\sum_{h = 1}^H \limits}\frac{h}{2^h} </tex> | Число вершин на высоте <tex>h</tex> в куче из n элементов не превосходит <tex dpi = "160"> \left [ \frac{n}{2^h} \right ] </tex>. Высота кучи не превосходит <tex> \log_{2} n </tex> Обозначим за <tex> H </tex> высоту дерева, тогда время построения не превосходит <tex dpi = "160"> \sum_{h = 1}^H \limits\frac{n}{2^h} \cdot h = n \cdot {\sum_{h = 1}^H \limits}\frac{h}{2^h} </tex> | ||
<tex dpi = "160"> {\sum_{h = 1}^\infty \limits}\frac{h}{2^h} = 2 </tex> (известная сумма из матанализа) Обозначим сумму ряда за <tex> S </tex> | <tex dpi = "160"> {\sum_{h = 1}^\infty \limits}\frac{h}{2^h} = 2 </tex> (известная сумма из матанализа) Обозначим сумму ряда за <tex> S </tex> | ||
− | <tex dpi = "160"> \frac{n}{2^n} = frac{1}{2} /cdot frac{n - 1}{2 ^{n - 1}} + frac{1}{2^n} </tex> | + | <tex dpi = "160"> \frac{n}{2^n} = \frac{1}{2} /cdot \frac{n - 1}{2 ^{n - 1}} + \frac{1}{2^n} </tex> |
Откуда и получаем оценку <tex> O(N) </tex> | Откуда и получаем оценку <tex> O(N) </tex> | ||
}} | }} |
Версия 18:23, 2 июня 2013
Содержание
Определение
Определение: |
Двоичная куча или пирамида — такое двоичное подвешенное дерево, для которого выполнены следующие три условия:
|
Удобнее всего двоичную кучу хранить в виде массива
, у которого нулевой элемент, — элемент в корне, а потомками элемента являются и . Высота кучи определяется как высота двоичного дерева. То есть она равна количеству рёбер в самом длинном простом пути, соединяющем корень кучи с одним из её листьев. Высота кучи есть , где — количество узлов дерева.Чаще всего используют кучи для минимума (когда предок не больше детей) и для максимума (когда предок не меньше детей).
Двоичные кучи используют, например, для того, чтобы извлекать минимум из набора чисел за
. Двоичные кучи — частный случай приоритетных очередей. Приоритетная очередь — это структура данных, которая позволяет хранить пары (значение и ключ) и поддерживает операции добавления пары, поиска пары с минимальным ключом и ее извлечение.Базовые процедуры
Восстановление свойств кучи
Если в куче изменяется один из элементов, то она может перестать удовлетворять свойству упорядоченности. Для восстановления этого свойства служат процедуры sift_down (просеивание вниз) и sift_up (просеивание вверх). Если значение измененного элемента увеличивается, то свойства кучи восстанавливаются функцией sift_down(i). Работа процедуры: если
-й элемент меньше, чем его сыновья, всё поддерево уже является кучей, и делать ничего не надо. В противном случае меняем местами -й элемент с наименьшим из его сыновей, после чего выполняем sift_down() для этого сына. Процедура выполняется за время .
sift_down(i) // heap_size - количество элементов в куче if (2 * i + 1 <= A.heap_size) left = A[2 * i + 1] // левый сын else left = inf if (2 * i + 2 <= A.heap_size) right = A[2 * i + 2] // правый сын else right = inf if (left == right == inf) return if (right <= left && right < A[i]) swap(A[2 * i + 2], A[i]) sift_down(2 * i + 2) if (left < A[i]) swap(A[2 * i + 1], A[i]) sift_down(2 * i + 1)
Если значение измененного элемента уменьшается, то свойства кучи восстанавливаются функцией sift_up(i).
Работа процедуры: если элемент больше своего отца, условие 1 соблюдено для всего дерева, и больше ничего делать не нужно. Иначе, мы меняем местами его с отцом. После чего выполняем sift_up для этого отца. Иными словами, слишком большой элемент всплывает наверх. Процедура выполняется за время
.
sift_up(i) if (i == 0) return //Мы в корне if (A[i] < A[i / 2]) swap(A[i], A[i / 2]); sift_up(i / 2)
Извлечение минимального элемента
Выполняет извлечение минимального элемента из кучи за время
. Извлечение выполняется в четыре этапа:- Значение корневого элемента (он и является минимальным) сохраняется для последующего возврата.
- Последний элемент копируется в корень, после чего удаляется из кучи.
- Вызывается sift_down(i) для корня.
- Сохранённый элемент возвращается.
extract_min() min = A[0] A[0] = A[A.heap_size - 1] A.heap_size = A.heap_size - 1 sift_down(0) return min
Добавление нового элемента
Выполняет добавление элемента в кучу за время
. Добавление произвольного элемента в конец кучи, и восстановление свойства упорядоченности с помощью процедуры sift_up.
insert(key) A.heap_size = A.heap_size + 1 A[A.heap_size - 1] = key sift_up(A.heap_size - 1)
Построение кучи за O(N)
Дан массив
требуются построить кучу с минимумом в корне. Наиболее очевидный способ построить кучу из неупорядоченного массива – это по очереди добавить все его элементы (сделать sift_down). Временная оценка такого алгоритма . Однако можно построить кучу еще быстрее — за . Представим, что в массиве хранится дерево (у которого нулевой элемент, — элемент в корне, а потомками элемента являются и ). Делаем sift_down для вершин имеющих хотя бы одного потомка (так как поддеревья, состоящие из одной вершины без потомков, уже упорядочены). На выходе получим искомую кучу.Лемма: |
Время работы этого алгоритма . |
Доказательство: |
Число вершин на высоте в куче из n элементов не превосходит . Высота кучи не превосходит Обозначим за высоту дерева, тогда время построения не превосходит(известная сумма из матанализа) Обозначим сумму ряда за Откуда и получаем оценку |
Также можно обобщить на случай
кучи. В этом случае время работы будетЗдесь появился множитель
из-за того, поиск минимума происходит за . Время также