Изменения

← Предыдущая правка

Поисковые структуры данных

10 591 байт добавлено, 19:11, 4 сентября 2022

м

rollbackEdits.php mass rollback

'''~~Приоритетная очередь''' (англ. '~~Поисковая структура данных'~~priority queue~~'') {{---}} ~~это абстрактная~~ любая структура данных ~~на подобии стека или очереди~~реализующая эффективный поиск конкретных элементов множества, например, ~~где у каждого элемента есть приоритет~~конкретной записи в базе данных. ~~Элемент с более высоким приоритетом находится перед элементом с более низким приоритетом~~ Простейшей, наиболее общей, но менее эффективной поисковой структурой является простая неупорядоченная последовательная всех элементов. ~~Если у элементов одинаковые приоритеты~~Расположив элементы в такой список, неизбежно возникнет ряд операций, которые потребуют линейного времени, в худшем случае, ~~они распологаются~~ а также в ~~зависимости от своей позиции~~ средней случае. Используемые в ~~очереди~~реальной жизни поисковые структуры данных позволяют совершать операции более быстро, однако они ограничены запросами некоторого конкретного вида. Кроме того, поскольку стоимость построение таких структур пропорциональна <tex>n</tex>, их построение окупится, даже если поступает лишь несколько запросов. === Тип === '''Статические поисковые структуры данных''' (англ. ~~Обычно приоритетные очереди реализуются с помощью куч~~ ''Offline search structures'') предназначены для ответа на запросы на фиксированной базе данных. '''Динамические поисковые структуры''' (англ. ''~~heap~~Online search structures'')также позволяют вставки, удаления или модификации элементов между последовательными запросами. В динамическом случае, необходимо также учитывать стоимость изменения структуры данных. Любую динамическую структуру данных можно сделать статической, если запретить вставку и удаление.Также если множество ключей известно, то можно его заранее упорядочить так, чтобы избежать худших случаев в поисках в структурах данных. ==~~Операции~~= Время работы ===* find-min (find-max) - поиск элемента с наибольшим приоритетом* insert (push) Эту классификацию обычно считают самой важной. Оценивают худшее время алгоритма, среднее и лучшее для каждой операции. Лучшее время {{- ~~вставка нового элемента~~* extract-~~min (extract~~-~~max)~~ }} минимальное время работы алгоритма на каком- ~~извлечь элемент с наибольшим приоритетом~~* deleteлибо наборе. Худшее время {{-~~min (delete~~-~~max)~~ - ~~удалить элемент с наибольшим приоритетом~~}} наибольшее время.* merge - объединение двух приоритетных очередей==~~Реализации~~=Используемая память === Параметр структуры данных, показывающий, сколько памяти ей требуется. Обычно затраты составляют <tex>O(n)</tex>. ===~~Наивная~~Сравнение структур данных ===~~В качестве наивной~~ Сравним эффективность поисковых структур данных для реализации ~~мы можем взять обычный список~~ интерфейса [[Упорядоченное множество|упорядоченного множества]]. Время работы методов <tex>Predecessor</tex> и при добавлении нового элемента класть его в конец, а при запросе элемента с максимальным приоритетом проходить по всему списку. Тогда операция insert будет выполняться за <tex>~~O(1)~~Successor</tex>~~, а extract-max (extract-min) за~~ совпадает с временем работы <tex>~~O(n)~~Search</tex>.~~===Обычная===Для лучшей производительности приоритетные очереди реализуют~~ <tex>n</tex> {{---}} количество хранимых чисел, каждое из которых представляется с помощью ~~куч, что позволяет выполнять операции вставки и удаления за~~ <tex>~~O(\log n)~~w</tex>. Использование специальных куч, таких как Фибоначчиева куча и спаренная куча, позволяет еще больше улучшить асимптотику некоторый операцийбитов.~~==Виды приорететных очередей==~~

{| class="wikitable"

|-

! rowspan="2" | Описание

|-

|-

|-

| ~~[[Биномиальная куча]]~~Неотсортированный массив| align="center" style="background: #ddffdd;" | <tex>O(1)</tex>| align="center" style="background: #ffdddd;" | <tex>O(~~\log~~ n)</tex>| align="center" style="background: #ddffdd;" | <tex>O(1)</tex>| align="center" style="background: #ffdddd;" | <tex>O(n)</tex>| colspan="2" align="center" style="background: #ffdddd;" | <tex>O(n)</tex>| colspan="2" align="center" style="background: #ffffdd;" | <tex>O(n)</tex>| align="center" | Наивная реализация, использующая [[~~Биномиальная куча~~Динамический массив|динамический массив]] ~~(англ~~. ~~''binomial heap'') {{---}} структура данных~~Добавление происходит в конец массива, реализующая приоритетную очередь, которая представляет собой набор биномиальных деревьев с двумя свойствами:* ключ каждой вершины не меньше ключа ее родителя * все биномиальные деревья имеют разный размера для поиска элемента просто проходим по всему массиву.

|-

| ~~[[Куча Бродала-Окасаки]]~~Отсортированный массив| colspan="2" align="center" style="background: #ffdddd;" | <tex>O(n)</tex>| colspan="2" align="center" style="background: #ffdddd;" | <tex>O(1n)</tex>| colspan="2" align="center" style="background: #ffffdd;" | <tex>O(\log n)</tex>| colspan="2" align="center" style="background: #ffffdd;" | <tex>O(1n)</tex>| align="center" | То же самое, но теперь массив отсортирован. Поиск ускоряется за счёт возможности применить [[~~Куча Бродала-Окасаки~~Целочисленный двоичный поиск|двоичный поиск]] ~~(англ~~. ''Brodal's and Okasaki's Priority Queue'') {{---}} основана на использовании биномиальной кучи без каскадных ссылок, добавлении минимального элемента и на идеи DataВставка замедляется из-~~structural bootstrapping~~за необходимости поддерживать инвариант отсортированности.

|-

| Неотсортированный [[~~Двоичная куча~~Список|список]]| colspan="2" align="center" style="background: #ddffdd;" | <tex>O(1)</tex>| colspan="2" align="center" style="background: #ddffdd;" | <tex>O(~~\log n~~1)</tex>| colspan="2" align="center" style="background: #ffdddd;" | <tex>O(~~\log~~ n)</tex>| colspan="2" align="center" style="background: #ffffdd;" | <tex>O~~(m \log~~(n~~+m)~~)</tex>| align="center" rowspan="2" | Аналогично массиву, но храним данные в [[~~Двоичная куча~~Список|списке]] ~~(англ. ''binary heap'') {{---}} такое двоичное дерево, для которого выполнены три условия:~~*Значение в любой вершине не меньше, чем значения её потомков.*Глубина листьев (расстояние до корня) отличается не более чем на 1 слой.*Последний слой заполняется слева направо.

|-

| Отсортированный [[~~Двуродительская куча~~Список|список]]| colspan="2" align="center" style="background: #ffdddd;" | <tex>O(~~\sqrt{~~n})</tex>| colspan="2" align="center" style="background: #ddffdd;" | <tex>O(~~\sqrt{n}~~1)</tex>| colspan="2" align="center" style="background: #ffdddd;" |<tex>O(n)</tex>| ~~[[Двуродительская куча]]~~ colspan="2" align="center" style="background: #ffffdd;" | <tex>O(~~англ. ''bi-parental heap'' или ''beap''~~n) {{---}} такая куча, где у каждого элемента обычно есть два ребенка (если это не последний уровень) и два родителя (если это не первый уровень). Структура позволяет производить сублиненый поиск.</tex>

|-

| [[~~d-арная куча~~Дерево поиска, наивная реализация]]| align="center" style="background: #ffffdd;" | <tex>dO(\log n)</tex>~~-арная куча]]~~| align="center" style="background: #ffdddd;" | <tex>O(~~\log~~ n )</ tex>| align="center" style="background: #ffffdd;" | <tex>O(\log dn)</tex>| align="center" style="background: #ffdddd;" | <tex>O(~~d\log~~ n ~~/ \log d~~)</tex>| align="center" style="background: #ffffdd;" | <tex>O(m \log(n+m) </ ~~\log d~~tex>| align="center" style="background: #ffdddd;" | <tex>O(n)</tex>| ~~[[d-арная куча~~colspan="2" align="center" style="background: #ffffdd;" | <tex>dO(n)</tex>~~-арная куча]] (англ. ''~~| align="center" | Бинарное дерево поиска обладает следующим свойством: если <tex>dx</tex>~~-ary heap'')~~ {{---}} ~~[[двоичная куча]]~~узел бинарного дерева с ключом <tex>k</tex>, то все узлы в ~~которой у каждого элемента~~ левом поддереве должны иметь ключи, меньшие <tex>dk</tex> ~~детей вместо~~ , а в правом поддереве большие <tex>2k</tex>.

|-

| [[~~Левосторонняя куча~~Рандомизированное бинарное дерево поиска]]| align="center" style="background: #ffffdd;" | <tex>O(\log n)</tex>| align="center" style="background: #ffdddd;" | <tex>O(n)</tex>| align="center" style="background: #ffffdd;" | <tex>O(\log n)</tex>| align="center" style="background: #ffdddd;" | <tex>O(n)</tex>| align="center" style="background: #ffffdd;" | <tex>O(\log n)</tex>| ~~[[Левосторонняя куча]]~~ align="center" style="background: #ffdddd;" | <tex>O(~~англ. ''leftist heap''~~n) ~~{{---}} двоичное левосторонее дерево~~ </tex>| colspan="2" align="center" style="background: #ffffdd;" | <tex>O(~~не обязательно сбалансированное~~n)</tex>| align="center" | Вариант [[Дерево поиска, но наивная реализация|двоичного дерево поиска]] с ~~соблюдением порядка кучи~~добавлением инвариата "случайности", что уменьнашает ожидаемую высоту дерева.

|-

| [[~~Спаренная куча~~АВЛ-дерево]]| colspan="2" align="center" style="background: #ffffdd;" | <tex>O(1\log n)</tex>| colspan="2" align="center" style="background: #ffffdd;" | <tex>O(\log n)</tex>| colspan="2" align="center" style="background: #ffffdd;" | <tex>O(1\log n)</tex>| ~~[[Спаренная куча]]~~ colspan="2" align="center" style="background: #ffffdd;" | <tex>O(~~англ. ''pairing heap''~~n) {{---}} куча с относительно простой реализацией и хорошей производительностью, может быть рассмотрена как упрощенная </tex>| align="center" | Сбалансированное [[~~Фибоначчиева куча~~Дерево поиска, наивная реализация|двоичное дерево поиска]], в котором поддерживается следующее свойство: для каждой его вершины высота её двух поддеревьев различается не более чем на <tex>1</tex>.

|-

| [[~~Толстая куча~~2-3 дерево]]| colspan="2" align="center" style="background: #ffffdd;" | <tex>O(1\log n)</tex>| colspan="2" align="center" style="background: #ffffdd;" | <tex>O(\log n)</tex>| colspan="2" align="center" style="background: #ffffdd;" | <tex>O(\log n)</tex>| colspan="2" align="center" style="background: #ffffdd;" | <tex>O(n)</tex>| align="center" | Структура данных, представляющая собой сбалансированное дерево поиска, такое что из каждого узла может выходить две или три ветви и глубина всех листьев одинакова. Является частным случаем [[~~Толстая куча~~B-дерево#B.2B-.D0.B4.D0.B5.D1.80.D0.B5.D0.B2.D0.BE|B+ дерева]] ~~{{---}} это почти кучеобразный нагруженный лес~~.

|-

| [[~~Тонкая куча~~B-дерево]]| colspan="2" align="center" style="background: #ffffdd;" | <tex>O(\log n)</tex>| colspan="2" align="center" style="background: #ffffdd;" | <tex>O(1\log n)</tex>| colspan="2" align="center" style="background: #ffffdd;" | <tex>O(\log n)</tex>| colspan="2" align="center" style="background: #ffffdd;" | <tex>O(1n)</tex>| ~~[[Тонкая куча]]~~ align="center" | Cильноветвящееся сбалансированное дерево поиска, позволяющее проводить поиск, добавление и удаление элементов за <tex>O(~~англ~~\log n)</tex>. ~~''thin heap''~~B-дерево с <tex>n</tex> узлами имеет высоту <tex>O(\log n) {{</tex>. Количество детей узлов может быть от нескольких до тысяч (обычно степень ветвления B-~~--}} это структура данных~~дерева определяется характеристиками устройства (дисков), ~~реализующая приоритетную очередь~~ на котором производится работа с ~~теми же асимптотическими оценками, что и [[фибоначчиева куча]], но имеющая большую практическую ценность из~~деревом). В-деревья также могут использоваться для реализации многих операций над динамическими множествами за ~~меньших констант.~~время <tex>O(\log n)</tex>

|-

| [[~~Фибоначчиева куча~~Красно-черное дерево]]| colspan="2" align="center" style="background: #ffffdd;" | <tex>O(1\log n)</tex>| colspan="2" align="center" style="background: #ffffdd;" | <tex>O(\log n)</tex>| colspan="2" align="center" style="background: #ffffdd;" | <tex>O(1\log n)</tex>| ~~Куча~~colspan="2" align="center" style="background: #ffffdd;" | <tex>O(n)</tex>| align="center" | Сбалансированное [[Дерево поиска, наивная реализация|двоичное дерево поиска]], ~~построенная~~ в котором баланс осуществляется на основе ~~Фибоначчиева~~ "цвета" узла дерева, который принимает только два значения: "красный" (англ. ~~[[Фибоначчиево дерево]]~~ ''red'') и "чёрный" (англ. ''~~Fibonacci tree~~black'') ~~{{---}} биномиальное дерево~~. При этом все листья дерева являются фиктивными и не содержат данных, ~~где у каждой вершины удалено не более одного ребенка~~но относятся к дереву и являются чёрными.

|-

| [[Декартово дерево]]

| align="center" style="background: #ffffdd;" | <tex>O(\log n)</tex>

| align="center" style="background: #ffdddd;" | <tex>O(n)</tex>

| align="center" style="background: #ffffdd;" | <tex>O(\log n)</tex>

| align="center" style="background: #ffdddd;" | <tex>O(n)</tex>

| align="center" style="background: #ffffdd;" | <tex>O(\log n)</tex>

| align="center" style="background: #ffdddd;" | <tex>O(n)</tex>

| colspan="2" align="center" style="background: #ffffdd;" | <tex>O(n)</tex>

| align="center" | Бинарное дерево, в узлах которого хранится пары <tex> (x,y) </tex>, где <tex>x</tex> {{---}} это ключ, а <tex>y</tex> {{---}} это приоритет. Также оно является [[Дерево поиска, наивная реализация|двоичным деревом поиска]] по <tex>x</tex> и [[Двоичная куча|пирамидой]] по <tex>y</tex>. Предполагая, что все <tex>x</tex> и все <tex>y</tex> являются различными, получаем, что если некоторый элемент дерева содержит <tex>(x_0,y_0)</tex>, то у всех элементов в левом поддереве <tex>x < x_0</tex>, у всех элементов в правом поддереве <tex> x > x_0</tex>, а также и в левом, и в правом поддереве имеем: <tex> y < y_0</tex>.

|-

|[[Splay-дерево]]

| align="center" style="background: #ffffdd;" | <tex>O(\log n)</tex>

| align="center" style="background: #ffdddd;" | <tex>O(n)</tex>

| align="center" style="background: #ffffdd;" | <tex>O(\log n)</tex>

| align="center" style="background: #ffdddd;" | <tex>O(n)</tex>

| align="center" style="background: #ffffdd;" | <tex>O(\log n)</tex>

| align="center" style="background: #ffdddd;" | <tex>O(n)</tex>

| colspan="2" align="center" style="background: #ffffdd;" | <tex>O(n)</tex>

| align="center" | [[Дерево поиска, наивная реализация|Двоичное дерево поиска]]. Оно позволяет находить быстрее те данные, которые использовались недавно, за счёт '''перемещения к корню''' (англ. ''Move to root''). Относится к разряду сливаемых деревьев. Сплей-дерево было придумано Робертом Тарьяном и Даниелем Слейтером в 1983 году.

|-

|[[Дерево ван Эмде Боаса]]

| colspan="2" align="center" style="background: #ffffdd;" | <tex>O(\log w)</tex>

| colspan="2" align="center" style="background: #ffdddd;" | <tex>O(2^w)</tex>

| align="center" | Cтруктура данных, представляющая собой [[Дерево поиска, наивная реализация|дерево поиска]], позволяющее хранить целые неотрицательные числа в интервале <tex>[0;2^w)</tex> и осуществлять над ними все соответствующие дереву поиска операции. Проще говоря, данная структура позволяет хранить <tex>w</tex>-битные числа.

Особенностью этой структуры является то, что все операции выполняются за <tex>O(\log w)</tex>, что асимптотически лучше, чем <tex>O(\log n)</tex> в большинстве других деревьев поиска, где <tex>n</tex> {{---}} количество элементов в дереве.

|-

| [[Список с пропусками]]

| align="center" style="background: #ffffdd;" | <tex>O(\log n)</tex>

| align="center" style="background: #ffdddd;" | <tex>O(n)</tex>

| align="center" style="background: #ffffdd;" | <tex>O(\log n)</tex>

| align="center" style="background: #ffdddd;" | <tex>O(n)</tex>

| align="center" style="background: #ffffdd;" | <tex>O(\log n)</tex>

| align="center" style="background: #ffdddd;" | <tex>O(n)</tex>

| colspan="2" align="center" style="background: #ffffdd;" | <tex>O(n)</tex>

| align="center" | Вероятностная структура данных, основанная на нескольких отсортированных односвязных списках.

Отсортированный связный список является простейшей структурой с временем поиска <tex>\Theta(n)</tex>. Добавление дополнительных уровней, обеспечивающих быстрый доступ через несколько элементов, помогает улучшить асимптотику до <tex>\Theta(\log(n))</tex>

|-

|[[Fusion tree]]

| colspan="2" align="center" style="background: #ffffdd;" | <tex>O(\log_{w} n)</tex>

| colspan="2" align="center" style="background: #ffffdd;" | <tex>O(n)</tex>

| align="center" | Дерево поиска, позволяющее хранить <tex>n</tex> <tex>w</tex>-битных чисел, используя <tex>O(n)</tex> памяти, и выполнять операции поиска за время <tex>O(\log_{w} n)</tex>. Эта структура данных была впервые предложена в 1990 году М. Фредманом (M. Fredman) и Д. Уиллардом (D. Willard).

|-

| [[Сверхбыстрый цифровой бор|Цифровой бор]]

| colspan="2" align="center" style="background: #ffdddd;" | <tex>O(w)</tex>

| colspan="2" align="center" style="background: #ffdddd;" | <tex>O(n \cdot w)</tex>

| align="center" | [[Бор]], в котором в качестве строк используются двоичные записи чисел, включая ведущие нули. Таким образом он имеет глубину <tex>w</tex>.

|-

| [[Сверхбыстрый цифровой бор|Быстрый цифровой бор]]

| colspan="2" align="center" style="background: #ffdddd;" | <tex>O(w)</tex>

| colspan="2" align="center" style="background: #ffffdd;" | <tex>O(\log w)</tex>

| colspan="2" align="center" style="background: #ffdddd;" | <tex>O(n \cdot w)</tex>

| align="center" | Улучшеная версия структуры цифрового бора.

|-

| [[Сверхбыстрый цифровой бор]]

| align="center" style="background: #ffffdd;" | <tex>O(\log w)</tex>

| align="center" style="background: #ffdddd;" | <tex>O(w)</tex>

| align="center" style="background: #ffffdd;" | <tex>O(\log w)</tex>

| align="center" style="background: #ffdddd;" | <tex>O(w)</tex>

| colspan="2" align="center" style="background: #ffffdd;" | <tex>O(\log w)</tex>

| colspan="2" align="center" style="background: #ffffdd;" | <tex>O(n)</tex>

| align="center" | Улучшеная версия структуры быстрого цифрового бора.

|-

!

! colspan="9" align="center" | Статические структуры данных

|-

|[[Tango-дерево]]

| colspan="2" align="center" style="background: #e5e5e5;" | -

| colspan="2" align="center" style="background: #ddffdd;" | <tex>O(\log \log n)</tex>

| colspan="2" align="center" style="background: #ffffdd;" | <tex>O(n)</tex>

| align="center" | [[Дерево поиска, наивная реализация|Двоичное дерево поиска]], которое изобрели Эрик Д. Демейн, Дион Хармон, Джон Яконо и Михаи Патраску в 2004 году. Не поддерживает операции вставки и удаления, но перестраивается по ходу поисковых запросов, чтобы отвечать на них как можно оптимальней. Это лучшая известная реализация на данный момент.

|}

==~~Применение==~~* Алгоритм Дейкстры* Алгоритм Прима* Дискретно-событийное моделирование (англСм. ~~''discrete-event simulation, DES'')~~* Код Хаффмана* Поиск по первому наилучшему совпадению* Управление полосой пропускания~~==Реализации в языках программирования~~также==* Стандартная библиотека шаблонов (англ. ''STL'') в C++ предоставляет методы управления кучей make_heap, push_heap и pop_heap (обычно реализуются бинарные кучи), которые оперируют с итераторами произвольного случайного доступа. Методы используют итераторы как ссылки на массивы и выполняют преобразование массив-куча.* Библиотека Boost для C++ включает в себя библиотеку для работу с кучами. В отличии от STL, поддерживает операции decrease-key и increase-key, а также имеет поддержку дополнительных видов куч, таких как [[~~Фибоначчиева куча~~Сортировка]], *[[~~Биномиальная куча~~Поиск подстроки в строке]] и *[[~~Спаренная куча~~Приоритетные очереди]].* В Java 2 (начиная с версии 1.5) предоставляется реализация бинарной кучи в классе java.util.PriorityQueue<E>, который не поддерживает операции decrease-key и increase-key.* Python имеет модуль heapq, который реализует очереди с приоритетами с помощью бинарной кучи.* PHP имеет поддержку кучи на максимум (SplMaxHeap) и кучи на минимум (SplMinHeap), как часть Standard PHP Library начиная с версии 5.3.* В Perl имеются реализации бинарной, биномиальной и фибоначчиевой куч во всеобъемлющей сети архивов.* Go имеет пакет heap, в котором реализованы алгоритмы для работы с кучами.

== Источники информации ==

* [http://en.wikipedia.org/wiki/Heap_(data_structure)| Wikidedia {{---}} Heap (data structure)]* [~~http://en.wikipedia.org/wiki/2%E2%80%933_heap| Wikidedia {{---}} 2-3 heap]~~* [~~http://en.~~wikipedia~~.org/wiki/Beap| Wikidedia {{---}} Beap]~~* [http://en~~.wikipedia.org/wiki/Binary_heap| Wikidedia {{---}} Binary heap]~~* [http:~~//en.wikipedia.org/wiki/Binomial_heap~~Search_data_structure| Wikidedia {{---}} ~~Binomial heap~~Search data structure]* [http://en.wikipedia.org/wiki/Brodal_queue| Wikidedia {{---}} Brodal queue]* [http://enhabrahabr.~~wikipedia.org/wiki/D-ary_heap| Wikidedia {{---}} <tex>d<~~ru/~~tex>-ary heap]~~* [http:post/188010/~~en.wikipedia.org/wiki/Fibonacci_heap| Wikidedia~~ Habrahabr {{---}} ~~Fibonacci heap~~Знай сложности алгоритмов ]

[[Категория: Дискретная математика и алгоритмы]]

[[Категория: ~~Приоритетные очереди~~Деревья поиска]]

[[Категория: Структуры данных]]

Maintenance script

1632

правки

Изменения

Поисковые структуры данных

Навигация

Персональные инструменты

Пространства имён

Варианты

Просмотры

Ещё

Поиск

Навигация

Инструменты