Изменения

Поисковые структуры данных

2527 байт добавлено, 22:03, 16 января 2019

→‎Тип

'''Поисковая структура данных''' {{---}} любая структура данных реализующая эффективный поиск конкретных элементов множества, например, конкретной записи в базе данных.

~~Простейший~~Простейшей, наиболее ~~общий~~общей, но менее ~~эффективный~~ эффективной поисковой структурой является простая ~~неупорядоченный~~ неупорядоченная последовательная всех элементов. Расположив элементы в такой список, неизбежно возникнет ряд операций, которые потребуют линейного времени, в худшем случае, а также в средней случае. Используемые в реальной жизни поисковые структуры данных позволяют совершать операции более быстро, однако они ограничены запросами некоторого конкретного вида. Кроме того, поскольку стоимость построение таких структур~~, по крайней мере пропорционально~~ пропорциональна <tex>n</tex>, ~~они окупятся~~их построение окупится, даже если поступает лишь несколько запросов.

=== Тип === '''Статические поисковые структуры данных''' (англ. ''~~Static~~ Offline search structures'') предназначены для ответа на запросы на фиксированной базе данных; . '''Динамические поисковые структуры''' (англ. ''~~Dynamic~~ Online search structures'') также позволяют вставки, удаления или модификации элементов между последовательными запросами. В динамическом случае, необходимо также учитывать стоимость изменения структуры данных. Любую динамическую структуру данных можно сделать статической, если запретить вставку и удаление. Также если множество ключей известно, то можно его заранее упорядочить так, чтобы избежать худших случаев в поисках в структурах данных.

=== Время работы ===

! style="background: #ddffdd;" | Среднее

! style="background: #ffdddd;" | Худшее

|-

!

! colspan="9" align="center" | Динамические структуры данных

|-

| Неотсортированный массив

| Неотсортированный [[Список|список]]

| colspan="2" align="center" style="background: #ddffdd;" | <tex>O(1)</tex>

| colspan="2" align="center" style="background: #~~ffdddd~~ddffdd;" | <tex>O(n1)</tex>

| colspan="2" align="center" style="background: #ffdddd;" | <tex>O(n)</tex>

| colspan="2" align="center" style="background: #ffffdd;" | <tex>O(n)</tex>

| align="center" rowspan="2" | Аналогично массиву, но храним данные в [[Список|списке]]~~. Можно хранить дополнительную информацию о вершинах, что позволит ускорить время работы операции delete~~.

|-

| Отсортированный [[Список|список]]

| colspan="2" align="center" style="background: #ffdddd;" | <tex>O(n)</tex>

| colspan="2" align="center" style="background: #~~ffdddd~~ddffdd;" | <tex>O(n1)</tex>

| colspan="2" align="center" style="background: #ffdddd;" | <tex>O(n)</tex>

| colspan="2" align="center" style="background: #ffffdd;" | <tex>O(n)</tex>

| align="center" | Бинарное дерево поиска обладает следующим свойством: если <tex>x</tex> {{---}} узел бинарного дерева с ключом <tex>k</tex>, то все узлы в левом поддереве должны иметь ключи, меньшие <tex>k</tex>, а в правом поддереве большие <tex>k</tex>.

|-

| [[Рандомизированное бинарное дерево поиска]]

| align="center" style="background: #ffffdd;" | <tex>O(\log n)</tex>

| align="center" style="background: #ffdddd;" | <tex>O(n)</tex>

| align="center" style="background: #ffffdd;" | <tex>O(\log n)</tex>

| align="center" style="background: #ffdddd;" | <tex>O(n)</tex>

| align="center" style="background: #ffffdd;" | <tex>O(\log n)</tex>

| align="center" style="background: #ffdddd;" | <tex>O(n)</tex>

| colspan="2" align="center" style="background: #ffffdd;" | <tex>O(n)</tex>

| align="center" | Вариант [[Дерево поиска, наивная реализация|двоичного дерево поиска]] с добавлением инвариата "случайности", что уменьнашает ожидаемую высоту дерева.

|-

|[[АВЛ-дерево]]

| colspan="2" align="center" style="background: #ffffdd;" | <tex>O(\log n)</tex>

| colspan="2" align="center" style="background: #ffffdd;" | <tex>O(n)</tex>

| align="center" | Сбалансированное [[Дерево поиска, наивная реализация|двоичное дерево поиска]], в котором поддерживается следующее свойство: для каждой его вершины высота её двух поддеревьев различается не более чем на <tex>1</tex>.

|-

|[[2-3 дерево]]

| align="center" style="background: #ffdddd;" | <tex>O(n)</tex>

| colspan="2" align="center" style="background: #ffffdd;" | <tex>O(n)</tex>

| align="center" | Бинарное дерево, в узлах которого хранится пары <tex> (x,y) </tex>, где <tex>x</tex> {{- --}} это ключ, а <tex>y</tex> {{--- }} это приоритет. Также оно является [[Дерево поиска, наивная реализация|двоичным деревом поиска]] по <tex>x</tex> и [[Двоичная куча|пирамидой]] по <tex>y</tex>. Предполагая, что все <tex>x</tex> и все <tex>y</tex> являются различными, получаем, что если некоторый элемент дерева содержит <tex>(x_0,y_0)</tex>, то у всех элементов в левом поддереве <tex>x < x_0</tex>, у всех элементов в правом поддереве <tex> x > x_0</tex>, а также и в левом, и в правом поддереве имеем: <tex> y < y_0</tex>.

|-

|[[Splay-дерево]]

| colspan="2" align="center" style="background: #ffffdd;" | <tex>O(n)</tex>

| align="center" | [[Дерево поиска, наивная реализация|Двоичное дерево поиска]]. Оно позволяет находить быстрее те данные, которые использовались недавно, за счёт '''перемещения к корню''' (англ. ''Move to root''). Относится к разряду сливаемых деревьев. Сплей-дерево было придумано Робертом Тарьяном и Даниелем Слейтером в 1983 году.

|-

~~|[[Tango-дерево]]~~

~~| colspan="2" align="center" style="background: #ddffdd;" | <tex>O(\log \log n)</tex>~~

~~| colspan="2" align="center" style="background: #ffffdd;" | <tex>O(n)</tex>~~

| align="center" | Online [[Дерево поиска, наивная реализация|двоичное дерево поиска]], которое изобрели Эрик Д. Демейн, Дион Хармон, Джон Яконо и Михаи Патраску в 2004 году. Это лучшая известная реализация на данный момент.

|-

|[[Дерево ван Эмде Боаса]]

| align="center" style="background: #ffffdd;" | <tex>O(\log n)</tex>

| align="center" style="background: #ffdddd;" | <tex>O(n)</tex>

| ~~align="center" style~~colspan="~~background: #ffffdd;~~2" ~~| <tex>O(n)</tex>~~ | align="center" style="background: #~~ffdddd~~ffffdd;" | <tex>O(~~n \log~~ n)</tex>

| align="center" | Вероятностная структура данных, основанная на нескольких отсортированных односвязных списках.

Отсортированный связный список является простейшей структурой с временем поиска <tex>\Theta(n)</tex>. Добавление дополнительных уровней, обеспечивающих быстрый доступ через несколько элементов, помогает улучшить асимптотику до <tex>\Theta(\log(n))</tex>

| align="center" | Дерево поиска, позволяющее хранить <tex>n</tex> <tex>w</tex>-битных чисел, используя <tex>O(n)</tex> памяти, и выполнять операции поиска за время <tex>O(\log_{w} n)</tex>. Эта структура данных была впервые предложена в 1990 году М. Фредманом (M. Fredman) и Д. Уиллардом (D. Willard).

|-

| colspan="2" align="center" style="background: #ffffdd;" | <tex>O(\log w)</tex>

| colspan="2" align="center" style="background: #ffdddd;" | <tex>O(n \cdot w)</tex>

| align="center" | Улучшеная версия структуры цифрового бора.

|-

| [[Сверхбыстрый цифровой бор]]

| align="center" style="background: #ffffdd;" | <tex>O(\log w)</tex>

| align="center" style="background: #ffdddd;" | <tex>O(w)</tex>

| align="center" style="background: #ffffdd;" | <tex>O(\log w)</tex>

| align="center" style="background: #ffdddd;" | <tex>O(w)</tex>

| colspan="2" align="center" style="background: #ffffdd;" | <tex>O(\log w)</tex>

| colspan="2" align="center" style="background: #ffffdd;" | <tex>O(n)</tex>

| align="center" | Улучшеная версия структуры быстрого цифрового бора.|-!! colspan="9" align="center" | Статические структуры данных|-|[[Tango-дерево]]| colspan="2" align="center" style="background: #e5e5e5;" | -| colspan="2" align="center" style="background: #e5e5e5;" | -| colspan="2" align="center" style="background: #ddffdd;" | <tex>O(\log \log n)</tex>| colspan="2" align="center" style="background: #ffffdd;" | <tex>O(n)</tex>| align="center" | [[Дерево поиска, наивная реализация|Двоичное дерево поиска]], которое изобрели Эрик Д. Демейн, Дион Хармон, Джон Яконо и Михаи Патраску в 2004 году. Не поддерживает операции вставки и удаления, но перестраивается по ходу поисковых запросов, чтобы отвечать на них как можно оптимальней. Это лучшая известная реализация на данный момент.

|}

==См. ~~Также~~также==

*[[:Сортировка~~|Сортировка]]~~*[[:Поиск_в_строках|Поиск в строках]]*[[~~:Поиск_подстроки_в_строке|~~Поиск подстроки в строке]]*[[~~:Приоритетные_кучи|~~Приоритетные ~~кучи~~очереди]]

== Источники информации ==

* [[wikipedia:en:Search_data_structure|Wikidedia {{---}} Search data structure]]

* [http://habrahabr.ru/post/~~156361~~188010/ ~~Алгоритмы и структуры данных~~ Habrahabr {{---}} ~~шпаргалка~~Знай сложности алгоритмов ]

[[Категория: Дискретная математика и алгоритмы]]

[[Категория: Деревья поиска]]

[[Категория: Структуры данных]]

Анонимный участник

46.229.177.35

Изменения

Поисковые структуры данных

Навигация

Персональные инструменты

Пространства имён

Варианты

Просмотры

Ещё

Поиск

Навигация

Инструменты