Изменения

Список с пропусками

8805 байт добавлено, 14:22, 22 апреля 2019

м

→‎Использование нечестной монеты

'''Список с пропусками''' (англ. ''skip list'') — вероятностная структура данных, позволяющая в среднем за <tex>O(\log(n))</tex> времени выполнять операции добавления, удаления и поиска элементов.

Список с пропусками состоит из нескольких уровней, на каждом из которых находится отсортированный связный список. На самом нижнем (первом) уровне располагаются все элементы. Дальше около половины элементов ~~таким~~ в таком же ~~образом~~ порядке располагаются на втором, почти четверть ~~<tex>-</tex>~~ — на третьем и так далее, но при этом известно, что если элемент расположен на ~~каком-то~~ уровне<tex>i</tex>, то он также расположен на всех ~~нижележащих~~ уровнях, номера которых меньше <tex>i</tex>.

==Построение==

[[Файл:SimpleList.png|thumb|600px|Односвязный отсортированный список]]

[[Файл:SkipList.png|thumb|600px|Получившийся список с пропусками]]

Допустим, что нам задан односвязный отсортированный список и мы хотим построить на его основе список с пропусками, позволяющий в среднем за <tex>O(\log{n})</tex> времени выполнять операции добавления, удаления и поиска элементов.

На самом нижнем уровне списка с пропусками мы расположим исходный список. На втором уровне — всё элементы с чётными номерами, причём каждый элемент будет ссылаться на соответствующий ему элемент на нижнем уровне. Таким же образом построим и третий уровень, куда будем добавлять только те элементы, номера которых кратны четырём. Аналогичным образом построим и последующие уровни.

~~[[Файл:SimpleList.png]]~~====Псевдокод====

Каждый уровень списка с пропусками содержит отсортированный односвязный список, у которого есть начало <tex>\mathtt{head} \ </tex> и конец <tex>\mathtt{tail}</tex>. Для выполнения операций на списке с пропусками необходимо передавать в качестве аргумента ссылку на начало односвязного списка, расположенного на самом верхнем уровне.

~~На самом нижнем уровне~~ Элементы односвязного списка ~~с пропусками мы расположим исходный список. На втором уровне~~ — вершины <tex>-\mathtt{node}</tex> ~~всё элементы с чётными номерами~~, ~~причём каждый элемент будет ссылаться~~ у которых есть <tex>3</tex> поля:* <tex>\mathtt{next}</tex> — ссылка на ~~соответствующий ему~~ следующий элемент списка на ~~нижнем~~ данном уровне~~. Таким же образом построим и третий уровень~~* <tex>\mathtt{key}</tex> — ключ, ~~куда будем добавлять только те элемента~~который хранится в данной вершине* <tex>\mathtt{down}</tex> — ссылка на соответственный элемент, ~~номера которых кратны четырём. Аналогично построим и последующие уровни.~~лежащий уровнем ниже

~~[[Файл~~ '''struct''' node:~~SkipList.png]]~~ '''node''' next, down '''K''' key

Также известно, что <tex>\mathtt{head{.}key} = -\infty \ </tex> и <tex>\mathtt{tail{.}key} = \infty</tex>,

Функция <tex>\ \mathtt{build\_lvl} \ </tex> возвращает новый уровень списка с пропусками на основе предыдущего построенного уровня.

'''list''' build_lvl ('''list''' lvl) ~~// Отсеивание нечётных элементов~~ '''list''' next_lvl next_lvl.head.down = lvl.head next_lvl.tail.down = lvl.tail '''node''' i = lvl.head~~() // Перебор всех элементов lvl~~next_lvl.head '''while''' (i != <tex>\neq</tex> ''null'') '''and''' (i ~~!= lvl~~.~~tail())~~next <tex>\neq</tex> ''null'' ~~next_lvl~~cur.~~push_back(~~next = node(i.key, i, cur.next)) // Конструктор node(key, down, next) возвращает новую вершину с ключом key , ссылками down на нижний и ~~ссылкой down~~ next на ~~соответствующую вершину предыдущего уровеня~~следующий элемент cur = cur.next i = i.next.next // Переход к следующему чётному элементу

'''return''' next_lvl

Функция <tex>\ \mathtt{skip\_list} \ </tex> принимает в качестве аргумента односвязный отсортированный список и возвращает новый список с пропусками, построенный на его основе.

'''list''' skip_list ('''list''' l): '''list''' lvl ~~= build_lvl(l)~~ // Построение первого уровня '''~~while~~node''' i = l.head '''node''' j = lvl.~~size() > 2~~ head '''while''' j <~~font color=darkgreen~~tex>~~// Добавление следующих уровней; последний содержит не более двух элементов~~\neq</~~font~~tex> l.tail i.next = node(j.key, ''null'', j.next) i = i.next j = j.next '''while''' lvl.size >2 lvl = build_lvl (lvl) '''return''' lvl // Возвращает ссылку на начало верхнего уровня

==Операции над структурой==

===Поиск элемента===

Алгоритм поиска элемента в списке с пропусками состоит из следующих операций:

# Начинаем поиск элемента в самом верхнем уровне

# Переходим к следующему элементу списка, пока значение в следующей ячейке меньше

# Переместимся на один уровень вниз и перейти к шагу <tex>2</tex>. Если мы уже на первом уровне — прекратим поиск и вернём ссылку на текущую вершину

~~Допустим~~В конце алгоритма функция вернёт элемент, ~~что в нашем списке с пропусками существуют~~ значение которого не меньше ключа <tex>k\mathtt{key}</tex> ~~уровней, при этом первым уровнем будет исходный список~~или ссылку на конец списка на первом уровне.

Если в качестве случайного источника мы будем использовать честную монету, то в среднем случае будет <tex>\log{n}</tex> уровне. На самом верхнем уровне будет не более двух элементов. Тогда на каждом уровне в среднем нужно проверить не более двух элементов (в противном случае могли бы вместо двух нижних элементов проверить ещё один уровнем выше). Если же у нас будет <tex>k</tex> уровней, тогда на каждом уровне в среднем будет в <tex>n^{1/k}</tex> раз элементов больше, чем уровнем выше. В таком случае ~~алгоритм~~ время поиска ~~в этой структуре будет представлять из себя следующие операции:~~элемента <tex>-</tex> <tex>O(k \cdot n^{1/k})</tex>.

~~# Начинаем поиск элемента в верхнем списке# Переходим к следующему элементу списка, пока значение в следующей ячейке меньше или равно ключу~~# Переместиться на один уровень вниз и перейти к шагу <tex>2</tex>. Если мы уже были на первом уровне <tex>-</tex> прекратить поиск.====Псевдокод====

~~Пример поиска числа~~ Функция <tex>8\mathtt{find}</tex> возвращает ссылку на элемент, значение которого не меньше <tex>\mathtt{key}</tex>. В случае, если все элементы в списке ~~из описания:~~с пропусками меньше <tex>\mathtt{key}</tex>, то возвращается ссылка на конец списка с пропусками. '''T''' find('''node''' res, '''K''' key) '''while''' res.key < key res = res.next '''if''' res.down = ''null'' // Если мы находимся на первом уровне '''return''' res // Мы нашли искомый элемент '''return''' find(res.down, key) // Иначе спустимся на один уровень ниже

Для того, чтобы найти элемент с ключом <tex>\mathtt{key}</tex> в списке с пропусками <tex>\mathtt{skip}</tex> необходимо запустить <tex>\mathtt{find}</tex> следующим образом

~~[[Файл:SkipListSearch~~ find(skip.~~png]]~~head, key)

===Вставка элемента===

Алгоритм вставки элементов в список с пропусками состоит из следующих шагов:

# Начинаем вставку на самом верхнем уровне

# Переходим к следующему элементу списка пока значение следующей ячейки меньше ключа.

# Если мы на первом уровне — вставляем элемент. Иначе спускаемся ниже и возвращаемся к шагу <tex>2</tex>. Если нам вернули не ''null'' — вставляем элемент на текущем уровне тоже.

# Кидаем монетку и если выпал «Орёл», то возвращаем ссылку на текущий элемент, иначе — ''null''. Если мы были не на первом уровне и нам вернули ''null'' — возвращаем его без броска монетки.

~~Если в качестве случайного источника мы будем использовать честную монету~~Отдельно стоит обработать случай, когда вставка нового элемента увеличивает число уровней. Тогда необходимо создать ещё один отсортированный список, то в ~~среднем случае~~ котором будет ~~<tex>\log{n}</tex> уровне~~всего один текущий элемент, и не забыть присвоить списку с пропусками новую ссылку на верхний уровень. ~~На самом верхнем уровне будет~~ Будем считать, что вставка каждого нового элемента увеличивает число уровней не более ~~двух элементов. Тогда~~ чем на каждом уровне в среднем нужно проверить не более двух элементов (в противном случае могли бы вместо двух нижних элементов проверить ещё один ~~уровнем выше). Уровней всего <tex>\log{n}</tex>, откуда вытекает оценка времени поиска элемента в <tex>O(\log{n})</tex>~~.

~~Функция~~ Заметим, что вставка элемента <tex>-</tex> поиск элемента и за <tex>~~\mathtt{find}~~O(1)</tex> ~~возвращает ссылку на элемент~~добавляем не более, ~~значение которого не меньше~~ чем в <tex>~~\mathtt{key}~~k</tex>уровней элемент. ~~В случае, если все элементы в списке с пропусками меньше~~ Итого время работы <tex>O(k \~~mathtt~~cdot n^{~~key~~1/k})</tex>~~, то возвращается ссылка на конец списка с пропусками~~. ~~'''T''' find ('''list''' skip_list, '''K''' key)~~ ~~'''node''' res~~ ~~'''for''' (res~~ = ~~skip_list.head; res.ref !~~= ~~''null''; res~~ = ~~res.ref) // Пока ещё не дошли до первого уровня ~~Псевдокод==== ~~'''while''' res.key~~ Функция < ~~key ~~// Пока значение вершины меньше ключа~~\mathtt{insert} \ </~~font~~tex> ~~res = res.next()~~ возвращаем ссылку на вставленный элемент в списке, в котором находится <~~font color=darkgreen~~tex>~~// Перейти к следующей вершине в текущем уровне~~\mathtt{res}</~~font~~tex> , или ''null'~~return~~'~~'' res, если на монете выпала «Решка».

'''node''' insert('''node''' res, '''K''' key) '''while''' res.next <tex>\neq</tex> ''null'' '''and''' res.next.key < key res =res.next '''node''' down_node '''if''' res.down =''null'' down_node =~~Вставка элемента~~''null'' '''else''' down_node =insert(res.down, key) '''if''' down_node <tex>\neq</tex> ''null'' '''or''' res.down =''null'' // Если выпал «Орёл» или мы находимся на первом уровне~~Для вставки элемента в список с пропусками~~ res.next = node(key, ~~нам необходимо выполнить следующие шаги:~~down_node, res.next) '''if''' coin_flip() = ''head'' // Если выпал «Орёл» '''return''' res.next '''return''' ''null'' '''return''' ''null''

~~# Найти с помощью алгоритма поиска позицию~~Для того, ~~где мог бы находиться элемент.# Вставить наш~~ чтобы вставить элемент с ключом <tex>\mathtt{key}</tex> в ~~текущий уровень списка~~ список с пропусками~~# Подбросить монету.# Если выпал «Орёл» то перейти на уровень выше и вернуться к шагу~~ <tex>2\mathtt{skip}</tex>~~# Иначе закончить операцию вставки~~необходимо вызвать следующую функцию

~~Таким образом~~ '''function''' insert_element('''list''' skip, ~~если использовать честную монету~~'''K''' key) '''node''' res = insert(skip.head, ~~то математическое ожидание количества элементов на втором уровне равняется~~ key) '''if''' res <tex>\~~dfrac{n}{2}</tex>, на третьем уровне <tex>-~~neq</tex> ~~<tex>\dfrac{n}{4}</tex> и т~~''null'' '''list''' lvl lvl.дhead. На уровне <tex>\log{n}</tex> у нас окажется один элемент. Ну и соответственно вероятности попасть элементу на второй уровень — это <tex>\dfrac{1}{2}</tex>next = node(key, res, ~~на третий <tex>\dfrac{1}{4}</tex> и т.д. Вероятность попасть на уровень <tex>\log{n}</tex> равна <tex>\dfrac{1}{n}</tex>~~lvl.tail) skip = lvl

~~Используя монетку~~ ===Удаление элемента===Алгоритм удаления элемента выглядит следующим образом:# Начинаем удалять элемент с ~~распределением отличным от <tex>\left\{\dfrac{1}{2}~~верхнего уровня# Переходим к следующему элементу, ~~\ \dfrac{1}{2}\right\}</tex>, можно влиять~~ пока значение следующего элемента меньше ключа# Если элемент существует на ~~количество элементов на верхних уровнях~~данном уровне — удаляем его с этого уровня. Так, например, при использовании монеты с распределением <tex>\{p,q\}</tex> (с вероятностью <tex>p</tex> выпадает «Орёл») математическое ожидание количества элементов Если мы не на первом уровне ~~<tex>k</tex> равно <tex>n \cdot p^k</tex>. Таким образом~~, время поиска будет равно <tex>O\left(\dfrac{k}{q} + nq^k\right)</tex>. Соответственно при честной монетке и <tex>\log(n)</tex> уровней получаем оценку, полученную ранеето удаляем элемент ещё с нижнего уровня.~~Для крайних распределений:~~====Псевдокод====* Функция <tex>\mathtt{~~0, 1\}</tex> {{---}~~delete} ~~<tex>O(k+n)~~</tex>* удаляет элемент <tex>\mathtt{~~1, 0\~~key}</tex> ~~{{---}} <tex>\infty</tex> (если разрешить добавление новых~~ со всех уровней ~~при проталкивании элемента после броска монетки; иначе <tex>O(n)</tex>)~~.

'''~~node~~function''' ~~insert~~ delete('''node''' ires, '''K''' key~~, '''T''' data~~) '''while''' ires.~~key~~ next <~~= key ~~// Ищем подходящее место~~\neq</~~font~~tex> ~~i = i.next()~~ ''null'~~node~~''' ~~tmp =~~ 'and'~~null~~'' res.next.key <~~font color~~key res =~~darkgreen>// Для записи в поле down~~res.next '''if''' ires.~~ref !=~~ down <tex>\neq</tex> ''null'' ~~// Мы не на нижнем уровне~~ ~~tmp = insert~~ delete(ires.~~ref~~down, key) ~~// Рекурсивный вызов на более низком уровне~~ '''if''' ~~tmp == ''null''~~ res.next <~~font color=darkgreen~~tex>~~// Проверка броска монетки~~\neq</~~font~~tex> ''null'~~return~~''' 'and'~~null~~'' ires.next ~~= '''new''' node (i~~.~~next, tmp, data,~~ key~~) //Непосредственно вставка~~key ~~'''if''' random(0,1) > 0~~ res.~~5 // Бросок монетки~~ ~~return i~~res.next.next ~~// Нужно передать новый элемент для вставки выше~~ ~~'''else'''~~ ~~return ''null''

~~'''void''' insert~~ Аналогично со вставкой удаление <tex>-</tex> поиск элемента за <tex>O(~~'''list''' skip_list, '''K''' key, '''T''' data~~k \cdot n^{1/k}) <~~font color=darkgreen~~/tex> плюс удаление на каждом уровне за <tex>O(1)</tex>. Итого <tex>-</ ~~Обёрточка~~tex> <tex>O(k \cdot n^{1/k})</~~font~~tex> ~~insert(skip_list~~.~~head, key, data)~~

~~===Удаление элемента===Алгоритм удаления достаточно тривиален.~~ ~~# Найти удаляемый~~ Для того, чтобы удалить элемент~~# Удалить его со всех уровней~~<tex>\mathtt{key}</tex> из списка с пропусками <tex>\mathtt{skip}</tex>, необходимо вызвать функцию <tex>\mathtt{delete} \ </tex> следующим образом:

~~Функция <tex>\mathtt{erase}</tex> удаляет вершину <tex>i</tex> из списка с пропусками~~ delete(skip.head, key)

~~'''void''' erase ('''node''' i, '''K''' key)~~ ~~'''if''' i~~ == ~~''null''~~Использование нечестной монеты== ~~'''return'''~~ ~~'''while''' i.key~~ Вместо честной монеты с распределением <tex>\left\{\dfrac{1}{2}, \ \dfrac{1}{2}\right\}<~~= key~~ /tex> можно взять в качестве случайного источника нечестную монету с распределением <~~font color=darkgreen~~tex>\{p,q\}</~~/ Ищем элемент~~tex> (с вероятностью <tex>p</~~font~~tex> ~~i = i.next(~~выпадает «Орёл») ~~erase(i~~.~~ref, key)~~ Тогда математическим ожиданием количества элементов на уровне <~~font color=darkgreen~~tex>k</tex> будет <tex>n \cdot p^k</ ~~Удаляем с нижних уровней~~tex>. Время поиска будет равно <tex>O\left( \dfrac{1}{p} \log_{1/p} {n} \right)</~~font~~tex> ~~'''if''' i.key == key~~ <~~font color=darkgreen~~tex>(</tex>на <tex>i</ ~~Если ключ совпадает~~tex>-ом уровне элементов будет почти в <tex>\dfrac{1}{p}</~~font~~tex> раз больше, чем на <tex> ~~'''delete'''~~(i+1) <~~font color=darkgreen~~/tex>-ом, значит на каждом уровне пройдём не более <tex>\dfrac{1}{p}</tex> элементов, а уровней всего <tex>\log_{1/p} {n}</ ~~удаляем и с этого уровня~~tex><tex>)</~~font~~tex>.

~~Для того~~Пусть у нас добавлено <tex>n</tex> элементов. Найдём такое распределение <tex>\left\{ p, q \right\}</tex>, при котором функция <tex>\dfrac{1}{x} \log_{1/x} {n}</tex> принимает минимальное значение. Производная этой функции равна <tex>-\dfrac{\ln{n} \left( \ln {(1/x)} - 1 \right)}{x^2 \ln^2{(1/x)}}</tex>. При <tex>x = \dfrac{1}{e}</tex> производная равна нулю, ~~чтобы удалить элемент с ключом~~ вторая производная в точке <tex>x_0 = \dfrac{1}{e}</tex> больше <tex>0</tex>, значит <tex>x_0</tex> <tex>~~key~~-</tex> ~~из списка с пропусками~~ точка минимума. Значит при распределении <tex>~~list~~\left\{ \dfrac{1}{e}, \dfrac{e - 1}{e} \right\}</tex> ~~достаточно вызвать функцию~~ время поиска меньше всего. Но не стоит забывать, что это лишь теоретическая оценка и в действительности придумать источник с распределением <tex>\~~mathtt~~left\{~~erase~~\dfrac{1}{e}, \dfrac{e - 1}{e} \right\}</tex> ~~следующим образом:~~почти невозможно, поэтому на практике лучше всего использовать честную монету.

~~erase~~Для крайних распределений:* <tex>\{0, 1\}</tex> — <tex>O(~~list~~n)</tex> — поиск, добавление и удаления элемента, поскольку мы вместо нескольких списков используем по факту один.~~head~~* <tex>\{1, ~~key~~0\}</tex> — зависит от реализации алгоритма. Если при каждой вставке у нас образуется не более одного уровня, то количество уровней будет равным <tex>n</tex>, значит время поиска будет равным <tex>O(n)</tex>.

==Применение==

Список с пропусками применяется во многих приложениях, поскольку имеет ряд преимуществ.:

* Быстрая вставка элемента, поскольку не требуется каким-либо образом изменять другие элементы (только предыдущий элемент)

* Проще реализовать, чем сбалансированные деревья или хеш-таблицы

* Следующий элемент достаётся за <tex>O(1)</tex>(при условии, что у нас есть ссылка не текущий)

* Легко модифицировать под различные задачи

===Нахождение всех отрезков, покрывающих данную точку===

{{Задача

|definition = Пусть у нас есть запросы двух видов:

# Добавить отрезок <tex>[L, R]</tex>

# Для заданной точки <tex>x</tex> вычислить количество отрезков, которые её покрывают.

Необходимо для каждого запроса второго типа вывести ответ.

}}

Для решения данной задачи воспользуемся списком с пропусками. Когда нам приходит запрос первого типа, то мы просто добавляем числа <tex>L</tex> и <tex>R</tex> в список с пропусками (если какое-то из чисел уже было добавлено, то второй раз мы его не добавляем). После этого идём с верхнего уровня, и на каждом уровне мы ищем такие <tex>l</tex> и <tex>r</tex>, что значение <tex>l</tex> меньше <tex>L</tex>, а значение следующего за <tex>l</tex> элемента уже не меньше <tex>L</tex>. Аналогично ищем такое же <tex>r</tex>, только относительно <tex>R</tex>. Если значения <tex>l.next</tex> и <tex>r</tex> лежат полностью внутри отрезка <tex>[L, R]</tex>, то к самому отрезку <tex>[l.next, r]</tex> прибавляем <tex>1</tex>, а сам отрезок <tex>[L, R]</tex> разбиваем на три <tex>[L, l.next.key - 1]</tex>, <tex>[l.next.key, r.key]</tex> и <tex>[r.key + 1, R]</tex> и по отдельности решаем задачу уже для полученных отрезков (если для какого-то отрезка левая граница стала больше правой, то мы ничего не делаем). Допустим, что на каком-то уровне у нас получилось разделить отрезок <tex>[L, R]</tex> на <tex>3</tex> части. Но тогда на следующих уровнях мы будем уменьшать отрезок почти в два раза только с одной стороны, поскольку левая или правая часть отрезка будет равна <tex>l.next.key</tex> или <tex>r.key</tex>. Итого время обработки запроса <tex>O(\log{n})</tex>.

Для запросов второго типа мы снова будем спускать с верхнего уровня до нижнего. На каждом уровне найдём тот элемент, значение которого не меньше точки <tex>x</tex>. Если такой элемент нашёлся, то прибавляем к ответу значение на отрезку между найденным элементом и следующим. Потом также спускаемся на один уровень вниз, если текущий уровень не был первым. Поскольку уровней всего <tex>\log{n}</tex>, а на каждом уровне обойдём не более двух элементов, то данный тип запросов мы обработаем за <tex>O(\log{n})</tex>.

==См. также==

*[[Поисковые структуры данных]]

*[[Skip quadtree: определение, время работы|Skip quadtree]]

*[http://en.wikipedia.org/wiki/Skip_graph Skip graph] — структура данных, основанная на списке с пропусками

==Источники информации==

*[http://en.wikipedia.org/wiki/Skip_list Wikipedia — skip list]

*[http://igoro.com/archive/skip-lists-are-fascinating/ igoro.com — Skip lists are fascinating]

*[https://link.springer.com/chapter/10.1007/BFb0028258 springer.com — The interval skip list]

*[http://ticki.github.io/blog/skip-lists-done-right/ ticki.github.io — Skip Lists: Done Right]

*[https://books.google.ru/books?id=NRrcsIJZAYMC&pg=PA157&lpg=PA157&dq=the+interval+skiplist&source=bl&ots=yqad5WH8im&sig=ACfU3U2vzUeMu_psDaWNJ4sztarLzJQsnw&hl=en&sa=X&ved=2ahUKEwi7ta6KyJbhAhWq5aYKHTmPBjgQ6AEwC3oECAkQAQ#v=onepage&q=the%20interval%20skiplist&f=false Eric N. Hanson — A Data Structure for Finding All Intervals That Overlap a Point стр. 155-164]

[[Категория: Структуры данных]]

Gaporf

390

правок

Изменения

Список с пропусками

Навигация

Персональные инструменты

Пространства имён

Варианты

Просмотры

Ещё

Поиск

Навигация

Инструменты