Изменения

Список с пропусками

9436 байт добавлено, 14:22, 22 апреля 2019

м

→‎Использование нечестной монеты

'''Список с пропусками''' (англ. ''skip list'') — вероятностная структура данных, позволяющая в среднем за <tex>O(\log(n))</tex> времени выполнять операции добавления, удаления и поиска элементов.

Список с пропусками состоит из нескольких уровней, на каждом из которых находится отсортированный связный список. На самом нижнем (первом) уровне располагаются все элементы. Дальше около половины элементов ~~таким~~ в таком же ~~образом~~ порядке располагаются на втором, почти четверть ~~<tex>-</tex>~~ — на третьем и так далее, но при этом известно, что если элемент расположен на ~~каком-то~~ уровне<tex>i</tex>, то он также расположен на всех ~~нижележащих~~ уровнях, номера которых меньше <tex>i</tex>.

==Построение==

[[Файл:SimpleList.png|thumb|600px|Односвязный отсортированный список]]

[[Файл:SkipList.png|thumb|600px|Получившийся список с пропусками]]Допустим, что нам задан односвязный отсортированный списоки мы хотим построить на его основе список с пропусками, позволяющий в среднем за <tex>O(\log{n})</tex> времени выполнять операции добавления, удаления и поиска элементов.

На самом нижнем уровне списка с пропусками мы расположим исходный список. На втором уровне — всё элементы с чётными номерами, причём каждый элемент будет ссылаться на соответствующий ему элемент на нижнем уровне. Таким же образом построим и третий уровень, куда будем добавлять только те элементы, номера которых кратны четырём. Аналогичным образом построим и последующие уровни.

~~[[Файл:SimpleList.png]]~~====Псевдокод====

Каждый уровень списка с пропусками содержит отсортированный односвязный список, у которого есть начало <tex>\mathtt{head} \ </tex> и конец <tex>\mathtt{tail}</tex>. Для выполнения операций на списке с пропусками необходимо передавать в качестве аргумента ссылку на начало односвязного списка, расположенного на самом верхнем уровне.

~~Тогда на первом уровне мы расположим заданный список~~Элементы односвязного списка — вершины <tex>\mathtt{node}</tex>, ~~на втором~~ у которых есть <tex>-3</tex> ~~только элементы с чётными номерами с ссылками на соответствующие элементы первого уровня, на третьем~~ поля:* <tex>-\mathtt{next}</tex> ~~с номерами, кратными~~ — ссылка на следующий элемент списка на данном уровне* <tex>4\mathtt{key}</tex>— ключ, ~~и так далее. Такой список будет позволять~~ который хранится в ~~среднем за~~ данной вершине* <tex>O(\~~log~~mathtt{ndown})</tex> ~~выполнять операции поиска~~— ссылка на соответственный элемент, ~~добавления и удаления элементов.~~лежащий уровнем ниже

'''struct''' node:

'''node''' next, down

'''K''' key

~~[[Файл:SkipList~~Также известно, что <tex>\mathtt{head{.~~png]]~~}key} = -\infty \ </tex> и <tex>\mathtt{tail{.}key} = \infty</tex>,

Функция <tex>\ \mathtt{build\_lvl} \ </tex> возвращает новый уровень списка с пропусками на основе предыдущего построенного уровня.

~~Функция~~ '''list''' build_lvl('''list''' lvl) '''list''' next_lvl next_lvl.head.down = lvl.head next_lvl.tail.down = lvl.tail '''node''' i = lvl.head.next.next '''node''' cur = next_lvl.head '''while''' i <tex>\ neq</tex> ''null'' '''and''' i.next <tex>\~~mathtt{buildLvl} \~~ neq</tex> ''null'' cur.next = node(key, i, cur.next) // Конструктор node(key, down, next) возвращает ~~новый уровень списка~~ новую вершину с ~~пропусками~~ ключом key, ссылками down на ~~основе предыдущего построенного уровня~~нижний и next на следующий элемент cur = cur.next i = i.next.next // Переход к следующему чётному элементу '''return''' next_lvl

~~'''list''' buildLvl ('''list''' lvl)~~ Функция <~~font color=darkgreen~~tex>~~// Отсеивание нечётных элементов~~\ \mathtt{skip\_list} \ </~~font~~tex> ~~'''list''' nextLvl~~ ~~'''node''' i = lvl.head() // Перебор всех элементов lvl~~ ~~'''while''' (i != ''null'') '''and''' (i != lvl.tail())~~ ~~nextLvl.push_back(node(i.key, i)) // Конструктор node(key, down)~~ принимает в качестве аргумента односвязный отсортированный список и возвращает ~~новую вершину~~ новый список с ~~ключом key и ссылкой down~~ пропусками, построенный на ~~соответствующую вершину предыдущего уровеня~~ ~~i = i.next~~его основе.~~next // Переход к следующему чётному элементу~~ ~~'''return''' nextLvl~~

Функция <tex>\ \mathtt{skipList} \ </tex> принимает в качестве аргумента односвязный отсортированный список и возвращает новый список с пропусками, построенный на его основе. '''list''' ~~skipList~~ skip_list('''list''' l): '''list''' lvl ~~= buildLvl(l)~~ // Построение первого уровня '''~~while~~node''' i = l.head '''node''' j = lvl.~~size() > 2~~ head '''while''' j <~~font color=darkgreen~~tex>~~// Добавление следующих уровней; последний содержит не более двух элементов~~\neq</~~font~~tex> l.tail i.next = node(j.key, ''null'', j.next) i = i.next j = j.next '''while''' lvl.size >2 lvl = ~~buildLvl~~ build_lvl(lvl) '''return''' lvl // Возвращает ссылку на начало верхнего уровня

==Операции над структурой==

===Поиск элемента===

~~Допустим, что~~ Алгоритм поиска элемента в ~~нашем~~ списке с пропусками ~~существуют <tex>k</tex> уровней~~состоит из следующих операций:# Начинаем поиск элемента в самом верхнем уровне# Переходим к следующему элементу списка, ~~при этом первым уровнем~~ пока значение в следующей ячейке меньше# Переместимся на один уровень вниз и перейти к шагу <tex>~~L_1~~2</tex> ~~будет исходный список~~.Если мы уже на первом уровне — прекратим поиск и вернём ссылку на текущую вершину

В ~~таком случае алгоритм поиска в этой структуре будет представлять из себя следующие операции:~~конце алгоритма функция вернёт элемент, значение которого не меньше ключа <tex>\mathtt{key}</tex> или ссылку на конец списка на первом уровне.

~~# Начинаем поиск элемента~~ Если в качестве случайного источника мы будем использовать честную монету, то в ~~верхнем списке (~~среднем случае будет <tex>~~L_k~~\log{n}</tex>~~), рассмотрим первый элемент# Переходить к следующему элементу списка, пока значение~~ уровне. На самом верхнем уровне будет не более двух элементов. Тогда на каждом уровне в среднем нужно проверить не более двух элементов (в ~~следующей ячейке меньше или равно ключу# Переместиться на~~ противном случае могли бы вместо двух нижних элементов проверить ещё один ~~уровень вниз и перейти к пункту 2~~уровнем выше). Если ~~рассматриваемый элемент находится~~ же у нас будет <tex>k</tex> уровней, тогда на ~~нижнем~~ каждом уровне в среднем будет в <tex>n^{1/k}</tex> раз элементов больше, чем уровнем выше. В таком случае время поиска элемента <tex>-</tex> ~~выйти из поиска~~<tex>O(k \cdot n^{1/k})</tex>.

~~Пример поиска числа <tex>8</tex> в списке из описания:~~====Псевдокод====

~~[[Файл:SkipListSearch~~Функция <tex>\mathtt{find}</tex> возвращает ссылку на элемент, значение которого не меньше <tex>\mathtt{key}</tex>.~~png]]~~В случае, если все элементы в списке с пропусками меньше <tex>\mathtt{key}</tex>, то возвращается ссылка на конец списка с пропусками. '''T''' find('''node''' res, '''K''' key) '''while''' res.key < key res = res.next '''if''' res.down = ''null'' // Если мы находимся на первом уровне '''return''' res // Мы нашли искомый элемент '''return''' find(res.down, key) // Иначе спустимся на один уровень ниже

~~Если в качестве случайного источника использовать честную монету~~Для того, ~~то тогда если в списке будет <tex>n</tex> элементов, то количество уровней в среднем будет равно~~ чтобы найти элемент с ключом <tex>\~~log~~mathtt{nkey}</tex>~~. Тогда на последнем уровне будет не более двух элементов, а на каждом следующем будет почти~~ в два раза больше. Тогда на каждом уровне мы проверим не более двух элементов (если бы на каком-нибудь уровне проверили три элемента, то в среднем это значило, что мы могли пройти на верхнем уровне на один элемент больше). Уровней всего списке с пропусками <tex>\~~log~~mathtt{nskip}</tex>~~, откуда вытекает оценка времени поиска элемента в~~ необходимо запустить <tex>O(\~~log~~mathtt{nfind})</tex>.следующим образом

~~'''T'''~~ find (~~'''list''' skip_list, '''K''' key)~~ ~~'''node''' res~~ ~~'''for''' (res = skip_list~~skip.head~~; res.ref != ''null''; res = res.ref) // Пока ещё не дошли до первого уровня ~~ ~~'''while''' res.key <~~ , key ~~// Переходим к следующему элементу~~ ~~res = res.next(~~) ~~'''return''' res.data~~

===Вставка элемента===

~~Для~~ Алгоритм вставки ~~элемента~~ элементов в список с пропускамисостоит из следующих шагов:# Начинаем вставку на самом верхнем уровне# Переходим к следующему элементу списка пока значение следующей ячейки меньше ключа.# Если мы на первом уровне — вставляем элемент. Иначе спускаемся ниже и возвращаемся к шагу <tex>2</tex>. Если нам вернули не ''null'' — вставляем элемент на текущем уровне тоже.# Кидаем монетку и если выпал «Орёл», то возвращаем ссылку на текущий элемент, иначе — ''null''. Если мы были не на первом уровне и нам ~~необходимо выполнить следующие шаги:~~вернули ''null'' — возвращаем его без броска монетки.

~~# Найти с помощью алгоритма поиска позицию~~Отдельно стоит обработать случай, ~~где мог бы находиться элемент~~когда вставка нового элемента увеличивает число уровней.~~# Вставить наш элемент~~ Тогда необходимо создать ещё один отсортированный список, в котором будет всего один текущий ~~уровень списка~~ элемент, и не забыть присвоить списку с пропусками~~# Подбросить монету~~новую ссылку на верхний уровень.~~# Если выпал «Орёл» то перейти~~ Будем считать, что вставка каждого нового элемента увеличивает число уровней не более чем на ~~уровень выше и вернуться к шагу <tex>2</tex># Иначе закончить операцию вставки~~один.

~~Таким образом~~Заметим, если использовать честную монету, то математическое ожидание количества элементов на втором уровне равняется <tex>\dfrac{n}{2}</tex>, на третьем уровне что вставка элемента <tex>-</tex> ~~<tex>\dfrac{n}{4}</tex> и т.д. На уровне <tex>\log{n}</tex> у нас окажется один элемент. Ну~~ поиск элемента и ~~соответственно вероятности попасть элементу на второй уровень — это~~ за <tex>~~\dfrac{~~O(1~~}{2}~~)</tex>добавляем не более, ~~на третий~~ чем в <tex>~~\dfrac{1}{4}~~k</tex> ~~и т~~уровней элемент.~~д. Вероятность попасть на уровень~~ Итого время работы <tex>O(k \~~log{~~cdot n~~}</tex> равна <tex>\dfrac~~^{1/k}~~{n}~~)</tex>.

~~Используя монетку с распределением отличным от~~ ====Псевдокод====Функция <tex>\~~left\~~mathtt{~~\dfrac{1~~insert}~~{2}, \~~ \~~dfrac{1}{2}\right\}~~</tex>~~, можно влиять~~ возвращаем ссылку на количество элементов на верхних уровнях. Так, например, при использовании монеты с распределением <tex>\{p,q\}</tex> математическое ожидание количества элементов на уровне <tex>k</tex> равно <tex dpi=150>n q^k</tex>вставленный элемент в списке, ~~на каждом следующем уровне будет в среднем~~ в котором находится <tex>~~q</tex> раз больше элементов. Таким образом, время поиска будет равно <tex>O\left(~~\~~dfrac{k}~~mathtt{qres} ~~+ nq^k\right)</tex>. Соответственно при честной монетке и <tex>\log(n)~~</tex> ~~уровней получаем оценку~~, ~~полученную ранее.Для крайних распределений:~~* <tex>\{0, 1\}</tex> {{---}} <tex>O(k+n)</tex>* <tex>\{1или ''null'', ~~0\}</tex> {{---}} <tex>\infty</tex> (~~если ~~разрешить добавление новых уровней при проталкивании элемента после броска монетки; иначе <tex>O(n)</tex>)~~на монете выпала «Решка».

'''node''' insert ('''node''' ires, '''K''' key~~, '''T''' data~~) '''while''' ires.~~key~~ next <~~= key ~~// Ищем подходящее место~~\neq</~~font~~tex> ~~i = i.next()~~ ~~'''node''' tmp =~~ ''null'' ~~// Для записи в поле down~~ '''ifand''' ires.next.~~ref != ''null''~~ key <~~font color=darkgreen>// Мы не на нижнем уровне~~key ~~tmp~~ res = ~~insert (i~~res.~~ref, key) // Рекурсивный вызов на более низком уровне~~next '''~~if''' tmp == '~~node'~~null~~'' ~~// Проверка броска монетки~~down_node '''~~return~~if''' res.down = ''null'' ~~i.next~~ down_node = ''~~'new''' node (i.next, tmp, data, key) //Непосредственно вставка~~ null''~~'if''' random(0,1) > 0.5 // Бросок монетки~~ ~~return i.next // Нужно передать новый элемент для вставки выше

'''else'''

down_node = insert(res.down, key) '''if''' down_node <tex>\neq</tex> ''null'' '''or''' res.down = ''null'' // Если выпал «Орёл» или мы находимся на первом уровне res.next = node(key, down_node, res.next) '''if''' coin_flip() = ''head'' // Если выпал «Орёл» '''return''' res.next '''return''' ''null'' '''return ''' ''null'' Для того, чтобы вставить элемент с ключом <tex>\mathtt{key}</tex> в список с пропусками <tex>\mathtt{skip}</tex> необходимо вызвать следующую функцию

'''~~void~~function''' ~~insert~~ insert_element('''list''' ~~skip_list~~skip, '''K''' key) '''node''' res = insert(skip.head, key) '''Tif''' ~~data)~~ res <~~font color=darkgreen~~tex>~~// Обёрточка~~\neq</~~font~~tex>''null'' '''list''' lvl ~~insert(skip_list~~ lvl.head.next = node(key, ~~key~~res, ~~data~~lvl.tail) skip = lvl

===Удаление элемента===

Алгоритм удаления ~~достаточно тривиален.~~ элемента выглядит следующим образом:# ~~Найти удаляемый~~ Начинаем удалять элементс верхнего уровня# Переходим к следующему элементу, пока значение следующего элемента меньше ключа# ~~Удалить~~ Если элемент существует на данном уровне — удаляем его с этого уровня. Если мы не на первом уровне, то удаляем элемент ещё с нижнего уровня.====Псевдокод====Функция <tex>\mathtt{delete}</tex> удаляет элемент <tex>\mathtt{key}</tex> со всех уровней.

'''~~void~~function''' ~~erase~~ delete('''node''' ires, '''K''' key) '''ifwhile''' ~~i ==~~ res.next <tex>\neq</tex> ''null'' '''~~return~~and''' res.next.key < key res = res.next '''~~while~~if''' ires.~~key <= key~~ down <~~font color=darkgreen~~tex>~~// Ищем элемент~~\neq</~~font~~tex>''null'' ~~i = i.next()~~ ~~erase~~delete(ires.~~ref~~down, key) ~~// Удаляем с нижних уровней~~ '''if''' ires.~~key == key~~ next <~~font color=darkgreen~~tex>~~// Если ключ совпадает~~\neq</~~font~~tex> ''null'' '''~~delete~~and'''~~(i) // удаляем и с этого уровня~~res.next.next

~~'''void''' erase~~ Аналогично со вставкой удаление <tex>-</tex> поиск элемента за <tex>O(~~'''list''' skip_list, '''K''' key~~k \cdot n^{1/k}) <~~font color=darkgreen~~/tex> плюс удаление на каждом уровне за <tex>O(1)</tex>. Итого <tex>-</ ~~Обёрточка~~tex> <tex>O(k \cdot n^{1/k})</~~font~~tex> ~~erase(skip_list~~.~~head, key)~~

~~==Псевдокод==Наглядный~~Для того, ~~но не очень эффективный по памяти вариант~~ чтобы удалить элемент <tex>\mathtt{key}</tex> из списка с пропусками.<tex>\mathtt{skip}</tex>, необходимо вызвать функцию <tex>\mathtt{delete} \ </tex> следующим образом:

~~В узлах списка хранятся:~~ delete(skip.head, key) ==Использование нечестной монеты==* Вместо честной монеты с распределением <tex>\left\{\dfrac{1}{2}, \ \dfrac{1}{2}\right\}</tex> можно взять в качестве случайного источника нечестную монету с распределением <tex>\{p,q\}</tex> (с вероятностью <tex>p</tex> выпадает «Орёл»). Тогда математическим ожиданием количества элементов на уровне <tex>k</tex> будет <tex>~~next~~n \cdot p^k</tex> . Время поиска будет равно <tex>O\left( \dfrac{1}{p} \log_{1/p} {n} \right)</tex> <tex>(</tex>на <tex>i</tex>-ом уровне элементов будет почти в <tex>\dfrac{1}{p}</tex> раз больше, чем на <tex>(i+1)</tex>--ом, значит на каждом уровне пройдём не более <tex>\dfrac{1}{p}</tex> элементов, а уровней всего <tex>\log_{1/p}{n} ~~следующий узел~~</tex><tex>)</tex>. * Пусть у нас добавлено <tex>n</tex> элементов. Найдём такое распределение <tex>~~down~~\left\{ p, q \right\}</tex> , при котором функция <tex>\dfrac{1}{x} \log_{1/x} {n}</tex> принимает минимальное значение. Производная этой функции равна <tex>-\dfrac{\ln{n} \left( \ln {(1/x)} --1 \right)}{x^2 \ln^2{(1/x)}} ~~тот же узел на следующем уровне~~* </tex>~~data~~. При <tex>x = \dfrac{1}{e}</tex> производная равна нулю, вторая производная в точке <tex>x_0 = \dfrac{1}{e}</tex> больше <tex>0</tex>, значит <tex>x_0</tex> <tex>-</tex> точка минимума. Значит при распределении <tex>\left\{ \dfrac{1}{e}, \dfrac{e -1}{e} \right\}</tex> время поиска меньше всего. Но не стоит забывать, что это лишь теоретическая оценка и в действительности придумать источник с распределением <tex>\left\{ \dfrac{1}{e}, \dfrac{e -1}{e} ~~данные типа T~~\right\}</tex> почти невозможно, поэтому на практике лучше всего использовать честную монету. Для крайних распределений:* <tex>~~key~~\{0, 1\}</tex> — <tex>O(n)</tex> — поиск, добавление и удаления элемента, поскольку мы вместо нескольких списков используем по факту один.* <tex>\{~~{---~~1, 0\}~~} ключ типа K~~</tex> — зависит от реализации алгоритма. Если при каждой вставке у нас образуется не более одного уровня, то количество уровней будет равным <tex>n</tex>, значит время поиска будет равным <tex>O(n)</tex>.

==Применение==

Список с пропусками применяется во многих приложениях, поскольку имеет ряд преимуществ:* ~~Базы данных~~Быстрая вставка элемента, поскольку не требуется каким-либо образом изменять другие элементы (только предыдущий элемент)* ~~Распределённые вычисления и p2p~~Проще реализовать, чем сбалансированные деревья или хеш-таблицы* Следующий элемент достаётся за <tex>O(1)</tex> (при условии, что у нас есть ссылка не текущий)* ~~Масштабируемые параллельные приоритетные очереди~~ Легко модифицировать под различные задачи ===Нахождение всех отрезков, покрывающих данную точку=== {{Задача|definition = Пусть у нас есть запросы двух видов:# Добавить отрезок <tex>[L, R]</tex># Для заданной точки <tex>x</tex> вычислить количество отрезков, которые её покрывают. Необходимо для каждого запроса второго типа вывести ответ.}} Для решения данной задачи воспользуемся списком с пропусками. Когда нам приходит запрос первого типа, то мы просто добавляем числа <tex>L</tex> и ~~словари~~<tex>R</tex> в список с пропусками (если какое-то из чисел уже было добавлено, то второй раз мы его не добавляем). После этого идём с верхнего уровня, и на каждом уровне мы ищем такие <tex>l</tex> и <tex>r</tex>, что значение <tex>l</tex> меньше <tex>L</tex>, а значение следующего за <tex>l</tex> элемента уже не меньше <tex>L</tex>. Аналогично ищем такое же <tex>r</tex>, только относительно <tex>R</tex>. Если значения <tex>l.next</tex> и <tex>r</tex> лежат полностью внутри отрезка <tex>[L, R]</tex>, то к самому отрезку <tex>[l.next, r]</tex> прибавляем <tex>1</tex>, а сам отрезок <tex>[L, R]</tex> разбиваем на три <tex>[L, l.next.key - 1]</tex>, <tex>[l.next.key, r.key]</tex> и <tex>[r.key + 1, R]</tex> и по отдельности решаем задачу уже для полученных отрезков (если для какого-то отрезка левая граница стала больше правой, то мы ничего не делаем). Допустим, что на каком-то уровне у нас получилось разделить отрезок <tex>[L, R]</tex> на <tex>3</tex> части. Но тогда на следующих уровнях мы будем уменьшать отрезок почти в два раза только с одной стороны, поскольку левая или правая часть отрезка будет равна <tex>l.next.key</tex> или <tex>r.key</tex>. Итого время обработки запроса <tex>O(\log{n})</tex>. ~~В вычислительной геометрии широко применяются структуры~~ Для запросов второго типа мы снова будем спускать с верхнего уровня до нижнего. На каждом уровне найдём тот элемент, значение которого не меньше точки <tex>x</tex>. Если такой элемент нашёлся, то прибавляем к ответу значение на отрезку между найденным элементом и следующим. Потом также спускаемся на один уровень вниз, если текущий уровень не был первым. Поскольку уровней всего <tex>\log{n}</tex>, а на ~~основе списка с пропусками~~каждом уровне обойдём не более двух элементов, то данный тип запросов мы обработаем за <tex>O(\log{n})</tex>.

==См. также==

*[[Список]]

*[[Рандомизированное бинарное дерево поиска]]

*[[Поисковые структуры данных]]

~~Структуры на основе списка с пропусками:~~*[[Skip quadtree: определение, время работы|Skip quadtree]]*[http://en.wikipedia.org/wiki/Skip_graph Википедия — Skip graph(En)]

==Источники информации==

*[http://habrahabr.ru/post/111913/ Хабрахабр — Списки с пропусками]*[http://ru.wikipedia.org/wiki/%D0%A1%D0%BF%D0%B8%D1%81%D0%BE%D0%BA_%D1%81_%D0%BF%D1%80%D0%BE%D0%BF%D1%83%D1%81%D0%BA%D0%B0%D0%BC%D0%B8 Википедия — списки с пропусками~~(Ru)~~]*[http://en.wikipedia.org/wiki/Skip_list ~~Википедия~~ Wikipedia — ~~списки с пропусками(En)]~~*[http://bit.ly/LiNe8M Курс kiev-clrs — Списки с пропускамиskip list]

*[http://igoro.com/archive/skip-lists-are-fascinating/ igoro.com — Skip lists are fascinating]

*[http://ticki.github.io/blog/skip-lists-done-right/ ticki.github.io — Skip Lists: Done Right]

*[https://books.google.ru/books?id=NRrcsIJZAYMC&pg=PA157&lpg=PA157&dq=the+interval+skiplist&source=bl&ots=yqad5WH8im&sig=ACfU3U2vzUeMu_psDaWNJ4sztarLzJQsnw&hl=en&sa=X&ved=2ahUKEwi7ta6KyJbhAhWq5aYKHTmPBjgQ6AEwC3oECAkQAQ#v=onepage&q=the%20interval%20skiplist&f=false Eric N. Hanson — A Data Structure for Finding All Intervals That Overlap a Point стр. 155-164]

[[Категория: Структуры данных]]

Gaporf

390

правок

Изменения

Список с пропусками

Навигация

Персональные инструменты

Пространства имён

Варианты

Просмотры

Ещё

Поиск

Навигация

Инструменты