Участник:Artem.ustinov/НВП — различия между версиями

Материал из Викиконспекты
Перейти к: навигация, поиск
(Доказательство оптимальности)
(Деление на блоки)
 
(не показано 30 промежуточных версий 2 участников)
Строка 14: Строка 14:
  
 
* Если <tex>\pi_i</tex> больше каждого элемента <tex>B</tex>, вычисленного для подпоследовательности <tex>\pi_1, \pi_2,~\dots~,\pi_{i-1}</tex>, тогда с ним можно сделать возрастающую подпоследовательность максимальной длины из уже рассмотренных, в которой он будет последним элементом. Значит, записываем его в конец <tex>B</tex>.
 
* Если <tex>\pi_i</tex> больше каждого элемента <tex>B</tex>, вычисленного для подпоследовательности <tex>\pi_1, \pi_2,~\dots~,\pi_{i-1}</tex>, тогда с ним можно сделать возрастающую подпоследовательность максимальной длины из уже рассмотренных, в которой он будет последним элементом. Значит, записываем его в конец <tex>B</tex>.
* Иначе <tex>\pi_i</tex> будет наилучшим элементом для уже существующей длины, тогда мы находим наименьшее <tex>k\colon B_k > \pi_i</tex> и заменяем <tex>B_k</tex> элементом <tex>\pi_i</tex>.
+
* Иначе <tex>\pi_i</tex> будет наилучшим элементом для уже существующей длины и сможет улучшить только один элемент в <tex>B</tex>, тогда мы находим наименьшее <tex>k\colon B_k > \pi_i</tex> и заменяем <tex>B_k</tex> элементом <tex>\pi_i</tex>.
  
 
Следует отметить, что полученный массив также образует возрастающую последовательность, на котором мы должны выполнять операции <tex>\mathrm{insert}, \mathrm{next}, \mathrm{delete}</tex>, соответственно целесообразно использовать [[ Приоритетные очереди | приоритетную очередь]], реализованную через [[Дерево ван Эмде Боаса]]. Так как данная структура данных производит описанные операции за <tex>O(\operatorname{log} k)</tex>, где k — количество бит чисел, которые позволяет хранить дерево, то полученный алгоритм работает за <tex>O(n\operatorname{log}\operatorname{log} n)</tex>, потому что все элементы последовательности не превосходят n.
 
Следует отметить, что полученный массив также образует возрастающую последовательность, на котором мы должны выполнять операции <tex>\mathrm{insert}, \mathrm{next}, \mathrm{delete}</tex>, соответственно целесообразно использовать [[ Приоритетные очереди | приоритетную очередь]], реализованную через [[Дерево ван Эмде Боаса]]. Так как данная структура данных производит описанные операции за <tex>O(\operatorname{log} k)</tex>, где k — количество бит чисел, которые позволяет хранить дерево, то полученный алгоритм работает за <tex>O(n\operatorname{log}\operatorname{log} n)</tex>, потому что все элементы последовательности не превосходят n.
 
==== Доказательство оптимальности ====
 
{{
 
Утверждение
 
|id=proposal1
 
|statement=
 
Пусть <tex>S=\{\pi_1,\pi_2,~\dots,~\pi_n\}</tex> — входная перестановка. В результате описанного алгоритма размер массива <tex>B</tex> равен длине НВП последовательности <tex>S</tex>
 
 
|proof=
 
Докажем, что перед обработкой и после обработки элемента последовательности алгоритмом сохраняется инвариант, что в массиве <tex>B</tex> хранятся наилучшие элементы для каждой возможной длины возрастающих подпоследовательностей обработанной последовательности.
 
* Пусть перед обработкой элемента <tex>\pi_i</tex> соблюдается описанное выражение инварианта.
 
* Если <tex>\pi_i</tex> больше каждого элемента <tex>B</tex>, вычисленного для последовательности <tex>S_{i-1}=\{\pi_1,\pi_2,~\dots,~\pi_{i-1}\}</tex>, то он не может обновить любой из наилучших элементов, вычисленных ранее. С <tex>\pi_i</tex> можно составить возрастающую последовательность длины <tex>l+1</tex>, где <tex>l</tex> — длина НВП последовательности <tex>S_{i-1}</tex>, добавив <tex>\pi_i</tex> в конец этой НВП.  Значит, <tex>\pi_i</tex> — наилучший элемент длины <tex>l+1</tex>. По предположению, размер <tex>B</tex> равен длине НВП последовательности <tex>S_{i-1}</tex>, потому что в <tex>B</tex> хранятся наилучшие элементы всех возможных длин возрастающих подпоследовательностей <tex>S_{i-1}</tex>. Тогда, добавив в конец очереди <tex>B</tex> элемент <tex>\pi_i</tex>, инвариант будет сохраняться.
 
* Иначе <tex>\pi_i</tex> будет наилучшим элементом для уже существующей длины. Заметим, что <tex>\pi_i</tex> может обновить только один элемент. В обратном случае, если <tex>\exists l_1,l_2\colon l_2>l_1</tex>, для которых <tex>\pi_i</tex> может быть наилучшим элементом, то существует такая подпоследовательность длины <tex>l_2</tex>, в которой <tex>\pi_i</tex> является наибольшим элементом, но из этой последовательности можно составить подпоследовательность длины <tex>l_1</tex>, в которой наибольший элемент меньше <tex>\pi_i</tex>, что противоречит предположению. Таким образом, <tex>\pi_i</tex> может обновить только наименьшее <tex>k\colon B_k > \pi_i</tex>. Тогда, заменив <tex>B_k</tex> элементом <tex>\pi_i</tex>, инвариант также будет сохраняться.
 
* После завершения алгоритма, в очереди <tex>B</tex> будут храниться наилучшие элементы для всех возможных длин возрастающих подпоследовательностей последовательности <tex>S</tex>. Тогда размер <tex>B</tex> равен длине НВП последовательности <tex>S</tex>.
 
}}
 
  
 
==== Пример ====
 
==== Пример ====
Строка 108: Строка 93:
 
Тогда, пройдя по предшественникам, начиная с последнего элемента очереди <tex>B</tex>, мы можем восстановить НВП.
 
Тогда, пройдя по предшественникам, начиная с последнего элемента очереди <tex>B</tex>, мы можем восстановить НВП.
 
==== Общий вид алгоритма ====
 
==== Общий вид алгоритма ====
''' Состояние очереди при каждом добавлении '''
 
 
{| class="wikitable" align="leftborder" style="color: black; background-color:#ffffcc;" cellpadding="10"
 
{| class="wikitable" align="leftborder" style="color: black; background-color:#ffffcc;" cellpadding="10"
 
|-align="center"
 
|-align="center"
Строка 137: Строка 121:
 
| <tex>1</tex> || <tex>2</tex> || <tex>5</tex> || style="background:#FFCFCF"| <tex>7</tex> || style="background:#FFCFCF"| <tex>11</tex> || style="background: #CFCFFF"| <tex>11</tex>
 
| <tex>1</tex> || <tex>2</tex> || <tex>5</tex> || style="background:#FFCFCF"| <tex>7</tex> || style="background:#FFCFCF"| <tex>11</tex> || style="background: #CFCFFF"| <tex>11</tex>
 
|}
 
|}
 
  
 
{| class="wikitable" style="color: black; background-color:#ffffcc;" cellpadding="10"
 
{| class="wikitable" style="color: black; background-color:#ffffcc;" cellpadding="10"
Строка 177: Строка 160:
 
Предположим, мы знаем такое приближение числа <tex>k</tex> числом <tex>m: m \geqslant k</tex>. Мы обсудим, как найти такое <tex>m</tex> позже.
 
Предположим, мы знаем такое приближение числа <tex>k</tex> числом <tex>m: m \geqslant k</tex>. Мы обсудим, как найти такое <tex>m</tex> позже.
  
Если мы разобьем всю последовательность на блоки из <tex>m</tex> элементов (последний блок может быть меньше), и нам удастся обрабатывать каждый как перестановку из <tex>m</tex> элементов, то мы получим асимптотическое время <tex>O(n \operatorname{log} \operatorname{log} (k + m))</tex>, а т.к. <tex>m \geqslant k</tex>, то <tex>O(n \operatorname{log} \operatorname{log} m)</tex>. (Мы будем обрабатывать блоки последовательно, т.е. с предыдущего блока у нас может остаться <tex>k</tex> значений в очереди, которые дополняются <tex>m</tex> значениями очередного блока — получаем верхнее ограничение в <tex>k + m</tex> обрабатываемых возможных значений.)
+
Во время обработки ключей элементов описанный выше алгоритм <tex>\mathrm{LIS}</tex> работает только с очередью <tex>B</tex> и не зависит от предыдущих элементов последовательности, которые не находятся в очереди. Поэтому, если мы разобьем всю последовательность на блоки из <tex>m</tex> элементов (последний блок может быть меньше), и нам удастся обрабатывать каждый как перестановку из <tex>m</tex> элементов, сохраняя очередь <tex>B</tex> для вычисленных ранее блоков, то мы получим асимптотическое время <tex>O(n \operatorname{log} \operatorname{log} (k + m))</tex>, а так как <tex>m \geqslant k</tex>, то <tex>O(n \operatorname{log} \operatorname{log} m)</tex>. (Мы будем обрабатывать блоки последовательно, т.е. с предыдущего блока у нас может остаться <tex>k</tex> значений в очереди, которые дополняются <tex>m</tex> значениями очередного блока — получаем верхнее ограничение в <tex>k + m</tex> обрабатываемых возможных значений.)
  
 
=== Деление на блоки===
 
=== Деление на блоки===
Строка 185: Строка 168:
 
Обозначим за <tex>C_j^s</tex> отсортированный блок <tex>C_j</tex>. Отсортированные и неотсортированные блоки будем хранить в памяти.
 
Обозначим за <tex>C_j^s</tex> отсортированный блок <tex>C_j</tex>. Отсортированные и неотсортированные блоки будем хранить в памяти.
  
[[Цифровая сортировка]] каждого блока отдельно будет давать нам время рваботы <tex>O \left(\dfrac{n}{m}n \right) = O \left(\dfrac{n^2}{m} \right)</tex>. Чтобы отсортировать их за линейное время, дополним каждый элемент номером его блока и получим пары <tex>\langle\lceil i/m\rceil,\pi_i\rangle</tex>. Цифровая сортировка этих пар, если принимать за старший разряд номер блока, а за младший значение элемента, будет работать за <tex>O(n)</tex>, потому что значения элементов и номера блоков не превосходят <tex>n</tex>.
+
[[Цифровая сортировка]] каждого блока отдельно будет давать нам время работы <tex>O \left(\dfrac{n}{m}n \right) = O \left(\dfrac{n^2}{m} \right)</tex>. Дополним каждый элемент <tex>\pi</tex> номером блока, в котором он находится и смещением в этом блоке. Теперь, рассматривая номер блока как старший разряд, элемент как младший разряд (по смещению внутри блока не сортируем), можно сортировать цифровой сортировкой за линейное время <tex>O(n)</tex>, потому что значения элементов и номера блоков не превосходят <tex>n</tex>.
 
 
=== Обработка блока ===
 
Обрабатывая блоки, будем работать не со значениями элементов, а с ключами, которые определенны для каждого элемента внутри блоков. Все блоки будут обрабатываться онлайн, то есть мы не перейдём к обработке следующего блока, пока не закончим с текущим.
 
 
 
Каждому элементу <tex>x</tex> взаимно однозначно сопоставим ключ <tex>y = \mathtt{key}(x);~x=\mathtt{elt}(y)</tex>. Все значения ключей расположим в промежутке <tex>\{1,2,\dots,2m\}</tex>, и в очереди <tex>B</tex> будем работать со значениями ключей элементов.
 
 
 
Чтобы определить ключи элементов так, чтобы их значения были в представленном промежутке, будем, работая с блоком <tex>C_j</tex>, сливать элементы, ключи которых находятся в очереди <tex>B</tex>, с <tex>C_j^s</tex> в список <tex>\mathtt{merged}</tex>.
 
Получим ключи, сопоставив каждому элементу в <tex>\mathtt{merged}</tex> его позицию в этом списке. Как было замечено ранее, элементы, чьи ключи находятся в <tex>B</tex>, располагаются в возрастающем порядке, поэтому возможно производить тривиальную операцию [[Сортировка слиянием#Принцип работы#Слияние двух массивов | слияния]]. Поскольку мы предположили, что <tex>m\geqslant k</tex>, то количество ключей в <tex>B</tex> не больше <tex>m</tex>, тогда длина <tex>\mathtt{merged}</tex> не больше <tex>2m</tex>, что позволяет однозначно определить ключи на множестве <tex>\{1,2,\dots,2m\}</tex>.
 
 
 
После того, как мы определили новые ключи для элементов, обновим ключи в очереди <tex>B</tex>.
 
 
 
Затем запускаем описанный выше алгоритм <tex>\mathrm{LIS}</tex>, для ключей элементов <tex>C_j</tex> в порядке исходной последовательности.
 
  
В итоге, обработка блока делится на следующие этапы:
+
Перестановка смещений, образованная в сортированном блоке есть не что иное, как обратная перестановка перестановки <tex>\xi</tex>, элементы которой соотносятся между собой как элементы исходного блока. Т.е. если элемент <tex>\pi</tex> находится в исходной перестановке в блоке <tex>C_j</tex> на позиции <tex>i</tex>, то в блоке <tex>C_j^s</tex> он на позиции <tex>\xi_i</tex>.
* Достаем из очереди <tex>B</tex> ключи <tex>x</tex>, конвертируем их в элементы <tex>\mathtt{elt}(x)</tex> и кладём в список <tex>\mathtt{elems}</tex>.
 
* Сливаем элементы в <tex>\mathtt{elems}</tex> со следующим отсортированным блоком в список <tex>\mathtt{merged}</tex>.
 
* Присваеваем новые ключи элементам в порядке списка <tex>\mathtt{merged}</tex>.
 
* Вставляем в <tex>B</tex> новые ключи элементов списка <tex>\mathtt{elems}</tex>.
 
* Обрабатываем ключи элементов блока в порядке исходной последовательности с помощью алгоритма <tex>\mathrm{LIS}</tex>. Для восстановления НВП также используем массив "предшественников", который будет работать с соответствующими ключам элементами <tex>\mathtt{elt}(x)</tex>.
 
  
=== Доказательство оптимальности ===
+
====Пример====
{{
 
Утверждение|statement=
 
Пусть имеется последовательность <tex>S=\{\pi_1,~\dots,~\pi_n\}</tex>, разбитая на <tex>\lceil n/m \rceil</tex> блоков <tex>C_i</tex> длины <tex>m</tex>. В результате описанного выше алгоритма получается очередь <tex>B</tex>, размер которой равен длине НВП последовательности <tex>S</tex>.
 
|proof=
 
Докажем, что перед обработкой блока и после его обработки сохраняется инвариант, что очередь <tex>B</tex> хранит ключи наилучших элементов для всех возможных длин возрастающих подпоследовательностей обработанной последовательности элементов.
 
* Пусть перед обработкой блока <tex>C_i</tex> соблюдается описанное выражение инварианта для последовательности <tex>S_{(i-1)m}=\{\pi_1,~\dots,~\pi_{(i-1)m}\}</tex>.
 
* После слияния элементов очереди <tex>B</tex> и блока <tex>C_i^s</tex> получаем отсортированный список <tex>\mathtt{merged}</tex>. Так как <tex>(\pi_{j}<\pi_{k} \Longleftrightarrow \mathtt{key}(\pi_{j})<\mathtt{key}(\pi_{k}))</tex>, где <tex>\pi_{u_j},\pi_{u_k}\in \mathtt{merged}</tex>, то справедливо утверждение, что любая возрастающая последовательность ключей элементов будет соответствовать возрастающей последовательности элементов.
 
* Во время обработки ключей элементов алгоритм <tex>\mathtt{LIS}</tex> работает только с очередью <tex>B</tex> и не зависит от предыдущих элементов последовательности, ключи которых не находятся в очереди. Так как на каждой итерации алгоритма <tex>\mathrm{LIS}</tex> сохраняется выражение инварианта, что в очереди <tex>B</tex> хранятся наилучшие значения ключей элементов, которые соответствуют наилучшим элементам, для всех возможных длин возрастающих подпоследовательностей обработанной подпоследовательности, то в результате работы <tex>\mathrm{LIS}</tex> будет очередь <tex>B</tex> с ключами, соответствующими наилучшим элементам всех возможных длин возрастающих подпоследовательностей последовательности <tex>S_{im}</tex>.
 
* Таким образом, после обработки последнего блока, в очереди <tex>B</tex> будут храниться ключи наилучших элементов для каждой длины возрастающих подпоследовательностей последовательности <tex>S_n=S</tex>. Тогда последний элемент в очереди <tex>B</tex> соответствует наилучшему элементу длины НВП последовательности <tex>S</tex>, а так как в очереди <tex>B</tex> хранятся наилучшие элементы всех возможных длин возрастающих подпоследовательностей <tex>S</tex>, то размер очереди <tex>B</tex> равен длине НВП последовательности <tex>S</tex>.
 
}}
 
 
 
===Пример===
 
 
Предположим, что <tex>m=5</tex>. Исходно получаем:
 
Предположим, что <tex>m=5</tex>. Исходно получаем:
  
Строка 225: Строка 179:
 
|-
 
|-
 
|<tex>\pi</tex>||style="background:#FFC9C9"|<tex>9</tex>||style="background:#FFC9C9"|<tex>3</tex>||style="background:#FFC9C9"|<tex>10</tex>||style="background:#FFC9C9"|<tex>4</tex>||style="background:#FFC9C9"|<tex>8</tex>||style="background:#B9FFB9"|<tex>1</tex>||style="background:#B9FFB9"|<tex>2</tex>||style="background:#B9FFB9"|<tex>12</tex>||style="background:#B9FFB9"|<tex>6</tex>||style="background:#B9FFB9"|<tex>5</tex>||style="background:#CFCFFF"|<tex>7</tex>||style="background:#CFCFFF"|<tex>11</tex>
 
|<tex>\pi</tex>||style="background:#FFC9C9"|<tex>9</tex>||style="background:#FFC9C9"|<tex>3</tex>||style="background:#FFC9C9"|<tex>10</tex>||style="background:#FFC9C9"|<tex>4</tex>||style="background:#FFC9C9"|<tex>8</tex>||style="background:#B9FFB9"|<tex>1</tex>||style="background:#B9FFB9"|<tex>2</tex>||style="background:#B9FFB9"|<tex>12</tex>||style="background:#B9FFB9"|<tex>6</tex>||style="background:#B9FFB9"|<tex>5</tex>||style="background:#CFCFFF"|<tex>7</tex>||style="background:#CFCFFF"|<tex>11</tex>
 +
|-
 +
|Смещение ||style="background:#FFC9C9"|<tex>1</tex>||style="background:#FFC9C9"|<tex>2</tex>||style="background:#FFC9C9"|<tex>3</tex>||style="background:#FFC9C9"|<tex>4</tex>||style="background:#FFC9C9"|<tex>5</tex>||style="background:#B9FFB9"|<tex>1</tex>||style="background:#B9FFB9"|<tex>2</tex>||style="background:#B9FFB9"|<tex>3</tex>||style="background:#B9FFB9"|<tex>4</tex>||style="background:#B9FFB9"|<tex>5</tex>||style="background:#CFCFFF"|<tex>1</tex>||style="background:#CFCFFF"|<tex>2</tex>
 
|}
 
|}
  
Строка 232: Строка 188:
 
|-
 
|-
 
|<tex>\pi</tex> ||style="background:#FFC9C9"|<tex>3</tex>||style="background:#FFC9C9"|<tex>4</tex>||style="background:#FFC9C9"|<tex>8</tex>||style="background:#FFC9C9"|<tex>9</tex>||style="background:#FFC9C9"|<tex>10</tex>||style="background:#B9FFB9"|<tex>1</tex>||style="background:#B9FFB9"|<tex>2</tex>||style="background:#B9FFB9"|<tex>5</tex>||style="background:#B9FFB9"|<tex>6</tex>||style="background:#B9FFB9"|<tex>12</tex>||style="background:#CFCFFF"|<tex>7</tex>||style="background:#CFCFFF"|<tex>11</tex>
 
|<tex>\pi</tex> ||style="background:#FFC9C9"|<tex>3</tex>||style="background:#FFC9C9"|<tex>4</tex>||style="background:#FFC9C9"|<tex>8</tex>||style="background:#FFC9C9"|<tex>9</tex>||style="background:#FFC9C9"|<tex>10</tex>||style="background:#B9FFB9"|<tex>1</tex>||style="background:#B9FFB9"|<tex>2</tex>||style="background:#B9FFB9"|<tex>5</tex>||style="background:#B9FFB9"|<tex>6</tex>||style="background:#B9FFB9"|<tex>12</tex>||style="background:#CFCFFF"|<tex>7</tex>||style="background:#CFCFFF"|<tex>11</tex>
 +
|-
 +
|Смещение ||style="background:#FFC9C9"|<tex>2</tex>||style="background:#FFC9C9"|<tex>4</tex>||style="background:#FFC9C9"|<tex>5</tex>||style="background:#FFC9C9"|<tex>1</tex>||style="background:#FFC9C9"|<tex>3</tex>||style="background:#B9FFB9"|<tex>1</tex>||style="background:#B9FFB9"|<tex>2</tex>||style="background:#B9FFB9"|<tex>5</tex>||style="background:#B9FFB9"|<tex>4</tex>||style="background:#B9FFB9"|<tex>3</tex>||style="background:#CFCFFF"|<tex>1</tex>||style="background:#CFCFFF"|<tex>2</tex>
 
|}
 
|}
 +
 +
Обратные перестановки (<tex>\xi</tex>):
 +
{| class="wikitable" style="center" style="background:#FFCC80"
 +
! colspan="5"|<tex>1</tex> || colspan="5"|<tex>2</tex> || colspan="3"|<tex>3</tex>
 +
|-align="center"
 +
| style="background:#FFD0D0"|<tex>4</tex>||style="background:#FFD0D0"|<tex>1</tex>||style="background:#FFD0D0"|<tex>5</tex>||style="background:#FFD0D0"|<tex>2</tex>||style="background:#FFD0D0"|<tex>3</tex>
 +
| style="background:#D0FFD0"|<tex>1</tex>||style="background:#D0FFD0"|<tex>2</tex>||style="background:#D0FFD0"|<tex>5</tex>||style="background:#D0FFD0"|<tex>4</tex>||style="background:#D0FFD0"|<tex>3</tex>
 +
| style="background:#D0D0FF"|<tex>1</tex>||style="background:#D0D0FF"|<tex>2</tex>
 +
|}
 +
 +
=== Обработка блока ===
 +
Обрабатывая блок, каждому элементу <tex>x</tex> внутри этого блока взаимно однозначно сопоставим ключ <tex>y = \mathtt{key}(x);~x=\mathtt{elt}(y)</tex> так, чтобы их значения находились в промежутке <tex>\{1,2,\dots,2m\}</tex>. Очередь <tex>B</tex> будет работать непосредственно с ключами элементов.
 +
 +
Работая с блоком <tex>C_j</tex>, будем сливать элементы, ключи которых находятся в очереди <tex>B</tex>, с <tex>C_j^s</tex> в список <tex>\mathtt{merged}</tex>. Поскольку мы предположили, что <tex>m\geqslant k</tex>, то количество ключей в <tex>B</tex> не больше <tex>m</tex>, тогда длина <tex>\mathtt{merged}</tex> не больше <tex>2m</tex>, что позволяет однозначно определить ключи на множестве <tex>\{1,2,\dots,2m\}</tex>. Как было замечено ранее, элементы, чьи ключи находятся в <tex>B</tex>, располагаются в возрастающем порядке, поэтому возможно производить тривиальную операцию [[Сортировка слиянием#Принцип работы#Слияние двух массивов | слияния]] за <tex>O(m)</tex>.
 +
 +
В итоге, получим отсортированный список <tex>\mathtt{merged}</tex>. Сопоставим ключ каждому элементу как его позицию в этом списке, тогда справедливы утверждения, что <tex>\mathtt{elt}(x)=\mathtt{merged}[x]</tex> и <tex>(\pi_{i}<\pi_{k} \Longleftrightarrow \mathtt{key}(\pi_{i})<\mathtt{key}(\pi_{k}))</tex>, где <tex>\pi_{i},\pi_{k}\in \mathtt{merged}</tex>, поэтому любая возрастающая последовательность ключей элементов будет соответствовать возрастающей последовательности элементов. Таким образом, приоритетная очередь сможет корректно работать с ключами элементов.
 +
 +
Находим последовательность ключей, соответствующую элементам блока <tex>C_j^s</tex>. Действуя на эту последовательность перестановкой <tex>\xi_j</tex>, получаем последовательность ключей в порядке исходного блока.
 +
 +
Оставшиеся ключи, которые входят в <tex>\mathtt{merged}</tex>, но не являются ключами элементов в обрабатываемом блоке, будут ключами элементов из очереди <tex>B</tex>. Обновляем очередь <tex>B</tex> этими ключами.
 +
 +
Затем запускаем алгоритм <tex>\mathrm{LIS}</tex>, для ключей элементов <tex>C_j</tex> в порядке исходной последовательности.
 +
 +
В итоге, обработка блока делится на следующие этапы:
 +
* Достаем из очереди <tex>B</tex> ключи <tex>x</tex>, конвертируем их в элементы <tex>\mathtt{elt}(x)</tex> и кладём в список <tex>\mathtt{elems}</tex>.
 +
* Сливаем элементы в <tex>\mathtt{elems}</tex> со следующим отсортированным блоком <tex>C_j^s</tex> в список <tex>\mathtt{merged}</tex>, генерируя два вспомогательных массива <tex>\mathtt{ind_0}</tex> и <tex>\mathtt{ind_1}</tex>, хранящих индексы элементов списков <tex>C_j^s</tex> и <tex>\mathtt{elems}</tex> соответственно в списке <tex>\mathtt{merged}</tex>.
 +
* Действуя на последовательность ключей в списке <tex>\mathtt{ind_0}</tex> перестановкой <tex>\xi_j</tex> получим ключи в порядке исходной последовательности.
 +
* Вставляем в <tex>B</tex> новые ключи элементов списка <tex>\mathtt{elems}</tex> (элементы <tex>\mathtt{ind_1}</tex>).
 +
* Обрабатываем ключи элементов блока в порядке исходной последовательности с помощью алгоритма <tex>\mathrm{LIS}</tex>. Для восстановления НВП также используем массив "предшественников", который будет работать с соответствующими ключам элементами <tex>\mathtt{elt}(x)</tex>.
 +
 +
====Пример====
  
 
''' Первый блок '''
 
''' Первый блок '''
 +
 +
Так как очередь <tex>B</tex> в начале пуста, то <tex>\mathtt{merged}=C_1^s</tex>. Присвоим ключи элементам в списке <tex>\mathtt{merged}</tex> как их индексы в этом списке. Восстанавливаем последовательность ключей элементов в порядке исходной последовательности, действуя перестановкой смещений <tex>\xi_1</tex> на последовательность ключей в отсортированном блоке.
 +
 
{|
 
{|
 
| ||
 
| ||
 
{| class="wikitable" style="text-align:center"
 
{| class="wikitable" style="text-align:center"
! colspan="6"|Первый блок
+
! colspan="6"|Сортированный
 
|-
 
|-
| <tex>\pi</tex> ||<tex>9</tex>||<tex>3</tex>||<tex>10</tex>||<tex>4</tex>||<tex>8</tex>
+
| <tex>\pi</tex> ||<tex>3</tex>||<tex>4</tex>||<tex>8</tex>||<tex>9</tex>||<tex>10</tex>
 
|-
 
|-
|key ||<tex>4</tex>||<tex>1</tex>||<tex>5</tex>||<tex>2</tex>||<tex>3</tex>
+
| <tex>key</tex> ||<tex>1</tex>||<tex>2</tex>||<tex>3</tex>||<tex>4</tex>||<tex>5</tex>
 
|}
 
|}
 
| ||
 
| ||
 
{| class="wikitable" style="text-align:center"
 
{| class="wikitable" style="text-align:center"
! colspan="6"|Cортированный
+
! colspan="6"|Первый блок
 +
|-
 +
| <tex>\pi</tex> ||<tex>9</tex>||<tex>3</tex>||<tex>10</tex>||<tex>4</tex>||<tex>8</tex>
 
|-
 
|-
| <tex>\pi</tex> ||<tex>3</tex>||<tex>4</tex>||<tex>8</tex>||<tex>9</tex>||<tex>10</tex>
+
| <tex>key</tex> ||<tex>4</tex>||<tex>1</tex>||<tex>5</tex>||<tex>2</tex>||<tex>3</tex>
 
|-
 
|-
|key ||<tex>1</tex>||<tex>2</tex>||<tex>3</tex>||<tex>4</tex>||<tex>5</tex>
+
| <tex>\xi_1</tex> ||<tex>4</tex>||<tex>1</tex>||<tex>5</tex>||<tex>2</tex>||<tex>3</tex>
 
|}
 
|}
 
|}
 
|}
Строка 281: Строка 275:
 
Восстанавливаем элементы <tex>B: \{1, 2, 3\}</tex> из <tex>\mathtt{merged}: \{3, 4, 8, 9, 10\}</tex>: <tex>\{3, 4, 8\}</tex>.
 
Восстанавливаем элементы <tex>B: \{1, 2, 3\}</tex> из <tex>\mathtt{merged}: \{3, 4, 8, 9, 10\}</tex>: <tex>\{3, 4, 8\}</tex>.
  
Сливаем <tex>C_2^s</tex> и восстановленные элементы из <tex>B</tex>:
+
Сливаем <tex>C_2^s</tex> и восстановленные элементы из <tex>B</tex> в <tex>\mathtt{merged}</tex> и присваиваем элементам ключи как индексы элементов в полученном списке:
 
{|
 
{|
 
| ||
 
| ||
Строка 297: Строка 291:
 
| <tex>1</tex>||<tex>2</tex>||<tex>5</tex>||<tex>6</tex>||<tex>12</tex>
 
| <tex>1</tex>||<tex>2</tex>||<tex>5</tex>||<tex>6</tex>||<tex>12</tex>
 
|}
 
|}
 +
|}
 +
 +
{|
 
| ||
 
| ||
 
{| class="wikitable" style="center"
 
{| class="wikitable" style="center"
 
|-align="center"
 
|-align="center"
| colspan="9"|<tex>\mathtt{merged}</tex>
+
! colspan="9"|<tex>\mathtt{merged}</tex>
 
|-align="center"
 
|-align="center"
|!\pi|<tex>1</tex>||<tex>2</tex>||<tex>3</tex>||<tex>4</tex>||<tex>5</tex>||<tex>6</tex>||<tex>8</tex>||<tex>12</tex>
+
|<tex>\pi</tex>||<tex>1</tex>||<tex>2</tex>||<tex>3</tex>||<tex>4</tex>||<tex>5</tex>||<tex>6</tex>||<tex>8</tex>||<tex>12</tex>
 
|-align="center"
 
|-align="center"
|!key|<tex>1</tex>||<tex>2</tex>||<tex>3</tex>||<tex>4</tex>||<tex>5</tex>||<tex>6</tex>||<tex>7</tex>||<tex>8</tex>
+
|<tex>key</tex>||<tex>1</tex>||<tex>2</tex>||<tex>3</tex>||<tex>4</tex>||<tex>5</tex>||<tex>6</tex>||<tex>7</tex>||<tex>8</tex>
 +
|}
 +
| ||
 +
{| class="wikitable" style="center"
 +
|-align="center"
 +
| colspan="3"|<tex>\mathtt{ind_1}</tex>
 +
|-align="center"
 +
| <tex>3</tex>||<tex>4</tex>||<tex>7</tex>
 +
|}
 +
| ||
 +
{| class="wikitable" style="center"
 +
|-align="center"
 +
| colspan="5"|<tex>\mathtt{ind_0}</tex>
 +
|-align="center"
 +
| <tex>1</tex>||<tex>2</tex>||<tex>5</tex>||<tex>6</tex>||<tex>8</tex>
 
|}
 
|}
 
|}
 
|}
 +
 +
Получаем ключи элементов в <tex>C_2^s</tex> и находим перестановку ключей в порядке исходной последовательности, действуя перестановкой <tex>\xi_2</tex>:
  
 
{|
 
{|
 
| ||
 
| ||
 
{| class="wikitable" style="text-align:center"
 
{| class="wikitable" style="text-align:center"
! colspan="6"|Второй блок
+
! colspan="6"|Сортированный
 
|-
 
|-
| <tex>\pi</tex> ||<tex>1</tex>||<tex>2</tex>||<tex>12</tex>||<tex>6</tex>||<tex>5</tex>
+
| <tex>\pi</tex> ||<tex>1</tex>||<tex>2</tex>||<tex>5</tex>||<tex>6</tex>||<tex>12</tex>
 
|-
 
|-
| key ||<tex>1</tex>||<tex>2</tex>||<tex>8</tex>||<tex>6</tex>||<tex>5</tex>
+
| <tex>key</tex> ||<tex>1</tex>||<tex>2</tex>||<tex>5</tex>||<tex>6</tex>||<tex>8</tex>
 
|}
 
|}
 
| ||
 
| ||
 
{| class="wikitable" style="text-align:center"
 
{| class="wikitable" style="text-align:center"
! colspan="6"|Cортированный
+
! colspan="6"|Второй блок
 +
|-
 +
| <tex>\pi</tex> ||<tex>1</tex>||<tex>2</tex>||<tex>12</tex>||<tex>6</tex>||<tex>5</tex>
 
|-
 
|-
| <tex>\pi</tex> ||<tex>1</tex>||<tex>2</tex>||<tex>5</tex>||<tex>6</tex>||<tex>12</tex>
+
| <tex>key</tex> ||<tex>1</tex>||<tex>2</tex>||<tex>8</tex>||<tex>6</tex>||<tex>5</tex>
 
|-
 
|-
| key ||<tex>1</tex>||<tex>2</tex>||<tex>5</tex>||<tex>6</tex>||<tex>8</tex>
+
| <tex>\xi_2</tex> ||<tex>1</tex>||<tex>2</tex>||<tex>5</tex>||<tex>4</tex>||<tex>3</tex>
 
|}
 
|}
 
|}
 
|}
Строка 329: Строка 344:
 
Обновляем ключи в очереди:
 
Обновляем ключи в очереди:
 
{| class="wikitable" style="center" style="background: #ffffcc"
 
{| class="wikitable" style="center" style="background: #ffffcc"
! <tex>B_1</tex>||<tex>B_2</tex>||<tex>B_3</tex>||<tex>\pi</tex>
+
! <tex>B_1</tex>||<tex>B_2</tex>||<tex>B_3</tex>||<tex>key</tex>
 
|-align="center"  
 
|-align="center"  
 
| style="background:#FFC9C9"| <tex>3</tex> ||  ||  || style="background: #CFCFFF"| <tex>3</tex>
 
| style="background:#FFC9C9"| <tex>3</tex> ||  ||  || style="background: #CFCFFF"| <tex>3</tex>
Строка 364: Строка 379:
 
Восстанавливаем элементы <tex>B: \{1, 2, 5, 8\}</tex> из <tex>\mathtt{merged}: \{1, 2, 3, 4, 5, 6, 8, 12\}</tex>: <tex>\{1, 2, 5, 12\}</tex>.
 
Восстанавливаем элементы <tex>B: \{1, 2, 5, 8\}</tex> из <tex>\mathtt{merged}: \{1, 2, 3, 4, 5, 6, 8, 12\}</tex>: <tex>\{1, 2, 5, 12\}</tex>.
  
Сливаем <tex>C_3^s</tex> и восстановленные элементы из <tex>B</tex>:
+
Сливаем <tex>C_3^s</tex> и восстановленные элементы из <tex>B</tex> и присваиваем ключи элементам:
 
{|
 
{|
 
| ||
 
| ||
Строка 380: Строка 395:
 
| <tex>7</tex>||<tex>11</tex>
 
| <tex>7</tex>||<tex>11</tex>
 
|}
 
|}
 +
|}
 +
 +
{|
 
| ||
 
| ||
 
{| class="wikitable" style="center"
 
{| class="wikitable" style="center"
 
|-align="center"
 
|-align="center"
| colspan="6"|<tex>\mathtt{merged}</tex>
+
! colspan="7"|<tex>\mathtt{merged}</tex>
 
|-align="center"
 
|-align="center"
|!\pi|<tex>1</tex>||<tex>2</tex>||<tex>5</tex>||<tex>7</tex>||<tex>11</tex>||<tex>12</tex>
+
|<tex>\pi</tex>||<tex>1</tex>||<tex>2</tex>||<tex>5</tex>||<tex>7</tex>||<tex>11</tex>||<tex>12</tex>
 
|-align="center"
 
|-align="center"
|!key|<tex>1</tex>||<tex>2</tex>||<tex>3</tex>||<tex>4</tex>||<tex>5</tex>||<tex>6</tex>
+
|<tex>key</tex>||<tex>1</tex>||<tex>2</tex>||<tex>3</tex>||<tex>4</tex>||<tex>5</tex>||<tex>6</tex>
 
|}
 
|}
 +
| ||
 +
{| class="wikitable" style="center"
 +
|-align="center"
 +
| colspan="4"|<tex>\mathtt{ind_1}</tex>
 +
|-align="center"
 +
| <tex>1</tex>||<tex>2</tex>||<tex>3</tex>||<tex>6</tex>
 
|}
 
|}
 +
| ||
 +
{| class="wikitable" style="center"
 +
|-align="center"
 +
| colspan="2"|<tex>\mathtt{ind_0}</tex>
 +
|-align="center"
 +
| <tex>4</tex>||<tex>5</tex>
 +
|}
 +
|}
 +
 +
Получаем ключи элементов в <tex>C_3^s</tex> и находим перестановку ключей в порядке исходной последовательности, действуя перестановкой <tex>\xi_3</tex>:
  
 
{|
 
{|
Строка 400: Строка 434:
 
| <tex>\pi</tex> ||<tex>7</tex>||<tex>11</tex>
 
| <tex>\pi</tex> ||<tex>7</tex>||<tex>11</tex>
 
|-
 
|-
| key ||<tex>4</tex>||<tex>5</tex>
+
| <tex>key</tex> ||<tex>4</tex>||<tex>5</tex>
 
|}
 
|}
 
| ||
 
| ||
Строка 408: Строка 442:
 
| <tex>\pi</tex> ||<tex>7</tex>||<tex>11</tex>
 
| <tex>\pi</tex> ||<tex>7</tex>||<tex>11</tex>
 
|-
 
|-
| key ||<tex>4</tex>||<tex>5</tex>
+
| <tex>key</tex> ||<tex>4</tex>||<tex>5</tex>
 +
|-
 +
| <tex>\xi_3</tex> ||<tex>1</tex>||<tex>2</tex>
 
|}
 
|}
 
|}
 
|}
Строка 414: Строка 450:
 
Обновление старых ключей:
 
Обновление старых ключей:
 
{| class="wikitable" style="center" style="background: #ffffcc"
 
{| class="wikitable" style="center" style="background: #ffffcc"
! <tex>B_1</tex>||<tex>B_2</tex>||<tex>B_3</tex>||<tex>B_4</tex>||<tex>\pi</tex>
+
! <tex>B_1</tex>||<tex>B_2</tex>||<tex>B_3</tex>||<tex>B_4</tex>||<tex>key</tex>
 
|-align="center"  
 
|-align="center"  
 
| style="background:#FFC9C9"| <tex>1</tex> ||  ||  ||  || style="background: #CFCFFF"| <tex>1</tex>
 
| style="background:#FFC9C9"| <tex>1</tex> ||  ||  ||  || style="background: #CFCFFF"| <tex>1</tex>
Строка 457: Строка 493:
 
|}
 
|}
  
===Оценка времени работы===
+
=== Нахождение размера блоков ===
Так как размер списка <tex>\mathtt{merged}</tex> не больше <tex>2m</tex>, а количество блоков всего <tex>\lceil n/m \rceil</tex>. То общее количество присваиваний новых ключей элементам последовательности, также как и количество операций слияния списков, не больше <tex>2cm\cdot\dfrac{n}{m}=O(n)</tex>, где c — некоторая константа. Каждая операция с приоритетной очередью требует <tex>O(\log \log m)</tex> времени, так как элементы в <tex>B</tex> не больше <tex>2m</tex>.
 
  
 
Рассмотрим последовательность <tex>\{m_0,~m_1,~m_2,~\dots\}</tex>, где <tex> m_{i+1} = m_i ^{\operatorname{log}m_i} = 2^{\operatorname{log}^2m_i}</tex>, <tex>m_0</tex> — некоторое значение, меньшее <tex>k</tex>.
 
Рассмотрим последовательность <tex>\{m_0,~m_1,~m_2,~\dots\}</tex>, где <tex> m_{i+1} = m_i ^{\operatorname{log}m_i} = 2^{\operatorname{log}^2m_i}</tex>, <tex>m_0</tex> — некоторое значение, меньшее <tex>k</tex>.
  
 
Будем последовательно для элементов этой последовательности запускать алгоритм, представленный выше. Если размер очереди <tex>B</tex> становится больше <tex>m_i</tex>, то условие <tex>m \geqslant k</tex> перестает выполняться, тогда останавливаем алгоритм и переходим к следующему значению <tex>m_{i+1}</tex>.
 
Будем последовательно для элементов этой последовательности запускать алгоритм, представленный выше. Если размер очереди <tex>B</tex> становится больше <tex>m_i</tex>, то условие <tex>m \geqslant k</tex> перестает выполняться, тогда останавливаем алгоритм и переходим к следующему значению <tex>m_{i+1}</tex>.
 +
 +
Для каждого <tex>m_i</tex> размер списка <tex>\mathtt{merged}</tex> не больше <tex>2m_i</tex>, а количество блоков всего <tex>\lceil n/m_i \rceil</tex>. То общее количество присваиваний новых ключей элементам последовательности, также как и количество операций слияния списков, не больше <tex>2cm_i\cdot\dfrac{n}{m_i}=O(n)</tex>, где c — некоторая константа. Каждая операция с приоритетной очередью требует <tex>O(\log \log m_i)</tex> времени, так как элементы в <tex>B</tex> не больше <tex>2m_i</tex>.
  
 
Таким образом, время работы запущенного алгоритма для каждого <tex>m_i</tex> — <tex>O(n \log \log {m_i})</tex>. Когда найдётся первое <tex>m_j:m_j\geqslant k</tex>, то алгоритм успешно завершится.  
 
Таким образом, время работы запущенного алгоритма для каждого <tex>m_i</tex> — <tex>O(n \log \log {m_i})</tex>. Когда найдётся первое <tex>m_j:m_j\geqslant k</tex>, то алгоритм успешно завершится.  
Строка 470: Строка 507:
 
<tex>\operatorname{log}\operatorname{log}m_j = 2^{j-i}\operatorname{log}\operatorname{log}m_i</tex>
 
<tex>\operatorname{log}\operatorname{log}m_j = 2^{j-i}\operatorname{log}\operatorname{log}m_i</tex>
  
Общее время работы алгоритма для всех обработанных значений <tex>m_i</tex> — <tex>O(n(\sum_{i=0}\limits^{j}{2^{-(i-1)}})\log \log m_i)</tex>. Заметим, что <tex>m_i < k^{\operatorname{log}k}</tex>, так как в противном случае <tex>m_{i-1} > k</tex>, что противоречит тому, что <tex>m_i</tex> — первый из тех, которые больше <tex>k</tex>. Следовательно, <tex>\operatorname{log}\operatorname{log}m_i < 2\operatorname{log}\operatorname{log}k \</tex>.
+
Общее время работы алгоритма для всех обработанных значений <tex>m_i</tex> — <tex>O(n(\sum_{i=0}\limits^{j}{2^{-(i-1)}})\log \log m_i) = O(n\operatorname{log}\operatorname{log}m_i)</tex>. Заметим, что <tex>m_i < k^{\operatorname{log}k}</tex>, так как в противном случае <tex>m_{i-1} > k</tex>, что противоречит тому, что <tex>m_i</tex> — первый из тех, которые больше <tex>k</tex>. Следовательно, <tex>\operatorname{log}\operatorname{log}m_i < 2\operatorname{log}\operatorname{log}k \</tex>.
  
 
Получаем время работы <tex>O(n\operatorname{log}\operatorname{log}k)</tex>.
 
Получаем время работы <tex>O(n\operatorname{log}\operatorname{log}k)</tex>.

Текущая версия на 21:42, 19 января 2018

Задача:
Дана перестановка [math]\pi[/math] множества [math]~\{1, 2,~\dots,~n\}[/math]. Требуется найти НВП [math]\pi[/math] за [math]O(n\operatorname{log}\operatorname{log}k)[/math], где [math]k[/math] — длина НВП.


Task.jpg

Алгоритм за O(n log log n)

Нахождение длины НВП

Основная идея

Пусть [math]\{\pi_1,\pi_2,~\dots,~\pi_n\}[/math] — входная перестановка.

Будем последовательно обрабатывать элементы в порядке [math]\pi_1, \pi_2,~\dots,~\pi_n\colon[/math]

Для каждой длины [math]l = 1, 2,~\dots,~n[/math] предполагаемой НВП находим наименьший элемент, который может быть последним в возрастающей подпоследовательности длины [math]l[/math] и запишем его в массив [math]B_l[/math]. Будем называть его наилучшим элементом для длины [math]l[/math].

  • Если [math]\pi_i[/math] больше каждого элемента [math]B[/math], вычисленного для подпоследовательности [math]\pi_1, \pi_2,~\dots~,\pi_{i-1}[/math], тогда с ним можно сделать возрастающую подпоследовательность максимальной длины из уже рассмотренных, в которой он будет последним элементом. Значит, записываем его в конец [math]B[/math].
  • Иначе [math]\pi_i[/math] будет наилучшим элементом для уже существующей длины и сможет улучшить только один элемент в [math]B[/math], тогда мы находим наименьшее [math]k\colon B_k \gt \pi_i[/math] и заменяем [math]B_k[/math] элементом [math]\pi_i[/math].

Следует отметить, что полученный массив также образует возрастающую последовательность, на котором мы должны выполнять операции [math]\mathrm{insert}, \mathrm{next}, \mathrm{delete}[/math], соответственно целесообразно использовать приоритетную очередь, реализованную через Дерево ван Эмде Боаса. Так как данная структура данных производит описанные операции за [math]O(\operatorname{log} k)[/math], где k — количество бит чисел, которые позволяет хранить дерево, то полученный алгоритм работает за [math]O(n\operatorname{log}\operatorname{log} n)[/math], потому что все элементы последовательности не превосходят n.

Пример

Типы операций

  • Добавление элемента, который больше всех предыдущих:

Operation1.jpg

  • Замещение элемента более подходящим, т.е. добавление немаксимального элемента:

Operation2 1.jpg [math]\longrightarrow[/math] Operation2 2.jpg

Пример последовательности

[math]\pi_1[/math] [math]\pi_2[/math] [math]\pi_3[/math] [math]\pi_4[/math] [math]\pi_5[/math] [math]\pi_6[/math] [math]\pi_7[/math] [math]\pi_8[/math] [math]\pi_9[/math] [math]\pi_{10}[/math] [math]\pi_{11}[/math] [math]\pi_{12}[/math]
[math]9[/math] [math]3[/math] [math]10[/math] [math]4[/math] [math]8[/math] [math]1[/math] [math]2[/math] [math]12[/math] [math]6[/math] [math]5[/math] [math]7[/math] [math]11[/math]

Состояние очереди при каждом добавлении

[math]B_1[/math] [math]B_2[/math] [math]B_3[/math] [math]B_4[/math] [math]B_5[/math] [math]~\pi_i~[/math]
[math]9[/math] [math]9[/math]
[math]3[/math] [math]3[/math]
[math]3[/math] [math]10[/math] [math]10[/math]
[math]3[/math] [math]4[/math] [math]4[/math]
[math]3[/math] [math]4[/math] [math]8[/math] [math]8[/math]
[math]1[/math] [math]4[/math] [math]8[/math] [math]1[/math]
[math]1[/math] [math]2[/math] [math]8[/math] [math]2[/math]
[math]1[/math] [math]2[/math] [math]8[/math] [math]12[/math] [math]12[/math]
[math]1[/math] [math]2[/math] [math]6[/math] [math]12[/math] [math]6[/math]
[math]1[/math] [math]2[/math] [math]5[/math] [math]12[/math] [math]5[/math]
[math]1[/math] [math]2[/math] [math]5[/math] [math]7[/math] [math]7[/math]
[math]1[/math] [math]2[/math] [math]5[/math] [math]7[/math] [math]11[/math] [math]11[/math]

Псевдокод

int LIS([math]\pi[/math][n])
    PriorityQueue B // рабочая приоритетная очередь
    int k = 0       // длина НВП
    for i = 1 to n
        x = [math]\pi[/math][i]
        // в любом случае добавляем в очередь очередной элемент
        // устаревшие будем удалять
        B.insert(x)
        if [math]\exists[/math] B.next(x)
            // добавленный элемент — не максимальный
            // удаляем следующее за x значение 
            B.delete(B.next(x))
        else
            // добавленный элемент — максимальный
            // предыдущие значения не трогаем, очередь увеличилась
            k = k + 1           
    return k

Расширение алгоритма до нахождения НВП

Основная идея

Будем запоминать пары: для каждого элемента записываем его "предшественника".

Тогда, пройдя по предшественникам, начиная с последнего элемента очереди [math]B[/math], мы можем восстановить НВП.

Общий вид алгоритма

[math]B_1[/math] [math]B_2[/math] [math]B_3[/math] [math]B_4[/math] [math]B_5[/math] [math]~\pi_i~[/math]
[math]9[/math] [math]9[/math]
[math]3[/math] [math]3[/math]
[math]3[/math] [math]10[/math] [math]10[/math]
[math]3[/math] [math]4[/math] [math]4[/math]
[math]3[/math] [math]4[/math] [math]8[/math] [math]8[/math]
[math]1[/math] [math]4[/math] [math]8[/math] [math]1[/math]
[math]1[/math] [math]2[/math] [math]8[/math] [math]2[/math]
[math]1[/math] [math]2[/math] [math]8[/math] [math]12[/math] [math]12[/math]
[math]1[/math] [math]2[/math] [math]6[/math] [math]12[/math] [math]6[/math]
[math]1[/math] [math]2[/math] [math]5[/math] [math]12[/math] [math]5[/math]
[math]1[/math] [math]2[/math] [math]5[/math] [math]7[/math] [math]7[/math]
[math]1[/math] [math]2[/math] [math]5[/math] [math]7[/math] [math]11[/math] [math]11[/math]
predecessor
[math]1[/math] [math]2[/math] [math]3[/math] [math]4[/math] [math]5[/math] [math]6[/math] [math]7[/math] [math]8[/math] [math]9[/math] [math]10[/math] [math]11[/math] [math]12[/math]
[math]1[/math] [math]3[/math] [math]2[/math] [math]2[/math] [math]5[/math] [math]4[/math] [math]3[/math] [math]7[/math] [math]8[/math]

Псевдокод

int[] LIS([math]\pi[/math][n])
    PriorityQueue B
    int k = 0
    int predecessor[n] // резервируем [math]n[/math] позиций
    for i = 1 to n
        x = [math]\pi[/math][i]
        B.insert(x)
        predecessor[x] = B.prev(x)
        if [math]\exists[/math] B.next(x)
            B.delete(B.next(x))
        else
            k = k + 1
    // по цепочке от последнего элемента 
    // восстанавливаем НВП
    int result[k]
    int cur = B.max
    for i = k - 1 downto 0
        result[i] = cur
        cur = predecessor[cur]
    return result

Оптимизация до O(n log log k)

Основная идея

Чтобы Дерево ван Эмде Боаса выполняло операции за [math]O(\operatorname{log}\operatorname{log}k)[/math], необходимо алфавит обрабатываемых значений уменьшить до [math]O(k)[/math].

Предположим, мы знаем такое приближение числа [math]k[/math] числом [math]m: m \geqslant k[/math]. Мы обсудим, как найти такое [math]m[/math] позже.

Во время обработки ключей элементов описанный выше алгоритм [math]\mathrm{LIS}[/math] работает только с очередью [math]B[/math] и не зависит от предыдущих элементов последовательности, которые не находятся в очереди. Поэтому, если мы разобьем всю последовательность на блоки из [math]m[/math] элементов (последний блок может быть меньше), и нам удастся обрабатывать каждый как перестановку из [math]m[/math] элементов, сохраняя очередь [math]B[/math] для вычисленных ранее блоков, то мы получим асимптотическое время [math]O(n \operatorname{log} \operatorname{log} (k + m))[/math], а так как [math]m \geqslant k[/math], то [math]O(n \operatorname{log} \operatorname{log} m)[/math]. (Мы будем обрабатывать блоки последовательно, т.е. с предыдущего блока у нас может остаться [math]k[/math] значений в очереди, которые дополняются [math]m[/math] значениями очередного блока — получаем верхнее ограничение в [math]k + m[/math] обрабатываемых возможных значений.)

Деление на блоки

Последовательность [math]S[/math] делится на блоки [math]C_j,~j=1,~\dots,~\lceil\frac{n}{m}\rceil[/math]: [math]C_j=(\pi_{(j-1)m+1},\pi_{(j-1)m+2},~\dots~,\pi_{(j-1)m+m)})[/math]

Обозначим за [math]C_j^s[/math] отсортированный блок [math]C_j[/math]. Отсортированные и неотсортированные блоки будем хранить в памяти.

Цифровая сортировка каждого блока отдельно будет давать нам время работы [math]O \left(\dfrac{n}{m}n \right) = O \left(\dfrac{n^2}{m} \right)[/math]. Дополним каждый элемент [math]\pi[/math] номером блока, в котором он находится и смещением в этом блоке. Теперь, рассматривая номер блока как старший разряд, элемент как младший разряд (по смещению внутри блока не сортируем), можно сортировать цифровой сортировкой за линейное время [math]O(n)[/math], потому что значения элементов и номера блоков не превосходят [math]n[/math].

Перестановка смещений, образованная в сортированном блоке есть не что иное, как обратная перестановка перестановки [math]\xi[/math], элементы которой соотносятся между собой как элементы исходного блока. Т.е. если элемент [math]\pi[/math] находится в исходной перестановке в блоке [math]C_j[/math] на позиции [math]i[/math], то в блоке [math]C_j^s[/math] он на позиции [math]\xi_i[/math].

Пример

Предположим, что [math]m=5[/math]. Исходно получаем:

Блок [math]1[/math] [math]1[/math] [math]1[/math] [math]1[/math] [math]1[/math] [math]2[/math] [math]2[/math] [math]2[/math] [math]2[/math] [math]2[/math] [math]3[/math] [math]3[/math]
[math]\pi[/math] [math]9[/math] [math]3[/math] [math]10[/math] [math]4[/math] [math]8[/math] [math]1[/math] [math]2[/math] [math]12[/math] [math]6[/math] [math]5[/math] [math]7[/math] [math]11[/math]
Смещение [math]1[/math] [math]2[/math] [math]3[/math] [math]4[/math] [math]5[/math] [math]1[/math] [math]2[/math] [math]3[/math] [math]4[/math] [math]5[/math] [math]1[/math] [math]2[/math]

После сортировки:

Блок [math]1[/math] [math]1[/math] [math]1[/math] [math]1[/math] [math]1[/math] [math]2[/math] [math]2[/math] [math]2[/math] [math]2[/math] [math]2[/math] [math]3[/math] [math]3[/math]
[math]\pi[/math] [math]3[/math] [math]4[/math] [math]8[/math] [math]9[/math] [math]10[/math] [math]1[/math] [math]2[/math] [math]5[/math] [math]6[/math] [math]12[/math] [math]7[/math] [math]11[/math]
Смещение [math]2[/math] [math]4[/math] [math]5[/math] [math]1[/math] [math]3[/math] [math]1[/math] [math]2[/math] [math]5[/math] [math]4[/math] [math]3[/math] [math]1[/math] [math]2[/math]

Обратные перестановки ([math]\xi[/math]):

[math]1[/math] [math]2[/math] [math]3[/math]
[math]4[/math] [math]1[/math] [math]5[/math] [math]2[/math] [math]3[/math] [math]1[/math] [math]2[/math] [math]5[/math] [math]4[/math] [math]3[/math] [math]1[/math] [math]2[/math]

Обработка блока

Обрабатывая блок, каждому элементу [math]x[/math] внутри этого блока взаимно однозначно сопоставим ключ [math]y = \mathtt{key}(x);~x=\mathtt{elt}(y)[/math] так, чтобы их значения находились в промежутке [math]\{1,2,\dots,2m\}[/math]. Очередь [math]B[/math] будет работать непосредственно с ключами элементов.

Работая с блоком [math]C_j[/math], будем сливать элементы, ключи которых находятся в очереди [math]B[/math], с [math]C_j^s[/math] в список [math]\mathtt{merged}[/math]. Поскольку мы предположили, что [math]m\geqslant k[/math], то количество ключей в [math]B[/math] не больше [math]m[/math], тогда длина [math]\mathtt{merged}[/math] не больше [math]2m[/math], что позволяет однозначно определить ключи на множестве [math]\{1,2,\dots,2m\}[/math]. Как было замечено ранее, элементы, чьи ключи находятся в [math]B[/math], располагаются в возрастающем порядке, поэтому возможно производить тривиальную операцию слияния за [math]O(m)[/math].

В итоге, получим отсортированный список [math]\mathtt{merged}[/math]. Сопоставим ключ каждому элементу как его позицию в этом списке, тогда справедливы утверждения, что [math]\mathtt{elt}(x)=\mathtt{merged}[x][/math] и [math](\pi_{i}\lt \pi_{k} \Longleftrightarrow \mathtt{key}(\pi_{i})\lt \mathtt{key}(\pi_{k}))[/math], где [math]\pi_{i},\pi_{k}\in \mathtt{merged}[/math], поэтому любая возрастающая последовательность ключей элементов будет соответствовать возрастающей последовательности элементов. Таким образом, приоритетная очередь сможет корректно работать с ключами элементов.

Находим последовательность ключей, соответствующую элементам блока [math]C_j^s[/math]. Действуя на эту последовательность перестановкой [math]\xi_j[/math], получаем последовательность ключей в порядке исходного блока.

Оставшиеся ключи, которые входят в [math]\mathtt{merged}[/math], но не являются ключами элементов в обрабатываемом блоке, будут ключами элементов из очереди [math]B[/math]. Обновляем очередь [math]B[/math] этими ключами.

Затем запускаем алгоритм [math]\mathrm{LIS}[/math], для ключей элементов [math]C_j[/math] в порядке исходной последовательности.

В итоге, обработка блока делится на следующие этапы:

  • Достаем из очереди [math]B[/math] ключи [math]x[/math], конвертируем их в элементы [math]\mathtt{elt}(x)[/math] и кладём в список [math]\mathtt{elems}[/math].
  • Сливаем элементы в [math]\mathtt{elems}[/math] со следующим отсортированным блоком [math]C_j^s[/math] в список [math]\mathtt{merged}[/math], генерируя два вспомогательных массива [math]\mathtt{ind_0}[/math] и [math]\mathtt{ind_1}[/math], хранящих индексы элементов списков [math]C_j^s[/math] и [math]\mathtt{elems}[/math] соответственно в списке [math]\mathtt{merged}[/math].
  • Действуя на последовательность ключей в списке [math]\mathtt{ind_0}[/math] перестановкой [math]\xi_j[/math] получим ключи в порядке исходной последовательности.
  • Вставляем в [math]B[/math] новые ключи элементов списка [math]\mathtt{elems}[/math] (элементы [math]\mathtt{ind_1}[/math]).
  • Обрабатываем ключи элементов блока в порядке исходной последовательности с помощью алгоритма [math]\mathrm{LIS}[/math]. Для восстановления НВП также используем массив "предшественников", который будет работать с соответствующими ключам элементами [math]\mathtt{elt}(x)[/math].

Пример

Первый блок

Так как очередь [math]B[/math] в начале пуста, то [math]\mathtt{merged}=C_1^s[/math]. Присвоим ключи элементам в списке [math]\mathtt{merged}[/math] как их индексы в этом списке. Восстанавливаем последовательность ключей элементов в порядке исходной последовательности, действуя перестановкой смещений [math]\xi_1[/math] на последовательность ключей в отсортированном блоке.

Сортированный
[math]\pi[/math] [math]3[/math] [math]4[/math] [math]8[/math] [math]9[/math] [math]10[/math]
[math]key[/math] [math]1[/math] [math]2[/math] [math]3[/math] [math]4[/math] [math]5[/math]
Первый блок
[math]\pi[/math] [math]9[/math] [math]3[/math] [math]10[/math] [math]4[/math] [math]8[/math]
[math]key[/math] [math]4[/math] [math]1[/math] [math]5[/math] [math]2[/math] [math]3[/math]
[math]\xi_1[/math] [math]4[/math] [math]1[/math] [math]5[/math] [math]2[/math] [math]3[/math]

Обработка блока с помощью алгоритма [math]\mathrm{LIS}[/math].

[math]B_1[/math] [math]B_2[/math] [math]B_3[/math] [math]key[/math] [math]\pi[/math]
[math]4[/math] [math]4[/math] [math]9[/math]
[math]1[/math] [math]1[/math] [math]3[/math]
[math]1[/math] [math]5[/math] [math]5[/math] [math]10[/math]
[math]1[/math] [math]2[/math] [math]2[/math] [math]4[/math]
[math]1[/math] [math]2[/math] [math]3[/math] [math]3[/math] [math]8[/math]

В результате получаем

[math]B: \{1, 2, 3\}[/math]

[math]\mathtt{merged}: \{3,4,8,9,10\}[/math]


Второй блок

Восстанавливаем элементы [math]B: \{1, 2, 3\}[/math] из [math]\mathtt{merged}: \{3, 4, 8, 9, 10\}[/math]: [math]\{3, 4, 8\}[/math].

Сливаем [math]C_2^s[/math] и восстановленные элементы из [math]B[/math] в [math]\mathtt{merged}[/math] и присваиваем элементам ключи как индексы элементов в полученном списке:

[math]B[/math]
[math]3[/math] [math]4[/math] [math]8[/math]
[math]C_2^s[/math]
[math]1[/math] [math]2[/math] [math]5[/math] [math]6[/math] [math]12[/math]
[math]\mathtt{merged}[/math]
[math]\pi[/math] [math]1[/math] [math]2[/math] [math]3[/math] [math]4[/math] [math]5[/math] [math]6[/math] [math]8[/math] [math]12[/math]
[math]key[/math] [math]1[/math] [math]2[/math] [math]3[/math] [math]4[/math] [math]5[/math] [math]6[/math] [math]7[/math] [math]8[/math]
[math]\mathtt{ind_1}[/math]
[math]3[/math] [math]4[/math] [math]7[/math]
[math]\mathtt{ind_0}[/math]
[math]1[/math] [math]2[/math] [math]5[/math] [math]6[/math] [math]8[/math]

Получаем ключи элементов в [math]C_2^s[/math] и находим перестановку ключей в порядке исходной последовательности, действуя перестановкой [math]\xi_2[/math]:

Сортированный
[math]\pi[/math] [math]1[/math] [math]2[/math] [math]5[/math] [math]6[/math] [math]12[/math]
[math]key[/math] [math]1[/math] [math]2[/math] [math]5[/math] [math]6[/math] [math]8[/math]
Второй блок
[math]\pi[/math] [math]1[/math] [math]2[/math] [math]12[/math] [math]6[/math] [math]5[/math]
[math]key[/math] [math]1[/math] [math]2[/math] [math]8[/math] [math]6[/math] [math]5[/math]
[math]\xi_2[/math] [math]1[/math] [math]2[/math] [math]5[/math] [math]4[/math] [math]3[/math]

Обновляем ключи в очереди:

[math]B_1[/math] [math]B_2[/math] [math]B_3[/math] [math]key[/math]
[math]3[/math] [math]3[/math]
[math]3[/math] [math]4[/math] [math]4[/math]
[math]3[/math] [math]4[/math] [math]7[/math] [math]7[/math]

запускаем [math]\mathrm{LIS}[/math] для блока:

[math]B_1[/math] [math]B_2[/math] [math]B_3[/math] [math]B_4[/math] [math]key[/math] [math]\pi[/math]
[math]1[/math] [math]4[/math] [math]7[/math] [math]1[/math] [math]1[/math]
[math]1[/math] [math]2[/math] [math]7[/math] [math]2[/math] [math]2[/math]
[math]1[/math] [math]2[/math] [math]7[/math] [math]8[/math] [math]8[/math] [math]12[/math]
[math]1[/math] [math]2[/math] [math]6[/math] [math]8[/math] [math]6[/math] [math]6[/math]
[math]1[/math] [math]2[/math] [math]5[/math] [math]8[/math] [math]5[/math] [math]5[/math]

В результате получаем:

[math]B: \{1, 2, 5, 8\}[/math]

[math]\mathtt{merged}: \{1,2,3,4,5,6,8,12\}[/math]


Третий блок

Восстанавливаем элементы [math]B: \{1, 2, 5, 8\}[/math] из [math]\mathtt{merged}: \{1, 2, 3, 4, 5, 6, 8, 12\}[/math]: [math]\{1, 2, 5, 12\}[/math].

Сливаем [math]C_3^s[/math] и восстановленные элементы из [math]B[/math] и присваиваем ключи элементам:

[math]B[/math]
[math]1[/math] [math]2[/math] [math]5[/math] [math]12[/math]
[math]C_3^s[/math]
[math]7[/math] [math]11[/math]
[math]\mathtt{merged}[/math]
[math]\pi[/math] [math]1[/math] [math]2[/math] [math]5[/math] [math]7[/math] [math]11[/math] [math]12[/math]
[math]key[/math] [math]1[/math] [math]2[/math] [math]3[/math] [math]4[/math] [math]5[/math] [math]6[/math]
[math]\mathtt{ind_1}[/math]
[math]1[/math] [math]2[/math] [math]3[/math] [math]6[/math]
[math]\mathtt{ind_0}[/math]
[math]4[/math] [math]5[/math]

Получаем ключи элементов в [math]C_3^s[/math] и находим перестановку ключей в порядке исходной последовательности, действуя перестановкой [math]\xi_3[/math]:

Третий блок
[math]\pi[/math] [math]7[/math] [math]11[/math]
[math]key[/math] [math]4[/math] [math]5[/math]
Cортированный
[math]\pi[/math] [math]7[/math] [math]11[/math]
[math]key[/math] [math]4[/math] [math]5[/math]
[math]\xi_3[/math] [math]1[/math] [math]2[/math]

Обновление старых ключей:

[math]B_1[/math] [math]B_2[/math] [math]B_3[/math] [math]B_4[/math] [math]key[/math]
[math]1[/math] [math]1[/math]
[math]1[/math] [math]2[/math] [math]2[/math]
[math]1[/math] [math]2[/math] [math]3[/math] [math]3[/math]
[math]1[/math] [math]2[/math] [math]3[/math] [math]6[/math] [math]6[/math]

запускаем [math]\mathrm{LIS}[/math] для блока:

[math]B_1[/math] [math]B_2[/math] [math]B_3[/math] [math]B_4[/math] [math]B_5[/math] [math]key[/math] [math]\pi[/math]
[math]1[/math] [math]2[/math] [math]3[/math] [math]4[/math] [math]4[/math] [math]7[/math]
[math]1[/math] [math]2[/math] [math]3[/math] [math]4[/math] [math]5[/math] [math]5[/math] [math]11[/math]

Результат завершения алгоритма:

[math]B: \{1, 2, 3, 4, 5\}[/math]

[math]\mathtt{merged}: \{1,2,5,7,11,12\}[/math]

Получаем, что длина НВП — [math]5[/math], и НВП оканчивается на [math]\mathtt{merged}[5]=11[/math].

Восстановление НВП

[math]\mathtt{predecessor}[/math]
[math]1[/math] [math]2[/math] [math]3[/math] [math]4[/math] [math]5[/math] [math]6[/math] [math]7[/math] [math]8[/math] [math]9[/math] [math]10[/math] [math]11[/math] [math]12[/math]
[math]1[/math] [math]3[/math] [math]2[/math] [math]2[/math] [math]5[/math] [math]4[/math] [math]3[/math] [math]7[/math] [math]8[/math]

Начинаем восстановление с [math]\mathtt{merged}[5] = 11[/math]:

обратный порядок [math]11[/math] [math]7[/math] [math]5[/math] [math]2[/math] [math]1[/math]
НВП [math]1[/math] [math]2[/math] [math]5[/math] [math]7[/math] [math]11[/math]

Нахождение размера блоков

Рассмотрим последовательность [math]\{m_0,~m_1,~m_2,~\dots\}[/math], где [math] m_{i+1} = m_i ^{\operatorname{log}m_i} = 2^{\operatorname{log}^2m_i}[/math], [math]m_0[/math] — некоторое значение, меньшее [math]k[/math].

Будем последовательно для элементов этой последовательности запускать алгоритм, представленный выше. Если размер очереди [math]B[/math] становится больше [math]m_i[/math], то условие [math]m \geqslant k[/math] перестает выполняться, тогда останавливаем алгоритм и переходим к следующему значению [math]m_{i+1}[/math].

Для каждого [math]m_i[/math] размер списка [math]\mathtt{merged}[/math] не больше [math]2m_i[/math], а количество блоков всего [math]\lceil n/m_i \rceil[/math]. То общее количество присваиваний новых ключей элементам последовательности, также как и количество операций слияния списков, не больше [math]2cm_i\cdot\dfrac{n}{m_i}=O(n)[/math], где c — некоторая константа. Каждая операция с приоритетной очередью требует [math]O(\log \log m_i)[/math] времени, так как элементы в [math]B[/math] не больше [math]2m_i[/math].

Таким образом, время работы запущенного алгоритма для каждого [math]m_i[/math][math]O(n \log \log {m_i})[/math]. Когда найдётся первое [math]m_j:m_j\geqslant k[/math], то алгоритм успешно завершится.

[math]\operatorname{log}\operatorname{log}m_{i+1} = \operatorname{log}\operatorname{log}2^{\operatorname{log}^2m_i} = \operatorname{log}\operatorname{log}^2m_i = 2\operatorname{log}\operatorname{log}m_i[/math].

[math]\operatorname{log}\operatorname{log}m_j = 2^{j-i}\operatorname{log}\operatorname{log}m_i[/math]

Общее время работы алгоритма для всех обработанных значений [math]m_i[/math][math]O(n(\sum_{i=0}\limits^{j}{2^{-(i-1)}})\log \log m_i) = O(n\operatorname{log}\operatorname{log}m_i)[/math]. Заметим, что [math]m_i \lt k^{\operatorname{log}k}[/math], так как в противном случае [math]m_{i-1} \gt k[/math], что противоречит тому, что [math]m_i[/math] — первый из тех, которые больше [math]k[/math]. Следовательно, [math]\operatorname{log}\operatorname{log}m_i \lt 2\operatorname{log}\operatorname{log}k \[/math].

Получаем время работы [math]O(n\operatorname{log}\operatorname{log}k)[/math].

См. также

Источники информации