Участник:Artem.ustinov/НВП — различия между версиями

Версия 21:12, 30 декабря 2017

Задача:

Дана перестановка множества. Требуется найти НВП за , где — длина НВП.

Содержание

1 Алгоритм за O(n log log n)
- 1.1 Нахождение длины НВП
- 1.2 Расширение алгоритма до нахождения НВП
2 Оптимизация до O(n log log k)
3 См. также
4 Источники информации

Алгоритм за O(n log log n)

Нахождение длины НВП

Основная идея

Пусть — входная перестановка.

Будем последовательно обрабатывать элементы в порядке

Для каждой длины [math]l = 1, 2,~\dots,~n[/math] предполагаемой НВП находим наименьший элемент, который может быть последним в возрастающей подпоследовательности длины [math]l[/math] и запишем его в массив [math]B_l[/math]. Будем называть его наилучшим элементом для длины [math]l[/math].

Если [math]\pi_i[/math] больше каждого элемента [math]B[/math], вычисленного для полпоследовательности , значит с ним можно сделать возрастающую подпоследовательность максимальной длины из уже рассмотренных, в которой он будет последним элементом. Значит, записываем его в конец [math]B[/math].
Иначе [math]\pi_i[/math] будет наилучшим элементом для уже существующей длины, тогда мы находим наименьшее [math]k:\colon B_k \gt \pi_i[/math] и заменяем его элементом [math]\pi_i[/math].

Следует отметить, что полученный массив также образует возрастающую последовательность, на котором мы должны выполнять операции , соответственно целесообразно использовать приоритетную очередь, реализованную через Дерево ван Эмде Боаса. Так как данная структура данных работает за [math]O(\operatorname{log} k)[/math], где k - количество битов чисел, которые позволяет хранить дерево, то полученный алгоритм работает за амортизированного времени на одну операцию, потому что все элементы последовательности не превосходят n.

Пример

Типы операций

Добавление элемента, который больше всех предыдущих:

Замещение элемента более подходящим, т.е. добавление немаксимального элемента:

[math]\longrightarrow[/math]

Пример последовательности

[math]\pi_1[/math]	[math]\pi_2[/math]	[math]\pi_3[/math]	[math]\pi_4[/math]	[math]\pi_5[/math]	[math]\pi_6[/math]	[math]\pi_7[/math]	[math]\pi_8[/math]	[math]\pi_9[/math]	[math]\pi_{10}[/math]	[math]\pi_{11}[/math]	[math]\pi_{12}[/math]
9	3	10	4	8	1	2	12	6	5	7	11

Состояние очереди при каждом добавлении

[math]B_1[/math]	[math]B_2[/math]	[math]B_3[/math]	[math]B_4[/math]	[math]B_5[/math]	[math]~\pi_i~[/math]
9					9
3					3
3	10				10
3	4				4
3	4	8			8
1	4	8			1
1	2	8			2
1	2	8	12		12
1	2	6	12		6
1	2	5	12		5
1	2	5	7		7
1	2	5	7	11	11

Псевдокод

   int LIS([math]\pi[/math][n])
       PriorityQueue B // рабочая приоритетная очередь
       int k = 0       // длина НВП
       for i = 1 to n
           x = [math]\pi[/math][i]
           // в любом случае добавляем в очередь очередной элемент
           // устаревшие будем удалять
           B.insert(x)
           if [math]\exists[/math] B.next(x)
               // добавленный элемент — не максимальный
               // удаляем следующее за x значение
               B.delete(B.next(x))
           else
               // добавленный элемент — максимальный
               // предыдущие значения не трогаем, очередь увеличилась
               k = k + 1           
       return k

Расширение алгоритма до нахождения НВП

Основная идея

Будем запоминать пары: для каждого элемента записываем его "предшественника".

Тогда, пройдя по предшественникам, начиная с последнего элемента очереди [math]B[/math], мы можем восстановить НВП.

Общий вид алгоритма

[math]B_1[/math]	[math]B_2[/math]	[math]B_3[/math]	[math]B_4[/math]	[math]B_5[/math]	[math]~\pi_i~[/math]
9					9
3					3
3	10				10
3	4				4
3	4	8			8
1	4	8			1
1	2	8			2
1	2	8	12		12
1	2	6	12		6
1	2	5	12		5
1	2	5	7		7
1	2	5	7	11	11

predecessor
1	2	3	4	5	6	7	8	9	10	11	12
	1		3	2	2	5	4		3	7	8

Псевдокод


   int[] LIS([math]\pi[/math][n])
       PriorityQueue B
       int k = 0
       int predecessor[n] // резервируем [math]n[/math] позиций
       for i = 1 to n
           x = [math]\pi[/math][i]
           B.insert(x)
           predecessor[x] = B.prev(x)
           if [math]\exists[/math] B.next(x)
               B.delete(B.next(x))
           else
               k = k + 1
       // по цепочке от последнего элемента 
       // восстанавливаем НВП
       int result[k]
       int cur = B.max
       for i = k - 1 downto 0
           result[i] = cur
           cur = predecessor[cur]
       return result

Оптимизация до O(n log log k)

Чтобы Дерево ван Эмде Боаса выполняло операции за , необходимо алфавит обрабатываемых значений уменьшить до [math]O(k)[/math].

Предположим, мы знаем такое приближение числа [math]k[/math] числом [math]m: m \geqslant k[/math]. Мы обсудим, как найти такое [math]m[/math] позже.

Чтобы достичь нужной оценки, будем делить последовательность на [math]m[/math] блоков, кроме последнего, который может быть меньше, и обрабатывать каждый блок отдельно.

Деление на блоки

Последовательность [math]S[/math] делится на блоки , последвовательных элементов:

Обозначим за [math]C_j^s[/math] отсортированный блок [math]C_j[/math]. Отсортированные и неотсортированные блоки будем хранить в памяти.

Цифровая сортировка каждых блоков отдельно будет давать нам время рваботы . Чтобы отсортировать их за линейное время, дополним каждый элемент номером его блока и получим пары . Цифровая сортировка этих пар, если принимать за старший разряд номер блока, а за младший значение элемента, будет работать [math]O(n)[/math], потому что значения элементов и номера блоков не превосходят [math]n[/math].

Обработка блока

Обрабатывая блоки, будем работать не со значениями элементов, а с ключами, которые определенны для каждого элемента внутри блоков. Все блоки будут обрабатываться онлайн, то есть мы не перейдём к обработке следующего блока, пока не закончим с текущим.

Каждому элементу [math]x[/math] взаимно однозначно сопоставим ключ . Если все значения ключей будут находятся в промежутке [math]\{1,2,\dots,2m\}[/math], то эффективней будет работать с ключами элементов в очереди [math]B[/math].

Чтобы определить ключи элементам так, чтобы их значения были в представленном промежутке, работая с блоком [math]C_j[/math] будем сливать элементы, ключи которых находятся в очереди [math]B[/math] с [math]C_j^s[/math] в список [math]\mathtt{merged}[/math]. Сопоставим каждому элементу в списке его позицию. Это и будет наш ключ. Заметим, что элементы, чьи ключи находятся в [math]B[/math] располагаются в возрастающеме порядке, поэтому достаточно производить тривиальную операцию слияния. Поскольку мы предположили, что [math]m\geqslant k[/math], то количество ключей в [math]B[/math] не больше [math]m[/math], тогда длина [math]\mathtt{merged}[/math] не больше [math]2m[/math], что позволяет однозначно определить ключи на множестве [math]\{1,2,\dots,2m\}[/math].

После того, как ключи определенны, обновляем ключи в очереди [math]B[/math].

После этого запускаем, описанный выше алгоритм [math]\mathrm{LIS}[/math], для ключей элементов [math]C_j[/math] в порялке исходной последовательности.

В итоге, обработка блока делится на следующие этапы:

Достаем из очереди [math]B[/math] ключи [math]x[/math], конвертируем их в элементы [math]\mathtt{elt}(x)[/math] и кладём в список [math]\mathtt{bestelems}[/math].
Сливаем элементы в [math]\mathtt{bestelems}[/math] со следующим отсортированным блоком в список [math]\mathtt{merged}[/math].
Присваеваем новые ключи элементам в порядке списка [math]\mathtt{merged}[/math].
Вставляем в [math]B[/math] новые ключи элементов [math]\mathtt{bestelems}[/math].
Обрабатываем ключи элементов блока в порядке исходной последовательности с помощью алгоритма [math]\mathrm{LIS}[/math]. Для восстановления НВП также используем массив "предшественников", который будет работать с соответсвующими ключам элементами [math]\mathtt{elt}(x)[/math].

Пример

Предположим, что [math]m=5[/math]. Исходно получаем:

Блок	1	1	1	1	1	2	2	2	2	2	3	3
[math]\pi[/math]	9	3	10	4	8	1	2	12	6	5	7	11

После сортировки:

Блок	1	1	1	1	1	2	2	2	2	2	3	3
[math]\pi[/math]	3	4	8	9	10	1	2	5	6	12	7	11

Первый блок

Первый блок
[math]\pi[/math]	9	3	10	4	8
key	4	1	5	2	3

Cортированный
[math]\pi[/math]	3	4	8	9	10
key	1	2	3	4	5

Обработка блока с помощью алгоритма [math]\mathrm{LIS}[/math].

[math]B_1[/math]	[math]B_2[/math]	[math]B_3[/math]	[math]key[/math]	[math]\pi[/math]
4			4	9
1			1	3
1	5		5	10
1	2		2	4
1	2	3	3	8

В результате получаем

[math]B: \{1, 2, 3\}[/math]

Второй блок

Восстанавливаем элементы [math]B: \{1, 2, 3\}[/math] из : [math]\{3, 4, 8\}[/math].

Сливаем [math]C_2^s[/math] и восстановеленные элементы из [math]B[/math]:

[math]B[/math]
3	4	8

[math]C_2^s[/math]
1	2	5	6	12

[math]\mathtt{merged}[/math]
1	2	3	4	5	6	8	12
1	2	3	4	5	6	7	8

Второй блок
[math]\pi[/math]	1	2	12	6	5
key	1	2	8	6	5

Cортированный
[math]\pi[/math]	1	2	5	6	12
key	1	2	5	6	8

Обновляем ключи в очереди:

[math]B_1[/math]	[math]B_2[/math]	[math]B_3[/math]	[math]\pi[/math]
3			3
3	4		4
3	4	7	7

[math]\mathrm{LIS}[/math] новых:

[math]B_1[/math]	[math]B_2[/math]	[math]B_3[/math]	[math]B_4[/math]	[math]key[/math]	[math]\pi[/math]
1	4	7		1	1
1	2	7		2	2
1	2	7	8	8	12
1	2	6	8	6	6
1	2	5	8	5	5

В результате получаем:

[math]B: \{1, 2, 5, 8\}[/math]

Третий блок

Восстанавливаем элементы [math]B: \{1, 2, 5, 8\}[/math] из : [math]\{1, 2, 5, 12\}[/math].

Сливаем [math]C_3^s[/math] и восстановленные элементы из [math]B[/math]:

[math]B[/math]
1	2	5	12

[math]C_3^s[/math]
7	11

[math]\mathtt{merged}[/math]
1	2	5	7	11	12
1	2	3	4	5	6

третий блок
[math]\pi[/math]	7	11
key	4	5

Cортированный
[math]\pi[/math]	7	11
key	4	5

Обновление старых ключей:

[math]B_1[/math]	[math]B_2[/math]	[math]B_3[/math]	[math]B_4[/math]	[math]\pi[/math]
1				1
1	2			2
1	2	3		3
1	2	3	6	6

[math]\mathrm{LIS}[/math] новых:

[math]B_1[/math]	[math]B_2[/math]	[math]B_3[/math]	[math]B_4[/math]	[math]B_5[/math]	[math]key[/math]	[math]\pi[/math]
1	2	3	4		4	7
1	2	3	4	5	5	11

Результат завершения алгоритма:

[math]B: \{1, 2, 3, 4, 5\}[/math]

Получаем, что длина НВП - 5, и НВП оканчивается на [math]\mathtt{merged_5}=11[/math].

Восстановление НВП

[math]\mathtt{predecessor}[/math]
1	2	3	4	5	6	7	8	9	10	11	12
	1		3	2	2	5	4		3	7	8

Начинаем восстановление с [math]\mathtt{merged}[5] = 11[/math]:

обратный порядок	11	7	5	2	1
НВП	1	2	5	7	11

Оценка времени работы

Так как размер списка [math]\mathtt{merged}[/math] не больше [math]2m[/math], а количество блоков всего [math]\lceil n/m \rceil[/math]. То количество присваиваний новых ключей элементам последовательности не больше [math]2cm\cdot\dfrac{n}{m}=O(n)[/math], где c — некоторая константа. Каждая операция с приоритетной очередью требует [math]O(\log \log m)[/math] времени, так как элементы в [math]B[/math] не больше [math]2m[/math].

Докажем, что реализация данного алгоритма будет работать за время [math]O(n \log \log m)[/math] для последовательности длины n.

Рассмотрим последовательность [math]\{m_0,~m_1,~m_2,~\dots\}[/math], где , [math]m_0[/math] — некоторое значение, меньшее [math]k[/math].

Будем по порядку для элементов этой последовательности запускать алгоритм, представленный выше. Если размер очереди [math]B[/math] становится больше [math]m_i[/math], то условие [math]m \geqslant k[/math] перестает выполняться, тогда останавливаем алгоритм, и переходим к следующему элементу [math]m_{i+1}[/math]. Когда найдётся первое [math]m_j:m_j\geqslant k[/math], то алгоритм успешно завершится.

Таким образом, время работы алгоритма — [math]O(n \log \log {m_i})[/math] для [math]0\leqslant i \lt j[/math], потому что во время работы очередь [math]B[/math] хранит не более [math]m_i[/math] элементов, ключи которых не больше [math]2m_i[/math]. Для значения [math]m_j[/math] алгоритм успешно завершается, так как условие полной обработки последовательности [math]m\geqslant k[/math] выполняется. Таким образом, время работы алгоритма для [math]m_j[/math] также [math]O(n\log \log {m_j})[/math].

Заметим, что

.

Общее время работы алгоритма — .

Заметим, что , т.к. в противном случае [math]m_{i-1} \gt k[/math], что противоречит тому, что [math]m_i[/math] — первый из тех, что больше [math]k[/math]. Следовательно, .

Тогда алгоритм работает за .

См. также

Источники информации

Computing a Longest Increasing Subsequence of Length k in Time O(n log log k) (07.01.2017)

Участник:Artem.ustinov/НВП — различия между версиями

Версия 21:12, 30 декабря 2017

Содержание

Алгоритм за O(n log log n)

Нахождение длины НВП

Основная идея

Пример

Типы операций

Пример последовательности

Состояние очереди при каждом добавлении

Псевдокод

Расширение алгоритма до нахождения НВП

Основная идея

Общий вид алгоритма

Псевдокод

Оптимизация до O(n log log k)

Деление на блоки

Обработка блока

Пример

Оценка времени работы

См. также

Источники информации

Навигация

Персональные инструменты

Пространства имён

Варианты

Просмотры

Ещё

Поиск

Навигация

Инструменты