Задача о наибольшей возрастающей подпоследовательности — различия между версиями
(→Пример алгоритма, работающего за время O(n^2)) |
(→Пример алгоритма, работающего за время O(n\cdot\log n)) |
||
Строка 24: | Строка 24: | ||
==== Пример алгоритма, работающего за время <tex> O(n\cdot\log n) </tex> ==== | ==== Пример алгоритма, работающего за время <tex> O(n\cdot\log n) </tex> ==== | ||
− | Для строки ''x'' будем по-прежнему хранить массивы <tex>a</tex> (<tex>a</tex> уже длины n + 1) и <tex> | + | Для строки ''x'' будем по-прежнему хранить массивы <tex>a</tex> (<tex>a</tex> уже длины <tex>n + 1</tex>) и <tex>prev</tex>, добавим к ним так же массив <tex>last</tex> из <tex>n + 1</tex> элементов так, что в <tex>last[i]</tex> хранится номер последнего элемента в возрастающей подпоследовательности длины <tex>i</tex>. Теперь <tex> a[i] </tex> содержит наименьший по величине элемент, на который может оканчиваться возрастающая подпоследовательность длины <tex>i</tex>, среди всех <tex>x[j]</tex>, где <tex>1 \leqslant j \leqslant i-1 </tex>, если мы на шаге <tex>i</tex>. В свою очередь, <tex>prev[i]</tex> хранит индекс предшевствующего символа для наибольшей возрастающей подпоследовательности, оканчивающейся в i-ой позиции. Заметим, что <tex> a[0] < a[1] < a[2] < \dots < a[n] </tex>. Пусть мы находимся на i-ом шаге, тогда нам надо найти такой номер k <tex> a[k] \leqslant x[i] < a[k+1] </tex> (если положить при начальной реализации <tex> a[0] = -\inf</tex> - фиктивный элемент, <tex>a[1] = a[2] = \dots = a[n] = \inf </tex>, то такое k всегда найдется).Причем если в условии не строгое возрастание, то массив <tex>a</tex> ''не убывает'', и надо искать наибольшее k из возможных. После этого полагаем <tex> a[k + 1] = x[i] </tex>, а остальные элементы массива не меняем. В силу упорядоченности массива a, мы можем искать k бинарным поиском (при не строгом возрастании необходимо пользоваться функцией <tex>upper_bound(1, n, a[i]))</tex>, чтобы найти элемент <tex>a[i]</tex> с максимальным индексом. Параллельно нахождению НВП будем записывать массив предков <tex>prev</tex> и номеров <tex>last</tex>. Подсчитаем время: мы n раз выпоняем бинарный поиск, что требует <tex> O(\log n) </tex> времени. Итого: <tex> O(n\cdot\log n) </tex>. |
<code> | <code> | ||
lis = 0 | lis = 0 | ||
a = (n + 1, inf) | a = (n + 1, inf) | ||
− | + | prev = (n, -1) | |
a[0] = -inf | a[0] = -inf | ||
− | + | last[0] = -1 | |
For i = 1 to n | For i = 1 to n | ||
j = binary_search(0, n, x[i]) // бинарный поиск j < i, удовлетворяющего x[a[j]] < x[i] и x[i] < x[a[j + 1]] | j = binary_search(0, n, x[i]) // бинарный поиск j < i, удовлетворяющего x[a[j]] < x[i] и x[i] < x[a[j + 1]] | ||
d[j + 1] = a[i] | d[j + 1] = a[i] | ||
− | p[i] = | + | p[i] = last[j] |
− | + | last[j + 1] = i; | |
If (lis < j + 1) | If (lis < j + 1) | ||
lis = j + 1; | lis = j + 1; | ||
</code> | </code> | ||
− | Для восстановления самой последовательности необходимой пройти по массиву pred с номера <tex> | + | Для восстановления самой последовательности необходимой пройти по массиву pred с номера <tex>last[lis]</tex>, выводя элементы НВП в обратном порядке, аналогично действиям в прошлом алгоритме. |
== Источники == | == Источники == |
Версия 03:06, 26 сентября 2011
Определение: |
Наибольшая возрастающая подпоследовательность (НВП) (англ. Longest increasing subsequence - LIS) строки | длины - это последовательность символов строки таких, что , причем - наибольшее из возможных.
Задача заключается в том, чтобы отыскать это наибольшее
и саму подпоследовательность. Известно несколько алгоритмов решения этой задачи.Пример алгоритма, работающего за время
Строим таблицу
lis = 0 // длина НВП a = (n, 0) // заполняем нулями prev = (n, -1) // -1 - признак отсутствия предпоследнего элемента, что указывает на то, что данный элемент является первым в подпоследовательности a[1] = 1 For i = 2 to n For j = 1 to i - 1 If (x[i] > x[j]) and (a[j] + 1 > a[i]) // нашли более оптимальную подпоследовательность a[i] = a[j]+1 prev[i] = j lis = max(lis, a[i])
Для вывода самой подпоследовательности достаточной пройти по массиву
, начиная с номера того элемента, на котором мы зафиксировали наш ответ lis, и спускаясь по его предыдущим элементам, пока не достигнем -1 в предке очередного элемента.Пример алгоритма, работающего за время
Для строки x будем по-прежнему хранить массивы
( уже длины ) и , добавим к ним так же массив из элементов так, что в хранится номер последнего элемента в возрастающей подпоследовательности длины . Теперь содержит наименьший по величине элемент, на который может оканчиваться возрастающая подпоследовательность длины , среди всех , где , если мы на шаге . В свою очередь, хранит индекс предшевствующего символа для наибольшей возрастающей подпоследовательности, оканчивающейся в i-ой позиции. Заметим, что . Пусть мы находимся на i-ом шаге, тогда нам надо найти такой номер k (если положить при начальной реализации - фиктивный элемент, , то такое k всегда найдется).Причем если в условии не строгое возрастание, то массив не убывает, и надо искать наибольшее k из возможных. После этого полагаем , а остальные элементы массива не меняем. В силу упорядоченности массива a, мы можем искать k бинарным поиском (при не строгом возрастании необходимо пользоваться функцией , чтобы найти элемент с максимальным индексом. Параллельно нахождению НВП будем записывать массив предков и номеров . Подсчитаем время: мы n раз выпоняем бинарный поиск, что требует времени. Итого: .
lis = 0 a = (n + 1, inf) prev = (n, -1) a[0] = -inf last[0] = -1 For i = 1 to n j = binary_search(0, n, x[i]) // бинарный поиск j < i, удовлетворяющего x[a[j]] < x[i] и x[i] < x[a[j + 1]] d[j + 1] = a[i] p[i] = last[j] last[j + 1] = i; If (lis < j + 1) lis = j + 1;
Для восстановления самой последовательности необходимой пройти по массиву pred с номера
, выводя элементы НВП в обратном порядке, аналогично действиям в прошлом алгоритме.