Задача о наибольшей возрастающей подпоследовательности — различия между версиями

Материал из Викиконспекты
Перейти к: навигация, поиск
Строка 5: Строка 5:
 
Задача заключается в том, чтобы отыскать это наибольшее <tex> k </tex> и саму подпоследовательность.
 
Задача заключается в том, чтобы отыскать это наибольшее <tex> k </tex> и саму подпоследовательность.
 
Известно несколько алгоритмов решения этой задачи.
 
Известно несколько алгоритмов решения этой задачи.
==== Пример алгоритма, работающего за время <tex> O(n^2) </tex> ====
+
==== Решение за время <tex> O(n^2) </tex> ====
 
Строим таблицу <tex> a[1 \dots n] </tex>. Каждый её элемент <tex> a[i] </tex> - длина наибольшей возрастающей подпоследовательности, оканчивающейся точно в позиции <tex> i </tex>. Если мы построим эту таблицу, то ответ к задаче - наибольшее число из этой таблицы.
 
Строим таблицу <tex> a[1 \dots n] </tex>. Каждый её элемент <tex> a[i] </tex> - длина наибольшей возрастающей подпоследовательности, оканчивающейся точно в позиции <tex> i </tex>. Если мы построим эту таблицу, то ответ к задаче - наибольшее число из этой таблицы.
 
Само построение тоже элементарно: <tex> a[i] = \max{(a[j] + 1)} </tex>,для всех <tex> j = 1\dots i-1</tex>, для которых <tex> x[j] < x[i] </tex>. База динамики <tex> a[1] = 1 </tex>.
 
Само построение тоже элементарно: <tex> a[i] = \max{(a[j] + 1)} </tex>,для всех <tex> j = 1\dots i-1</tex>, для которых <tex> x[j] < x[i] </tex>. База динамики <tex> a[1] = 1 </tex>.
Строка 34: Строка 34:
 
Для вывода самой подпоследовательности достаточной пройти по массиву <tex>prev</tex>, начиная с номера того элемента, на котором мы зафиксировали наш ответ lis, и спускаясь по его предыдущим элементам, пока не достигнем -1 в предке очередного элемента.
 
Для вывода самой подпоследовательности достаточной пройти по массиву <tex>prev</tex>, начиная с номера того элемента, на котором мы зафиксировали наш ответ lis, и спускаясь по его предыдущим элементам, пока не достигнем -1 в предке очередного элемента.
  
==== Пример алгоритма, работающего за время <tex> O(n\cdot\log n) </tex> ====
+
==== Решение за <tex> O(n\cdot\log n) </tex> ====
Для строки ''x'' будем по-прежнему хранить массивы <tex>a</tex> (<tex>a</tex> уже длины <tex>n + 1</tex>) и <tex>prev</tex>, добавим к ним так же массив <tex>last</tex> из <tex>n + 1</tex> элементов так, что в <tex>last[i]</tex> хранится номер последнего элемента в возрастающей подпоследовательности длины <tex>i</tex>. Теперь <tex> a[i] </tex> содержит наименьший по величине элемент, на который может оканчиваться  возрастающая подпоследовательность длины <tex>i</tex>, среди всех <tex>x[j]</tex>, где <tex>1 \leqslant j \leqslant i-1 </tex>, если мы на шаге <tex>i</tex>. В свою очередь, <tex>prev[i]</tex> хранит индекс предшевствующего символа для наибольшей возрастающей подпоследовательности, оканчивающейся в i-ой позиции. Заметим, что <tex> a[0] < a[1] < a[2] < \dots < a[n] </tex>. Пусть мы находимся на i-ом шаге, тогда нам надо найти такой номер k <tex> a[k] \leqslant x[i] < a[k+1] </tex> (если положить при начальной реализации <tex> a[0] = -\inf</tex> - фиктивный элемент, <tex>a[1] = a[2] = \dots = a[n] = \inf </tex>, то такое k всегда найдется).Причем если в условии не строгое возрастание, то массив <tex>a</tex> ''не убывает'', и надо искать наибольшее k из возможных. После этого полагаем <tex> a[k + 1] = x[i] </tex>, а остальные элементы массива не меняем. В силу упорядоченности массива a, мы можем искать k бинарным поиском (при не строгом возрастании необходимо пользоваться функцией <tex>upperBound(1, n, a[i])</tex>), чтобы найти элемент <tex>a[i]</tex> с максимальным индексом. Параллельно нахождению НВП будем записывать массив предков <tex>prev</tex> и номеров <tex>last</tex>. Подсчитаем время: мы n раз выпоняем бинарный поиск, что требует <tex> O(\log n) </tex> времени. Итого: <tex> O(n\cdot\log n) </tex>.
+
Для более быстрого решения данной задачи построим следующую динамику: пусть <tex>d[i](i = 0...n)</tex> - число, на которое оканчивается возрастающая последовательность длины <tex>i</tex>, а если таких чисел несколько - то наименьшее из них. Изначально мы предполагаем, что <tex>d[0] = -</tex><tex>\infty</tex>, а все остальные элементы <tex>d[i] =</tex> <tex>\infty</tex>.
 
+
Заметим два важных свойства этой динамики: <tex>d[i - 1] <= d[i]</tex>, для всех <tex>i = 1...n</tex>. А так же что каждый элемент <tex>a[i]</tex> обновляет максимум один элемент <tex>d[j]</tex>. Это означает, что при обработке очередного <tex>a[i]</tex>, мы можем за <tex> O(n\cdot\log n) </tex> c помощью двоичного поиска в массиве <tex>d[]</tex> найти первое число, которое строго больше текущего <tex>a[i]</tex> и обновить его.
 +
Для восстановления ответа будем поддерживать заполнение двух массивов:<tex>pos</tex> и <tex>prev</tex>. В <tex>pos[i]</tex> будем хранить позицию <tex>d[i]</tex> в <tex>a[i]</tex>, а в <tex>prev[i]</tex> - позицию предыдущего элемента для <tex>a[i]</tex>.
 
<code>
 
<code>
  lis = 0
+
  int d[maxN];
  a = (n + 1, inf)
+
  int pos[maxN];//pos[i] - позиция d[i] в a[i]
  prev = (n, -1)
+
int prev[maxN];
  a[0] = -inf
+
  prev[0] = -1;
  last[0] = -1
+
  d[0] = -INF;
  For i = 1 to n
+
  for i = 0...n
    j = binary_search(0, n, x[i]) // бинарный поиск j < i, удовлетворяющего x[a[j]] < x[i] и x[i] < x[a[j + 1]]
+
    d[i] = INF;
    d[j + 1] = a[i]
+
  for i = 0...n
    p[i] = last[j]
+
    int j = binsearch(d, a[i]);//поиск первого числа, строго большего a[i]
    last[j + 1] = i;
+
    if(d[j - 1] < a[i] && a[i] < d[j])
    If (lis < j + 1)
+
          d[j] = a[i];
      lis = j + 1;
+
          pos[j] = i;
 +
          prev[i] = pos[d[j - 1]];//предок a[i] - позиция элемента d[j - 1] в исходном массиве a[i]
 +
          size = max(size, j);
 +
int it = size;
 +
int ans[size];
 +
while(it != -INF)
 +
    write(a[prev[it]]);//вывод наибольшей возрастающей последовательности в обратном порядке
 +
    it = a[prev[it]];
 
</code>
 
</code>
Для восстановления самой последовательности необходимой пройти по массиву pred с номера <tex>last[lis]</tex>, выводя элементы НВП в обратном порядке, аналогично действиям в прошлом алгоритме.
 
 
 
== Источники ==
 
== Источники ==
 
* [http://informatics.mccme.ru/moodle/mod/book/view.php?id=488 Наибольшая возрастающая подпоследовательность (НВП, Longest Increasing Subsequence, LIS)]
 
* [http://informatics.mccme.ru/moodle/mod/book/view.php?id=488 Наибольшая возрастающая подпоследовательность (НВП, Longest Increasing Subsequence, LIS)]
 
* [http://e-maxx.ru/algo/longest_increasing_subseq_log Длиннейшая возрастающая подпоследовательность за O (N log N)]
 
* [http://e-maxx.ru/algo/longest_increasing_subseq_log Длиннейшая возрастающая подпоследовательность за O (N log N)]
 
* [http://ru.wikipedia.org/wiki/LIS Задача поиска наибольшей увеличивающейся подпоследовательности]
 
* [http://ru.wikipedia.org/wiki/LIS Задача поиска наибольшей увеличивающейся подпоследовательности]

Версия 02:35, 30 ноября 2011

Определение:
Наибольшая возрастающая подпоследовательность (НВП) (англ. Longest increasing subsequence - LIS) строки [math] x [/math] длины [math] n [/math] - это последовательность [math] x[i_1] \lt x[i_2] \lt \dots \lt x[i_k] [/math] символов строки [math] x [/math] таких, что [math] i_1 \lt i_2 \lt \dots \lt i_k, 1 \le i_j \le n [/math], причем [math] k [/math] - наибольшее из возможных.

Задача заключается в том, чтобы отыскать это наибольшее [math] k [/math] и саму подпоследовательность. Известно несколько алгоритмов решения этой задачи.

Решение за время [math] O(n^2) [/math]

Строим таблицу [math] a[1 \dots n] [/math]. Каждый её элемент [math] a[i] [/math] - длина наибольшей возрастающей подпоследовательности, оканчивающейся точно в позиции [math] i [/math]. Если мы построим эту таблицу, то ответ к задаче - наибольшее число из этой таблицы. Само построение тоже элементарно: [math] a[i] = \max{(a[j] + 1)} [/math],для всех [math] j = 1\dots i-1[/math], для которых [math] x[j] \lt x[i] [/math]. База динамики [math] a[1] = 1 [/math]. Если мы хотим восстановить саму подпоследовательность, то заведем массив предыдущих величин [math]prev[/math] такой, что [math]prev[i][/math] - предпоследний элемент в НВП, оканчивающейся в элементе с номером [math] i [/math]. Его значение будет изменяться вместе с изменением соответствующего i-ого элемента матрицы [math]a[/math].

int a[MaxN]; //maxN - наибольшая возможная длина возрастающей последовательности
int prev[maxN];
for i = 0 ... n
        a[i] = 1; 
        prev[i] = -1; 
        for j = 0 ... i - 1 
                if(a[j] < a[i])
                        a[i] = max(a[i], 1 + a[j]);
                        prev[i] = j; 
int ans = d[0], pos = 0; 
for i = 0 ... n 
        ans = max(ans, d[i]);
        pos = i;
int it = 0;
int lsa[maxN]; // наибольшая возрастающая последовательность 
while(pos != -1) //восстанавливаем предка lsa[it] = pos; pos = prev[pos]; it = it + 1; for it - 1 ... 0 // вывод последовательности, начиная с первого элемента write(lsa[it])

Для вывода самой подпоследовательности достаточной пройти по массиву [math]prev[/math], начиная с номера того элемента, на котором мы зафиксировали наш ответ lis, и спускаясь по его предыдущим элементам, пока не достигнем -1 в предке очередного элемента.

Решение за [math] O(n\cdot\log n) [/math]

Для более быстрого решения данной задачи построим следующую динамику: пусть [math]d[i](i = 0...n)[/math] - число, на которое оканчивается возрастающая последовательность длины [math]i[/math], а если таких чисел несколько - то наименьшее из них. Изначально мы предполагаем, что [math]d[0] = -[/math][math]\infty[/math], а все остальные элементы [math]d[i] =[/math] [math]\infty[/math]. Заметим два важных свойства этой динамики: [math]d[i - 1] \lt = d[i][/math], для всех [math]i = 1...n[/math]. А так же что каждый элемент [math]a[i][/math] обновляет максимум один элемент [math]d[j][/math]. Это означает, что при обработке очередного [math]a[i][/math], мы можем за [math] O(n\cdot\log n) [/math] c помощью двоичного поиска в массиве [math]d[][/math] найти первое число, которое строго больше текущего [math]a[i][/math] и обновить его. Для восстановления ответа будем поддерживать заполнение двух массивов:[math]pos[/math] и [math]prev[/math]. В [math]pos[i][/math] будем хранить позицию [math]d[i][/math] в [math]a[i][/math], а в [math]prev[i][/math] - позицию предыдущего элемента для [math]a[i][/math].

int d[maxN];
int pos[maxN];//pos[i] - позиция d[i] в a[i]
int prev[maxN];
prev[0] = -1;
d[0] = -INF;
for i = 0...n
    d[i] = INF;
for i = 0...n
    int j = binsearch(d, a[i]);//поиск первого числа, строго большего a[i]
    if(d[j - 1] < a[i] && a[i] < d[j])
         d[j] = a[i];
         pos[j] = i;
         prev[i] = pos[d[j - 1]];//предок a[i] - позиция элемента d[j - 1] в исходном массиве a[i]
         size = max(size, j);
int it = size;
int ans[size];
while(it != -INF)
    write(a[prev[it]]);//вывод наибольшей возрастающей последовательности в обратном порядке
    it = a[prev[it]];

Источники