Задача о наибольшей возрастающей подпоследовательности

Материал из Викиконспекты
Перейти к: навигация, поиск

Дан массив из [math]n[/math] чисел: [math]a[0..n - 1][/math]. Требуется найти в этой последовательности строго возрастающую подпоследовательность наибольшей длины.

Определение:
Наибольшая возрастающая подпоследовательность (НВП) (англ. Longest increasing subsequence - LIS) строки [math] x [/math] длины [math] n [/math] - это последовательность [math] x[i_1] \lt x[i_2] \lt \dots \lt x[i_k] [/math] символов строки [math] x [/math] таких, что [math] i_1 \lt i_2 \lt \dots \lt i_k, 1 \le i_j \le n [/math], причем [math] k [/math] - наибольшее из возможных.

Решение за время O(N2)

Построим массив [math]d[/math], где [math]d[i][/math] [math]-[/math] это длина наибольшей возрастающей подпоследовательности, оканчивающейся в элементе, с индексом [math]i[/math]. Массив будем заполнять постепенно - сначала [math]d[0][/math], потом [math]d[1][/math] и т.д. Ответом на нашу задачу будет максимум из всех элементов массива [math]d[][/math]. Заполнение массива будет следующим: если [math]d[i] = 1[/math], то искомая последовательность состоит только из числа [math]a[i][/math]. Если [math]d[i] \gt 1[/math], то перед числом [math]a[i][/math] в подпоследовательности стоит какое-то другое число. Переберем его: это может быть любой элемент [math]a[j](j = 0...i - 1)[/math], но такой, что [math]a[j] \lt a[i][/math]. Пусть на каком-то шаге нам надо посчитать очередное [math]d[i][/math]. Все элементы массива [math]d[][/math] до него уже посчитаны. Значит наше [math]d[i][/math] мы можем посчитать следующим образом: [math]d[i] = 1 + max(d[j][/math], для всех [math]j = 0...i - 1)[/math] при условии, что [math]a[j] \lt a[i][/math].

Пока что мы нашли лишь максимальную длину наибольшей возрастающей подпоследовательности, но саму ее мы вывести не можем. Для восстановления ответа заведем массив [math]prev[0...n - 1][/math], где [math]prev[i][/math] будет означать индекс в массиве [math]a[][/math], при котором достигалось наибольшее значение [math]d[i][/math]. Для вывода ответа будем идти от элемента с максимальным значениям [math]d[i][/math] по его предкам.

vector<int> Find(vector<int> a)
    int n = a.size();//размер исходной последовательности
    vector<int> prev(n);
    vector<int> d(n);
    for i = 0...n - 1
        d[i] = 1;
        p[i] = -1;
        for j = 0...i - 1
            if a[j] < a[i]
                if d[j] + 1 > d[i]
                    d[i] = d[j] + 1;
                    prev[i] = j;
    int length = d[0], pos = 0;//length - длина наибольшей подпоследовательности, pos - последний символ наибольшей возрастающей подпоследовательности
    for i = 0...n - 1
        if d[i] > length
            length = d[i];
            pos = i;
    vector<int> answer;
    while pos != -1
        answer.push_back(a[pos]);
        pos = prev[pos];
    reverse(answer);
    return answer;    

Решение за O(NlogN)

Для более быстрого решения данной задачи построим следующую динамику: пусть [math]d[i](i = 0...n)[/math] - число, на которое оканчивается возрастающая последовательность длины [math]i[/math], а если таких чисел несколько - то наименьшее из них. Изначально мы предполагаем, что [math]d[0] = -[/math][math]\infty[/math], а все остальные элементы [math]d[i] =[/math] [math]\infty[/math]. Заметим два важных свойства этой динамики: [math]d[i - 1][/math] [math]\le[/math] [math]d[i][/math], для всех [math]i = 1...n[/math]. А так же что каждый элемент [math]a[i][/math] обновляет максимум один элемент [math]d[j][/math]. Это означает, что при обработке очередного [math]a[i][/math], мы можем за [math] O(\log n) [/math] c помощью двоичного поиска в массиве [math]d[][/math] найти первое число, которое строго больше текущего [math]a[i][/math] и обновить его. Для восстановления ответа будем поддерживать заполнение двух массивов:[math]pos[/math] и [math]prev[/math]. В [math]pos[i][/math] будем хранить позицию [math]d[i][/math] в [math]a[i][/math], а в [math]prev[i][/math] - позицию предыдущего элемента для [math]a[i][/math].

vector<int> Find(vector<int> a)
    int n = a.size();
    int length = 0; 
    int d[n], pos[n], prev[n];
    prev[0] = -1;
    d[0] = -INFINITY;
    for i = 1...n - 1 
        d[i] = INFINITY;
    for i = 0...n - 1
        int j = binsearch(d[], a[i]);
        if d[j - 1] < a[i] and a[i] < d[j]
            d[j] = a[i];
            pos[j] = i;
            prev[i] = pos[d[j - 1]];
            length = max(length, j);
    vector<int> answer;
    int pos = length;
    while pos != -INFINITY 
        answer.push_back(a[prev[pos]]);
        pos = a[prev[pos]];
    reverse(answer);
    return answer;

Ещё одно решение за О(NlogN)

Существует ещё одно решение, которое позволяет нам найти длину наибольшей возрастающей подпоследовательности, но без возможности восстановления данной подпоследовательности. Для этого мы воспользуемся таблом Юнга. Оно обладает таким свойством, что длина первой строки табла и будет являться искомой величиной.

Само табло представляет из себя расположение [math]n_1[/math]+[math]n_2[/math]+...+[math]n_M[/math] различных целых чисел в массиве строк,выровненных по левому краю, где в i-той строке содержится [math]n_i[/math] элементов; при этом в каждой строке элементы возрастают слева направо, а элементы каждого столбца возрастают сверху вниз. Чтобы построить табло требуется прочитать очередной элемент a, если он больше либо равен [math]n_j[/math], где j - длина строки, то просто добавить в конец строки, если меньше, то требуется найти первый элемент b, который больше данного a. Поставить элемент а вместо b. С элементом b требуется провести те же действия, что и с a, только уже на i+1 строке табла.

Пример построения табла на массиве а (индексация ведётся от 0) :

а : 3,4,9,2,5,1

1 : Берём 3, видим, что 3>0, который расположен на первой строке в ячейке с индексом j=0. Увеличиваем j и в t[i,j]=3


t =

   3

2 : Берём 4, видим, что 4>3. Увеличиваем j и в t[i,j]=4

t =

   3,4

3 : Аналогично с 9

t =

   3,4,9

4 : Берём 2. 2<9, то бин. поиском находим нужную нам позицию z, такую, что a[i,z-1]<=2<a[i,z]. В данном случае это первая позиция. Ставим на место a[i,z] 2 и проделываем такую же операцию, как и для 2, но на строке с индексом i+1.

t =

   2,4,9
   3

5 : Аналогично с 5

t=

  2,4,5
  3,9

6 : Аналогично для 1

t =

   1,4,5
   2,9
   3

При построении нам потребуется лишь первая строка, поэтому хранить остальные не имеет смысла.


Источники