Задача о наибольшей возрастающей подпоследовательности — различия между версиями

Материал из Викиконспекты
Перейти к: навигация, поиск
Строка 1: Строка 1:
Дан массив из <tex>n</tex> чисел: <tex>a[0..n]</tex>. Требуется найти в этой последовательности строго возрастающую подпоследовательность наибольшей длины.
+
__TOC__
 +
Дан массив из <tex>n</tex> чисел: <tex>a[0..n - 1]</tex>. Требуется найти в этой последовательности строго возрастающую подпоследовательность наибольшей длины.
 
{{Определение
 
{{Определение
 
|definition =  
 
|definition =  
Строка 5: Строка 6:
 
}}
 
}}
 
== Решение за время O(N<sup>2</sup>) ==
 
== Решение за время O(N<sup>2</sup>) ==
Строим таблицу <tex> a[0 \dots n - 1] </tex>. Каждый её элемент <tex> a[i] </tex> - длина наибольшей возрастающей подпоследовательности, оканчивающейся точно в позиции <tex> i </tex>. Если мы построим эту таблицу, то ответ к задаче - наибольшее число из этой таблицы.
+
Построим массив <tex>d</tex>, где <tex>d[i]</tex> <tex>-</tex> это длина наибольшей возрастающей подпоследовательности, оканчивающейся в элементе, с индексом <tex>i</tex>. Массив будем заполнять постепенно - сначала <tex>d[0]</tex>, потом <tex>d[1]</tex> и т.д. Ответом на нашу задачу будет максимум из всех элементов массива <tex>d[]</tex>.
Само построение тоже элементарно: <tex> a[i] = \max{(a[j] + 1)} </tex>,для всех <tex> j = 1\dots i-1</tex>, для которых <tex> a[j] < x[i] </tex>. База динамики <tex> a[1] = 1 </tex>.
+
Заполнение массива будет следующим: если <tex>d[i] = 1</tex>, то искомая последовательность состоит только из числа <tex>a[i]</tex>. Если <tex>d[i] > 1</tex>, то перед числом <tex>a[i]</tex> в подпоследовательности стоит какое-то другое число. Переберем его: это может быть любой элемент <tex>a[j](j = 0...i - 1)</tex>, но такой, что <tex>a[j] < a[i]</tex>. Пусть на каком-то шаге нам надо посчитать очередное <tex>d[i]</tex>. Все элементы массива <tex>d[]</tex> до него уже посчитаны. Значит наше <tex>d[i]</tex> мы можем посчитать следующим образом: <tex>d[i] = max(d[j]</tex>, для всех <tex>j = 0...i - 1)</tex> при условии, что <tex>a[j] < a[i]</tex>.
Если мы хотим восстановить саму подпоследовательность, то заведем массив предыдущих величин <tex>prev</tex> такой, что <tex>prev[i]</tex> - предпоследний элемент в НВП, оканчивающейся в элементе с номером <tex> i </tex>. Его значение будет изменяться вместе с изменением соответствующего i-ого элемента матрицы <tex>a</tex>.
+
 
===Псевдокод===
+
Пока что мы нашли лишь максимальную длину наибольшей возрастающей подпоследовательности, но саму ее мы вывести не можем. Для восстановления ответа заведем массив <tex>prev[0...n - 1]</tex>, где <tex>prev[i]</tex> будет означать индекс в массиве <tex>a[]</tex>, при котором достигалось наибольшее значение <tex>d[i]</tex>. Для вывода ответа будем идти от элемента с максимальным значениям <tex>d[i]</tex> по его предкам.
 
<code>
 
<code>
  vector <int> Find(vector <int> a)
+
  vector<int> Find(vector<int> a)
{
+
    int n = a.size();//размер исходной последовательности
int prev[maxN];//массив предков
+
    vector<int> prev(n);
for i = 0...n
+
    vector<int> d(n);
         a[i] = 1;  
+
    for i = 0...n - 1
         prev[i] = -1;  
+
         d[i] = 1;
         for j = 0...i - 1  
+
         p[i] = -1;
                if(a[j] < a[i])
+
         for j = 0...i - 1
                        a[i] = max(a[i], 1 + a[j]);
+
            if a[j] < a[i]
                        prev[i] = j;  
+
                if d[j] + 1 > d[i]
int ans = d[0], pos = 0;  
+
                    d[i] = d[j] + 1;
for i = 0...n  
+
                    prev[i] = j;
         ans = max(ans, d[i]);
+
    int length = d[0], pos = 0;//length - длина наибольшей подпоследовательности, pos - последний символ наибольшей возрастающей подпоследовательности
        pos = i;
+
    for i = 0...n - 1
vector <int> answer;
+
         if d[i] > length
while(pos != -1) //восстанавливаем предка
+
            length = d[i];
         answer.push_back(pos);
+
            pos = i;
 +
    vector<int> answer;
 +
    while pos != -1
 +
         answer.push_back(a[pos]);
 
         pos = prev[pos];
 
         pos = prev[pos];
reverse(answer.begin(), answer.end());
+
    reverse(answer);
return answer;
+
    return answer;  
}
 
 
</code>
 
</code>
 
 
== Решение за O(NlogN) ==
 
== Решение за O(NlogN) ==
 
Для более быстрого решения данной задачи построим следующую динамику: пусть <tex>d[i](i = 0...n)</tex> - число, на которое оканчивается возрастающая последовательность длины <tex>i</tex>, а если таких чисел несколько - то наименьшее из них. Изначально мы предполагаем, что <tex>d[0] = -</tex><tex>\infty</tex>, а все остальные элементы <tex>d[i] =</tex> <tex>\infty</tex>.
 
Для более быстрого решения данной задачи построим следующую динамику: пусть <tex>d[i](i = 0...n)</tex> - число, на которое оканчивается возрастающая последовательность длины <tex>i</tex>, а если таких чисел несколько - то наименьшее из них. Изначально мы предполагаем, что <tex>d[0] = -</tex><tex>\infty</tex>, а все остальные элементы <tex>d[i] =</tex> <tex>\infty</tex>.
 
Заметим два важных свойства этой динамики: <tex>d[i - 1] <= d[i]</tex>, для всех <tex>i = 1...n</tex>. А так же что каждый элемент <tex>a[i]</tex> обновляет максимум один элемент <tex>d[j]</tex>. Это означает, что при обработке очередного <tex>a[i]</tex>, мы можем за <tex> O(n\cdot\log n) </tex> c помощью двоичного поиска в массиве <tex>d[]</tex> найти первое число, которое строго больше текущего <tex>a[i]</tex> и обновить его.
 
Заметим два важных свойства этой динамики: <tex>d[i - 1] <= d[i]</tex>, для всех <tex>i = 1...n</tex>. А так же что каждый элемент <tex>a[i]</tex> обновляет максимум один элемент <tex>d[j]</tex>. Это означает, что при обработке очередного <tex>a[i]</tex>, мы можем за <tex> O(n\cdot\log n) </tex> c помощью двоичного поиска в массиве <tex>d[]</tex> найти первое число, которое строго больше текущего <tex>a[i]</tex> и обновить его.
 
Для восстановления ответа будем поддерживать заполнение двух массивов:<tex>pos</tex> и <tex>prev</tex>. В <tex>pos[i]</tex> будем хранить позицию <tex>d[i]</tex> в <tex>a[i]</tex>, а в <tex>prev[i]</tex> - позицию предыдущего элемента для <tex>a[i]</tex>.
 
Для восстановления ответа будем поддерживать заполнение двух массивов:<tex>pos</tex> и <tex>prev</tex>. В <tex>pos[i]</tex> будем хранить позицию <tex>d[i]</tex> в <tex>a[i]</tex>, а в <tex>prev[i]</tex> - позицию предыдущего элемента для <tex>a[i]</tex>.
===Псевдокод===
 
 
<code>
 
<code>
 
  vector <int> Find(vector <int> a)
 
  vector <int> Find(vector <int> a)

Версия 00:24, 3 декабря 2011

Дан массив из [math]n[/math] чисел: [math]a[0..n - 1][/math]. Требуется найти в этой последовательности строго возрастающую подпоследовательность наибольшей длины.

Определение:
Наибольшая возрастающая подпоследовательность (НВП) (англ. Longest increasing subsequence - LIS) строки [math] x [/math] длины [math] n [/math] - это последовательность [math] x[i_1] \lt x[i_2] \lt \dots \lt x[i_k] [/math] символов строки [math] x [/math] таких, что [math] i_1 \lt i_2 \lt \dots \lt i_k, 1 \le i_j \le n [/math], причем [math] k [/math] - наибольшее из возможных.

Решение за время O(N2)

Построим массив [math]d[/math], где [math]d[i][/math] [math]-[/math] это длина наибольшей возрастающей подпоследовательности, оканчивающейся в элементе, с индексом [math]i[/math]. Массив будем заполнять постепенно - сначала [math]d[0][/math], потом [math]d[1][/math] и т.д. Ответом на нашу задачу будет максимум из всех элементов массива [math]d[][/math]. Заполнение массива будет следующим: если [math]d[i] = 1[/math], то искомая последовательность состоит только из числа [math]a[i][/math]. Если [math]d[i] \gt 1[/math], то перед числом [math]a[i][/math] в подпоследовательности стоит какое-то другое число. Переберем его: это может быть любой элемент [math]a[j](j = 0...i - 1)[/math], но такой, что [math]a[j] \lt a[i][/math]. Пусть на каком-то шаге нам надо посчитать очередное [math]d[i][/math]. Все элементы массива [math]d[][/math] до него уже посчитаны. Значит наше [math]d[i][/math] мы можем посчитать следующим образом: [math]d[i] = max(d[j][/math], для всех [math]j = 0...i - 1)[/math] при условии, что [math]a[j] \lt a[i][/math].

Пока что мы нашли лишь максимальную длину наибольшей возрастающей подпоследовательности, но саму ее мы вывести не можем. Для восстановления ответа заведем массив [math]prev[0...n - 1][/math], где [math]prev[i][/math] будет означать индекс в массиве [math]a[][/math], при котором достигалось наибольшее значение [math]d[i][/math]. Для вывода ответа будем идти от элемента с максимальным значениям [math]d[i][/math] по его предкам.

vector<int> Find(vector<int> a)
    int n = a.size();//размер исходной последовательности
    vector<int> prev(n);
    vector<int> d(n);
    for i = 0...n - 1
        d[i] = 1;
        p[i] = -1;
        for j = 0...i - 1
            if a[j] < a[i]
                if d[j] + 1 > d[i]
                    d[i] = d[j] + 1;
                    prev[i] = j;
    int length = d[0], pos = 0;//length - длина наибольшей подпоследовательности, pos - последний символ наибольшей возрастающей подпоследовательности
    for i = 0...n - 1
        if d[i] > length
            length = d[i];
            pos = i;
    vector<int> answer;
    while pos != -1
        answer.push_back(a[pos]);
        pos = prev[pos];
    reverse(answer);
    return answer;    

Решение за O(NlogN)

Для более быстрого решения данной задачи построим следующую динамику: пусть [math]d[i](i = 0...n)[/math] - число, на которое оканчивается возрастающая последовательность длины [math]i[/math], а если таких чисел несколько - то наименьшее из них. Изначально мы предполагаем, что [math]d[0] = -[/math][math]\infty[/math], а все остальные элементы [math]d[i] =[/math] [math]\infty[/math]. Заметим два важных свойства этой динамики: [math]d[i - 1] \lt = d[i][/math], для всех [math]i = 1...n[/math]. А так же что каждый элемент [math]a[i][/math] обновляет максимум один элемент [math]d[j][/math]. Это означает, что при обработке очередного [math]a[i][/math], мы можем за [math] O(n\cdot\log n) [/math] c помощью двоичного поиска в массиве [math]d[][/math] найти первое число, которое строго больше текущего [math]a[i][/math] и обновить его. Для восстановления ответа будем поддерживать заполнение двух массивов:[math]pos[/math] и [math]prev[/math]. В [math]pos[i][/math] будем хранить позицию [math]d[i][/math] в [math]a[i][/math], а в [math]prev[i][/math] - позицию предыдущего элемента для [math]a[i][/math].

vector <int> Find(vector <int> a)
{
int d[maxN];
int pos[maxN];//pos[i] - позиция d[i] в a[i]
int prev[maxN];
prev[0] = -1;
d[0] = -INF;
for i = 0...n
    d[i] = INF;
for i = 0...n
    int j = binsearch(d, a[i]);//поиск первого числа, строго большего a[i]
    if(d[j - 1] < a[i] && a[i] < d[j])
         d[j] = a[i];
         pos[j] = i;
         prev[i] = pos[d[j - 1]];//предок a[i] - позиция элемента d[j - 1] в исходном массиве a[i]
         size = max(size, j);
int it = size;
vector <int> answer;
while(it != -INF)
    answer.push_back(a[prev[it]]);
    it = a[prev[it]];
return answer;
}

Источники