Задача о наибольшей общей палиндромной подпоследовательности — различия между версиями
Oxygen3 (обсуждение | вклад) |
Oxygen3 (обсуждение | вклад) |
||
Строка 4: | Строка 4: | ||
В этой статье мы рассмотрим задачу, которая объединяет две вышеперечисленные задачи в одну. | В этой статье мы рассмотрим задачу, которая объединяет две вышеперечисленные задачи в одну. | ||
− | + | {{Определение | |
− | + | |definition = Для последовательности <tex>X</tex>, мы обозначим её подпоследовательность <tex>x_{i}...x_{j}\ (1 \leqslant i \leqslant j \leqslant n)\ </tex> как <tex>X_{i,j}</tex>. Для двух последовательностей <tex>X</tex> и <tex>Y</tex>, если общая подпоследовательность <tex>Z</tex> последовательностей <tex>X</tex> и <tex>Y</tex> является палиндромом, то <tex>Z</tex> называется '''общей подпалиндромной подпоследовательностью''' (англ. ''common palindromic subsequence''). Общая подпалиндромная последовательность, имеющая максимальную длину, называется '''наибольшей общей подпалиндромной подпоследовательностью''' и мы обозначим её как <tex>LCPS(X,Y)</tex>. | |
− | + | }}{{Задача | |
− | |definition = Для последовательности <tex>X</tex>, мы обозначим её подпоследовательность <tex>x_{i}...x_{j}\ (1 \leqslant i \leqslant j \leqslant n)\ </tex> как <tex>X_{i,j}</tex>. Для двух последовательностей <tex>X</tex> и <tex>Y</tex>, если общая подпоследовательность <tex>Z</tex> последовательностей <tex>X</tex> и <tex>Y</tex> является палиндромом, то <tex>Z</tex> называется '''общей подпалиндромной подпоследовательностью''' (англ. ''common palindromic subsequence''). Общая подпалиндромная последовательность, имеющая максимальную длину, называется '''наибольшей общей подпалиндромной подпоследовательностью''' | + | |definition = '''Наибольшая общая подпалиндромная подпоследовательность''' (англ. ''The longest common palindromic subsequence (LCPS)'') {{---}} задача, являющаяся интересным вариантом классической задачи о поиске наибольшей общей подпоследовательности, которая также накладывает условия, что эта подпоследовательность должна быть палиндромом. |
}} | }} | ||
==Наивное решение== | ==Наивное решение== | ||
Строка 20: | Строка 20: | ||
Заметим, что в качестве подзадач для <tex>LCPS</tex>, в которых мы можем посчитать ответ, логично взять подпоследовательность от <tex>X</tex> и от <tex>Y</tex>. Основываясь на этом наблюдении мы сформулируем следующую теорему, которая доказывает оптимальную подструктуру свойств задачи <tex>LCPS</tex>, что даст возможность воспользоваться идеей [[Динамическое программирование | динамического программирования]]. | Заметим, что в качестве подзадач для <tex>LCPS</tex>, в которых мы можем посчитать ответ, логично взять подпоследовательность от <tex>X</tex> и от <tex>Y</tex>. Основываясь на этом наблюдении мы сформулируем следующую теорему, которая доказывает оптимальную подструктуру свойств задачи <tex>LCPS</tex>, что даст возможность воспользоваться идеей [[Динамическое программирование | динамического программирования]]. | ||
{{Теорема | {{Теорема | ||
− | |statement=Пусть <tex>X</tex> и <tex>Y</tex> - две последовательности длин <tex>n</tex> и <tex>m</tex> соответственно, а <tex>X_{i,j}</tex> и <tex>Y_{i,j}</tex> {{---}} две подпоследовательности последовательностей <tex>X</tex> и <tex>Y</tex> соответственно. Пусть <tex>Z = z_{1}z_{2}...z_{u}</tex> - наибольшая общая подпалиндромная последовательность двух подпоследовательностей <tex>X_{i,j}</tex> и <tex>Y_{k,l}</tex>. Тогда выполняются следующие утверждения, | + | |statement=Пусть <tex>X</tex> и <tex>Y</tex> - две последовательности длин <tex>n</tex> и <tex>m</tex> соответственно, а <tex>X_{i,j}</tex> и <tex>Y_{i,j}</tex> {{---}} две подпоследовательности последовательностей <tex>X</tex> и <tex>Y</tex> соответственно. Пусть <tex>Z = z_{1}z_{2}...z_{u}</tex> {{---}} наибольшая общая подпалиндромная последовательность двух подпоследовательностей <tex>X_{i,j}</tex> и <tex>Y_{k,l}</tex>. Тогда выполняются следующие утверждения, |
− | # Если <tex>x_i=x_j=y_k=y_l=a</tex> (для произвольного <tex>a</tex>), тогда <tex>z_1=z_u=a</tex> и <tex> | + | # Если <tex>x_i=x_j=y_k=y_l=a</tex> (для произвольного <tex>a</tex>), тогда <tex>z_1=z_u=a</tex> и <tex>Z_{2, u-1}</tex> {{---}} НОПП от подпоследовательностей <tex>X_{i+1,j-1}</tex> и <tex>Y_{k+1,l-1}</tex>. |
− | # Если <tex>x_i=x_j=y_k=y_l</tex> не выполняется, то <tex>Z</tex> {{---}} | + | # Если <tex>x_i=x_j=y_k=y_l</tex> не выполняется, то <tex>Z</tex> {{---}} НОПП от подпоследовательностей (<tex>X_{i+1,j}</tex> и <tex>Y_{k,l}</tex>) или (<tex>X_{i,j-1}</tex> и <tex>Y_{k,l}</tex>) или (<tex>X_{i,j}</tex> и <tex>Y_{k+1,l}</tex>) или (<tex>X_{i,j}</tex> и <tex>Y_{k,l-1}</tex>). |
}} | }} | ||
На основании теоремы мы напишем следующую рекурсивную формулу для длины наибольшей общей подпалиндромной подпоследовательности: | На основании теоремы мы напишем следующую рекурсивную формулу для длины наибольшей общей подпалиндромной подпоследовательности: | ||
Строка 55: | Строка 55: | ||
'''else''' | '''else''' | ||
ans[i][j][k][l] = (2 + lcps(i + 1, j - 1, k + 1, l - 1)) | ans[i][j][k][l] = (2 + lcps(i + 1, j - 1, k + 1, l - 1)) | ||
− | '''return''' | + | '''return''' ans[i][j][k][l] |
ans[i][j][k][l] = max(lcps(i + 1, j, k, l), lcps(i, j - 1, k, l), lcps(i, j, k + 1, l), lcps(i, j, k, l - 1)) | ans[i][j][k][l] = max(lcps(i + 1, j, k, l), lcps(i, j - 1, k, l), lcps(i, j, k + 1, l), lcps(i, j, k, l - 1)) | ||
− | '''return''' | + | '''return''' ans[i][j][k][l] |
==См. также== | ==См. также== | ||
* [[Задача о наибольшей возрастающей подпоследовательности]] | * [[Задача о наибольшей возрастающей подпоследовательности]] |
Версия 22:48, 13 декабря 2014
Задача о наибольшей общей подпоследовательности (англ. longest common subsequence (LCS)) — классическая и хорошо изученная проблема.
Задача о наибольшей подпоследовательности-палиндроме (англ. longest palindromic subsequence (LPS)) — также хорошо изучена.
В этой статье мы рассмотрим задачу, которая объединяет две вышеперечисленные задачи в одну.
Определение: |
Для последовательности | , мы обозначим её подпоследовательность как . Для двух последовательностей и , если общая подпоследовательность последовательностей и является палиндромом, то называется общей подпалиндромной подпоследовательностью (англ. common palindromic subsequence). Общая подпалиндромная последовательность, имеющая максимальную длину, называется наибольшей общей подпалиндромной подпоследовательностью и мы обозначим её как .
Задача: |
Наибольшая общая подпалиндромная подпоследовательность (англ. The longest common palindromic subsequence (LCPS)) — задача, являющаяся интересным вариантом классической задачи о поиске наибольшей общей подпоследовательности, которая также накладывает условия, что эта подпоследовательность должна быть палиндромом. |
Содержание
Наивное решение
Можно придумать такое решение данной задачи: найти наибольшую общую подпоследовательность, в ней найти наибольшую подпалиндромную подпоследовательность. Но, к сожалению, это решение неверно.
Контрпример
Возьмем две последовательности
и .Наибольшей общая подпоследовательность данных последовательностей равна
и в ней наибольшая подпалиндромная последовательность имеет длину .Но очевидно, что на самом деле последовательность
является наибольшим общей палиндромной подпоследовательностью и и имеет длину .Решение с помощью динамического программирования
Заметим, что в качестве подзадач для динамического программирования.
, в которых мы можем посчитать ответ, логично взять подпоследовательность от и от . Основываясь на этом наблюдении мы сформулируем следующую теорему, которая доказывает оптимальную подструктуру свойств задачи , что даст возможность воспользоваться идеейТеорема: |
Пусть и - две последовательности длин и соответственно, а и — две подпоследовательности последовательностей и соответственно. Пусть — наибольшая общая подпалиндромная последовательность двух подпоследовательностей и . Тогда выполняются следующие утверждения,
|
На основании теоремы мы напишем следующую рекурсивную формулу для длины наибольшей общей подпалиндромной подпоследовательности:
Где
— длина наибольшей общей палиндромной подпоследовательности от и . Длина наибольшей общей палиндромной подпоследовательности от последовательностей и будет расположена в . Мы можем вычислить эту длину за время используя динамическое программирование.Реализация
Будем использовать динамику с запоминанием ответа (с мемоизацией). Оформим решения в виде рекурсивной функции
В массиве хранятся ответы для подзадач. До запуска функции заполним массив значением . Так как каждое значение считается не более одного раза и эта операция происходит за , мы получим асимптотику .
Псевдокод
int lcps(i: int, j: int, k: int, l: int) if (ans[i][j][k][l] // если значение уже посчитано, то надо его вернуть return ans[i][j][k][l] if (i > j or k > l) ans[i][j][k][l] = 0 return 0 if (X[i] == X[j] == Y[k] == Y[l]) if (i == j and k == l) ans[i][j][k][l] = 1 return 1 else ans[i][j][k][l] = (2 + lcps(i + 1, j - 1, k + 1, l - 1)) return ans[i][j][k][l] ans[i][j][k][l] = max(lcps(i + 1, j, k, l), lcps(i, j - 1, k, l), lcps(i, j, k + 1, l), lcps(i, j, k, l - 1)) return ans[i][j][k][l]-1)
См. также
- Задача о наибольшей возрастающей подпоследовательности
- Задача о редакционном расстоянии, алгоритм Вагнера-Фишера