Изменения

Перейти к: навигация, поиск
м
rollbackEdits.php mass rollback
'''[[Задача о наибольшей общей подпоследовательности]]''' (англ. ''longest common subsequence (LCS)'') {{-- -}} классическая и хорошо изученная проблема. В данной статье мы рассмотрим её модификацию, где эта последовательность также должна быть палиндромом.{{Определение|definition='''Палиндромом''' (англ. ''palindrom'') называется последовательность, которая одинаково читается как слева направо, так и справа налево.}}'''Наибольшая общая подпалиндромная подпоследовательность''' (англ. ''The longest common palindromic sub-sequence (LCPS)'') - задача, являющаяся интересным вариантом классической задачи о поиске наибольшей общей подпоследовательности, которая находит наибольшую общую подпоследовательность среди двух последовательностей так, что она также является палиндромом.
==Постановка задачи==Для последовательности <tex>X</tex>, мы обознамич его подпоследовательность <tex>x_{i}...x_{j} (1 \leqslant i \leqslant j \leqslant n)</tex> как <tex>X_{i,j}</tex>. Для двух последовательностей <tex>X</tex> и <tex>Y</tex>, если общая подпоследовательность <tex>Z</tex> последовательносей <tex>X</tex> и <tex>Y</tex> является палиндромом, то <tex>Z</tex> называется '''общей подпалиндромной подпоследовательностью''' (англ. ''common palindromic subsequence''). Общая подпалиндромная последовательность, имеющая максимальную длину, называется '''[[Задача о наибольшей общей подпалиндромной подпоследовательностьюподпоследовательности-палиндроме]]''' (англ. ''The longest common palindromic subsequence (LCPSLPS)'') и мы обозначим её как <tex>LCPS(X,Y)</tex>{{---}} также хорошо изучена.
Здесь мы рассмотрим задачу, которая объединяет две вышеперечисленные задачи в одну.{{Определение|definition ==Динамическое программирование==ЗаметимДля последовательности <tex>X</tex>, что естественные классы подзадач для мы обозначим её подпоследовательность <tex>x_{i}...x_{j}\ (1 \leqslant i \leqslant j \leqslant n)\ </tex> как <tex>LCPSX_{i,j}</tex> соответствуют парам подпоследовательностей из . Для двух входных последовательностей<tex>X</tex> и <tex>Y</tex>, если общая подпоследовательность <tex>Z</tex> последовательностей <tex>X</tex> и <tex>Y</tex> является палиндромом, то <tex>Z</tex> называется '''общей подпалиндромной подпоследовательностью''' (англ. Основываясь на этом наблюдении ''common palindromic subsequence''). Общая подпалиндромная последовательность, имеющая максимальную длину, называется '''наибольшей общей подпалиндромной подпоследовательностью''' (англ. ''longest common palindromic subsequence (LCPS)'') и мы сформулируем следующую теоремуобозначим её как <tex>LCPS(X,Y)</tex>.}}{{Задача|definition = '''Наибольшая общая подпалиндромная подпоследовательность''' {{---}} задача, являющаяся интересным вариантом классической задачи о поиске наибольшей общей подпоследовательности, которая доказывает оптимальную подструктуру свойств также накладывает условия, что эта подпоследовательность должна быть палиндромом.}}==Наивное решение==Можно придумать такое решение данной задачи : найти наибольшую общую подпоследовательность, в ней найти наибольшую подпалиндромную подпоследовательность. Но, к сожалению, это решение '''неверно'''.===Контрпример===Возьмем две последовательности <tex>LCPSX=[1,\ 2,\ 3,\ 1]</tex> и <tex>Y=[1,\ 1,\ 2,\ 3]</tex>.
===Теорема 1===Пусть Наибольшей общая подпоследовательность данных последовательностей равна <tex>LCS(X</tex> и <tex>Y</tex> - две последовательности длин <tex>n</tex> и <tex>m</tex> соответственно, а <tex>X_{i,j}</tex> и <tex>Y_{i,j}</tex> - две подпоследовательности последовательностей <tex>X</tex> и <tex>Y</tex> соответственно. Пусть <tex>Z ) = z_{[1}z_{,\ 2}...z_{u},\ 3]</tex> - и в ней наибольшая общая подпалиндромная последовательность двух подпоследовательностей <tex>X_{i,j}</tex> и <tex>Y_{k,l}</tex>. Тогда выполняются следующие утверждения,#Если <tex>x_i=x_j=y_k=y_l=a</tex> (для произвольного <tex>a</tex>), тогда <tex>z_1=z_u=aимеет длину </tex> и <tex>z_2...z_{u-1}</tex> - наибольшая общая палиндромная подпоследовательность от подпоследовательностей <tex>X_{i+1,j-1}</tex> и <tex>Y_{k+1,l-1}</tex>.#Если <tex>x_i=x_j=y_k=y_l</tex> не выполняется, то <tex>Z</tex> - наибольшая общая палиндромная подпоследовательность от подпоследовательностей (<tex>X_{i+1,j}</tex> и <tex>Y_{k,l}</tex>) или (<tex>X_{i,j-1}</tex> и <tex>Y_{k,l}</tex>) или (<tex>X_{i,j}</tex> и <tex>Y_{k+1,l}</tex>) или (<tex>X_{i,j}</tex> и <tex>Y_{k,l-1}</tex>).
Но очевидно, что на самом деле последовательность <tex>Z=[1,\ 1]</tex> является наибольшим общей палиндромной подпоследовательностью <tex>X</tex> и <tex>Y</tex> и имеет длину <tex>2</tex>.==Решение с помощью динамического программирования==Заметим, что в качестве подзадач для <tex>LCPS</tex>, в которых мы можем посчитать ответ, логично взять подпоследовательность от <tex>X</tex> и от <tex>Y</tex>. Основываясь на этом наблюдении мы сформулируем следующую теорему, которая доказывает оптимальную подструктуру свойств задачи <tex>LCPS</tex>, что даст возможность воспользоваться идеей [[Динамическое программирование | динамического программирования]].{{Теорема|statement=Пусть <tex>X</tex> и <tex>Y</tex> {{---}} две последовательности длин <tex>n</tex> и <tex>m</tex> соответственно, а <tex>X_{i,j}</tex> и <tex>Y_{k,l}</tex> {{---}} две подпоследовательности последовательностей <tex>X</tex> и <tex>Y</tex> соответственно. Пусть <tex>Z = z_{1}z_{2}...z_{u}</tex> {{---}} наибольшая общая подпалиндромная последовательность двух подпоследовательностей <tex>X_{i,j}</tex> и <tex>Y_{k,l}</tex>. Тогда выполняются следующие утверждения, # Если <tex>x_i=x_j=y_k=y_l=a</tex> (для произвольного <tex>a</tex>), тогда <tex>z_1=z_u=a</tex> и <tex>Z_{2, u-1}</tex> {{---}} НОПП от подпоследовательностей <tex>X_{i+1,j-1}</tex> и <tex>Y_{k+1,l-1}</tex>.# Если <tex>x_i=x_j=y_k=y_l</tex> не выполняется, то <tex>Z</tex> {{---}} НОПП от подпоследовательностей (<tex>X_{i+1,j}</tex> и <tex>Y_{k,l}</tex>) или (<tex>X_{i,j-1}</tex> и <tex>Y_{k,l}</tex>) или (<tex>X_{i,j}</tex> и <tex>Y_{k+1,l}</tex>) или (<tex>X_{i,j}</tex> и <tex>Y_{k,l-1}</tex>).}}На основании теоремы 1 мы напишем следующую рекурсивную формулу для длины наибольшей общей подпалиндромной подпоследовательности:
<tex>
lcps[i,j,k,l] = \left\{\begin{array}{llcl}
0&&;&i > j\ or\lor\ k > l\\1&&;&(i = j)\ and\land\ (k = l)\ and\land\ (x_i=x_j=y_k=y_l)\\2+lcps[i+1,j-1,k+1,l-1]&&;&(i < j)\ and\land\ (k < l)\ ans\land\ (x_i=x_j=y_k=y_l)\\\max{(}lcps[i+1,j,k,l],lcps[i,j-1,k,l],&&;&(i \leqslant j)\ and\land\ (k \leqslant l)\ and\ notland\ \lnot(x_i=x_j=y_k=y_l)\\\:\:\:\:\:\:\:\:\:\:\:lcps[i,j,k+1,l],lcps[i,j,k,l-1])
\end{array}\right.
</tex>
Где <tex>lcps[i,j,k,l]</tex> {{--- }} длина наибольшей общей палиндромной подпоследовательности от <tex>X_{i,j}</tex> и <tex>Y_{k,l}</tex>. Длина наибольшей общей палиндромной подпоследовательности от последовательностей <tex>X</tex> и <tex>Y</tex> будет расположено расположена в <tex>lcps[1,n,1,m]</tex>. Мы можем вычислить эту длину за время <tex>O(n^4)</tex> используя динамическое программирование. ===Реализация===Будем использовать динамику с запоминанием ответа (с мемоизацией). Оформим решения в виде рекурсивной функции <tex>lcps</tex>, которая возвращает ответ для подзадачи, на которую она была вызвана.<br> В массиве <tex>\mathtt{ans}</tex> хранятся ответы для подзадач. До запуска функции <tex>lcps</tex> заполним массив <tex>ans</tex> значением <tex>-1</tex>. Так как каждое значение считается не более одного раза и эта операция происходит за <tex>O(1)</tex>, мы получим асимптотику <tex>O(n^4)</tex>. ===Псевдокод=== '''int''' lcps(i: '''int''', j: '''int''', k: '''int''', l: '''int''') '''if''' (ans[i][j][k][l] <tex> \neq </tex> -1) <span style="color:Green">// если значение уже посчитано, то надо его вернуть</span> '''return''' ans[i][j][k][l] '''if''' (i > j '''or''' k > l) ans[i][j][k][l] = 0 '''return''' 0 '''if''' (X[i] == X[j] == Y[k] == Y[l]) '''if''' (i == j '''and''' k == l) ans[i][j][k][l] = 1 '''return''' 1 '''else''' ans[i][j][k][l] = (2 + lcps(i + 1, j - 1, k + 1, l - 1)) '''return''' ans[i][j][k][l] ans[i][j][k][l] = max(lcps(i + 1, j, k, l), lcps(i, j - 1, k, l), lcps(i, j, k + 1, l), lcps(i, j, k, l - 1)) '''return''' ans[i][j][k][l]==См. также==* [[Задача о наибольшей возрастающей подпоследовательности]]* [[Задача о редакционном расстоянии, алгоритм Вагнера-Фишера]]==Источники информации==* [https://www.academia.edu/2015585/Computing_a_Longest_Common_Palindromic_Subsequence Academia.edu {{---}} Computing a Longest Common Palindromic Subsequence] [[Категория:Дискретная математика и алгоритмы]][[Категория:Динамическое программирование]][[Категория:Другие задачи динамического программирования]][[Категория:Алгоритмы на строках]]
1632
правки

Навигация