Задача о наибольшей общей палиндромной подпоследовательности — различия между версиями

Текущая версия на 19:37, 4 сентября 2022

Задача о наибольшей общей подпоследовательности (англ. longest common subsequence (LCS)) — классическая и хорошо изученная проблема.

Задача о наибольшей подпоследовательности-палиндроме (англ. longest palindromic subsequence (LPS)) — также хорошо изучена.

Здесь мы рассмотрим задачу, которая объединяет две вышеперечисленные задачи в одну.

Определение:

Для последовательности , мы обозначим её подпоследовательность как . Для двух последовательностей и , если общая подпоследовательность последовательностей и является палиндромом, то называется общей подпалиндромной подпоследовательностью (англ. common palindromic subsequence). Общая подпалиндромная последовательность, имеющая максимальную длину, называется наибольшей общей подпалиндромной подпоследовательностью (англ. longest common palindromic subsequence (LCPS)) и мы обозначим её как .

Задача:

Наибольшая общая подпалиндромная подпоследовательность — задача, являющаяся интересным вариантом классической задачи о поиске наибольшей общей подпоследовательности, которая также накладывает условия, что эта подпоследовательность должна быть палиндромом.

Содержание

1 Наивное решение
- 1.1 Контрпример
2 Решение с помощью динамического программирования
- 2.1 Реализация
- 2.2 Псевдокод
3 См. также
4 Источники информации

Наивное решение

Можно придумать такое решение данной задачи: найти наибольшую общую подпоследовательность, в ней найти наибольшую подпалиндромную подпоследовательность. Но, к сожалению, это решение неверно.

Контрпример

Возьмем две последовательности [math]X=[1,\ 2,\ 3,\ 1][/math] и [math]Y=[1,\ 1,\ 2,\ 3][/math].

Наибольшей общая подпоследовательность данных последовательностей равна [math]LCS(X,Y) = [1,\ 2,\ 3][/math] и в ней наибольшая подпалиндромная последовательность имеет длину [math]1[/math].

Но очевидно, что на самом деле последовательность [math]Z=[1,\ 1][/math] является наибольшим общей палиндромной подпоследовательностью [math]X[/math] и [math]Y[/math] и имеет длину [math]2[/math].

Решение с помощью динамического программирования

Заметим, что в качестве подзадач для [math]LCPS[/math], в которых мы можем посчитать ответ, логично взять подпоследовательность от [math]X[/math] и от [math]Y[/math]. Основываясь на этом наблюдении мы сформулируем следующую теорему, которая доказывает оптимальную подструктуру свойств задачи [math]LCPS[/math], что даст возможность воспользоваться идеей динамического программирования.

Теорема:

Пусть и — две последовательности длин и соответственно, а и — две подпоследовательности последовательностей и соответственно. Пусть — наибольшая общая подпалиндромная последовательность двух подпоследовательностей и . Тогда выполняются следующие утверждения,

Если [math]x_i=x_j=y_k=y_l=a[/math] (для произвольного [math]a[/math]), тогда [math]z_1=z_u=a[/math] и [math]Z_{2, u-1}[/math] — НОПП от подпоследовательностей [math]X_{i+1,j-1}[/math] и [math]Y_{k+1,l-1}[/math].
Если [math]x_i=x_j=y_k=y_l[/math] не выполняется, то [math]Z[/math] — НОПП от подпоследовательностей ([math]X_{i+1,j}[/math] и [math]Y_{k,l}[/math]) или ([math]X_{i,j-1}[/math] и [math]Y_{k,l}[/math]) или ([math]X_{i,j}[/math] и [math]Y_{k+1,l}[/math]) или ([math]X_{i,j}[/math] и [math]Y_{k,l-1}[/math]).

На основании теоремы мы напишем следующую рекурсивную формулу для длины наибольшей общей подпалиндромной подпоследовательности:

Где [math]lcps[i,j,k,l][/math] — длина наибольшей общей палиндромной подпоследовательности от [math]X_{i,j}[/math] и [math]Y_{k,l}[/math]. Длина наибольшей общей палиндромной подпоследовательности от последовательностей [math]X[/math] и [math]Y[/math] будет расположена в [math]lcps[1,n,1,m][/math]. Мы можем вычислить эту длину за время [math]O(n^4)[/math] используя динамическое программирование.

Реализация

Будем использовать динамику с запоминанием ответа (с мемоизацией). Оформим решения в виде рекурсивной функции [math]lcps[/math], которая возвращает ответ для подзадачи, на которую она была вызвана.
В массиве [math]\mathtt{ans}[/math] хранятся ответы для подзадач. До запуска функции [math]lcps[/math] заполним массив [math]ans[/math] значением [math]-1[/math]. Так как каждое значение считается не более одного раза и эта операция происходит за [math]O(1)[/math], мы получим асимптотику [math]O(n^4)[/math].

Псевдокод

int lcps(i: int, j: int, k: int, l: int)
  if (ans[i][j][k][l] [math] \neq [/math] -1) // если значение уже посчитано, то надо его вернуть
    return ans[i][j][k][l]
  if (i > j or k > l)
    ans[i][j][k][l] = 0
    return 0
  if (X[i] == X[j] == Y[k] == Y[l])
    if (i == j and k == l)
      ans[i][j][k][l] = 1
      return 1       
    else   
      ans[i][j][k][l] = (2 + lcps(i + 1, j - 1, k + 1, l - 1))    
      return ans[i][j][k][l]
  ans[i][j][k][l] = max(lcps(i + 1, j, k, l), lcps(i, j - 1, k, l), lcps(i, j, k + 1, l), lcps(i, j, k, l - 1))
  return ans[i][j][k][l]

См. также

Источники информации

Academia.edu — Computing a Longest Common Palindromic Subsequence

@@ Строка 3: / Строка 3: @@
 '''[[Задача о наибольшей подпоследовательности-палиндроме]]''' (англ. ''longest palindromic subsequence (LPS)'') {{---}} также хорошо изучена.
-В этой статье мы рассмотрим задачу, которая объединяет две вышеперечисленные задачи в одну.
+Здесь мы рассмотрим задачу, которая объединяет две вышеперечисленные задачи в одну.
+{{Определение
-'''Наибольшая общая подпалиндромная подпоследовательность''' (англ. ''The longest common palindromic subsequence (LCPS)'') {{---}} задача, являющаяся интересным вариантом классической задачи о поиске наибольшей общей подпоследовательности, которая также накладывает условия, что эта подпоследовательность должна быть палиндромом.
+|definition = Для последовательности <tex>X</tex>, мы обозначим её подпоследовательность <tex>x_{i}...x_{j}\ (1 \leqslant i \leqslant j \leqslant n)\ </tex> как <tex>X_{i,j}</tex>. Для двух последовательностей <tex>X</tex> и <tex>Y</tex>, если общая подпоследовательность <tex>Z</tex> последовательностей <tex>X</tex> и <tex>Y</tex> является палиндромом, то <tex>Z</tex> называется '''общей подпалиндромной подпоследовательностью''' (англ. ''common palindromic subsequence''). Общая подпалиндромная последовательность, имеющая максимальную длину, называется '''наибольшей общей подпалиндромной подпоследовательностью''' (англ. ''longest common palindromic subsequence (LCPS)'') и мы обозначим её как <tex>LCPS(X,Y)</tex>.
-{{Задача
+}}{{Задача
-|definition = Для последовательности <tex>X</tex>, мы обозначим её подпоследовательность <tex>x_{i}...x_{j}\ (1 \leqslant i \leqslant j \leqslant n)\ </tex> как <tex>X_{i,j}</tex>. Для двух последовательностей <tex>X</tex> и <tex>Y</tex>, если общая подпоследовательность <tex>Z</tex> последовательностей <tex>X</tex> и <tex>Y</tex> является палиндромом, то <tex>Z</tex> называется '''общей подпалиндромной подпоследовательностью''' (англ. ''common palindromic subsequence''). Общая подпалиндромная последовательность, имеющая максимальную длину, называется '''наибольшей общей подпалиндромной подпоследовательностью''' (англ. ''The longest common palindromic subsequence (LCPS)'') и мы обозначим её как <tex>LCPS(X,Y)</tex>.
+|definition = '''Наибольшая общая подпалиндромная подпоследовательность''' {{---}} задача, являющаяся интересным вариантом классической задачи о поиске наибольшей общей подпоследовательности, которая также накладывает условия, что эта подпоследовательность должна быть палиндромом.
 }}
 ==Наивное решение==
@@ Строка 20: / Строка 20: @@
 Заметим, что в качестве подзадач для <tex>LCPS</tex>, в которых мы можем посчитать ответ, логично взять подпоследовательность от <tex>X</tex> и от <tex>Y</tex>. Основываясь на этом наблюдении мы сформулируем следующую теорему, которая доказывает оптимальную подструктуру свойств задачи <tex>LCPS</tex>, что даст возможность воспользоваться идеей [[Динамическое программирование | динамического программирования]].
 {{Теорема
-|statement=Пусть <tex>X</tex> и <tex>Y</tex> - две последовательности длин <tex>n</tex> и <tex>m</tex> соответственно, а <tex>X_{i,j}</tex> и <tex>Y_{i,j}</tex> {{---}} две подпоследовательности последовательностей <tex>X</tex> и <tex>Y</tex> соответственно. Пусть <tex>Z = z_{1}z_{2}...z_{u}</tex> - наибольшая общая подпалиндромная последовательность двух подпоследовательностей <tex>X_{i,j}</tex> и <tex>Y_{k,l}</tex>. Тогда выполняются следующие утверждения,
+|statement=Пусть <tex>X</tex> и <tex>Y</tex> {{---}} две последовательности длин <tex>n</tex> и <tex>m</tex> соответственно, а <tex>X_{i,j}</tex> и <tex>Y_{k,l}</tex> {{---}} две подпоследовательности последовательностей <tex>X</tex> и <tex>Y</tex> соответственно. Пусть <tex>Z = z_{1}z_{2}...z_{u}</tex> {{---}} наибольшая общая подпалиндромная последовательность двух подпоследовательностей <tex>X_{i,j}</tex> и <tex>Y_{k,l}</tex>. Тогда выполняются следующие утверждения,
-# Если <tex>x_i=x_j=y_k=y_l=a</tex> (для произвольного <tex>a</tex>), тогда <tex>z_1=z_u=a</tex> и <tex>z_2...z_{u-1}</tex> {{---}} наибольшая общая палиндромная подпоследовательность от подпоследовательностей <tex>X_{i+1,j-1}</tex> и <tex>Y_{k+1,l-1}</tex>.
+# Если <tex>x_i=x_j=y_k=y_l=a</tex> (для произвольного <tex>a</tex>), тогда <tex>z_1=z_u=a</tex> и <tex>Z_{2, u-1}</tex> {{---}} НОПП от подпоследовательностей <tex>X_{i+1,j-1}</tex> и <tex>Y_{k+1,l-1}</tex>.
-# Если <tex>x_i=x_j=y_k=y_l</tex> не выполняется, то <tex>Z</tex> {{---}} наибольшая общая палиндромная подпоследовательность от подпоследовательностей (<tex>X_{i+1,j}</tex> и <tex>Y_{k,l}</tex>) или (<tex>X_{i,j-1}</tex> и <tex>Y_{k,l}</tex>) или (<tex>X_{i,j}</tex> и <tex>Y_{k+1,l}</tex>) или (<tex>X_{i,j}</tex> и <tex>Y_{k,l-1}</tex>).
+# Если <tex>x_i=x_j=y_k=y_l</tex> не выполняется, то <tex>Z</tex> {{---}} НОПП от подпоследовательностей (<tex>X_{i+1,j}</tex> и <tex>Y_{k,l}</tex>) или (<tex>X_{i,j-1}</tex> и <tex>Y_{k,l}</tex>) или (<tex>X_{i,j}</tex> и <tex>Y_{k+1,l}</tex>) или (<tex>X_{i,j}</tex> и <tex>Y_{k,l-1}</tex>).
 }}
 На основании теоремы мы напишем следующую рекурсивную формулу для длины наибольшей общей подпалиндромной подпоследовательности:
@@ Строка 55: / Строка 55: @@
       '''else'''
         ans[i][j][k][l] = (2 + lcps(i + 1, j - 1, k + 1, l - 1))
-        '''return''' (2 + lcps(i + 1, j - 1, k + 1, l - 1))
+        '''return''' ans[i][j][k][l]
     ans[i][j][k][l] = max(lcps(i + 1, j, k, l), lcps(i, j - 1, k, l), lcps(i, j, k + 1, l), lcps(i, j, k, l - 1))
-    '''return''' max(lcps(i + 1, j, k, l), lcps(i, j - 1, k, l), lcps(i, j, k + 1, l), lcps(i, j, k, l - 1))
+    '''return''' ans[i][j][k][l]
 ==См. также==
 * [[Задача о наибольшей возрастающей подпоследовательности]]
@@ Строка 66: / Строка 66: @@
 [[Категория:Дискретная математика и алгоритмы]]
 [[Категория:Динамическое программирование]]
+[[Категория:Другие задачи динамического программирования]]
+[[Категория:Алгоритмы на строках]]

Задача о наибольшей общей палиндромной подпоследовательности — различия между версиями

Текущая версия на 19:37, 4 сентября 2022

Содержание

Наивное решение

Контрпример

Решение с помощью динамического программирования

Реализация

Псевдокод

См. также

Источники информации

Навигация

Персональные инструменты

Пространства имён

Варианты

Просмотры

Ещё

Поиск

Навигация

Инструменты