Задача о наименьшей суперпоследовательности — различия между версиями
Motyaspr (обсуждение | вклад) |
Motyaspr (обсуждение | вклад) |
||
| Строка 20: | Строка 20: | ||
== Динамическое программирование == | == Динамическое программирование == | ||
===Решение=== | ===Решение=== | ||
| − | Обозначим за <tex> scs[i][j] </tex> | + | Обозначим за <tex> scs[i][j] SCS </tex> префиксов данных последовательностей <tex> x[1 \dots n] </tex> и <tex> y[1 \dots m] </tex>, заканчивающихся в элементах с номерами <tex> i </tex> и <tex> j </tex> соответственно. Наименьшая общая суперпоследовательность <tex> x[1 \dots i] </tex> и <tex> y[1 \dots j] </tex> должна содержать каждый символ обеих последовательностей, поэтому если <tex> j = 0 </tex>, то <tex> SCS </tex> это просто последовательность <tex> x[1 \dots i] </tex>. Аналогичен случай, когда <tex> i = 0 </tex>. Если <tex> i > 0 </tex> и <tex> j > 0 </tex>, то возможны два случая. Если <tex> x[i] \neq y[j] </tex>, то SCS должна включать оба этих элемента. Значит нужно выбрать минимальный из ответов для префиксов, включающих один элемент и не включающих второй. Если же <tex> x[i] = y[j] </tex>, то <tex>SCS</tex> для последовательностей <tex> x[1 \dots i] </tex> и <tex> y[1 \dots j] </tex> должна заканчиваться этим элементом, так как он общий для них. Получается следующее рекуррентное соотношение: |
<tex> | <tex> | ||
| Строка 35: | Строка 35: | ||
===Восстановление ответа=== | ===Восстановление ответа=== | ||
| − | В <tex> scs[i][j] </tex> помимо длины последовательности | + | В <tex> scs[i][j] </tex> помимо длины последовательности хранится и символ, добавленный последним. Таким образом, зная длину SCS, можно восстановить и саму последовательность. |
===Псевдокод=== | ===Псевдокод=== | ||
Версия 22:28, 23 декабря 2017
| Определение: |
| Последовательность является суперпоследовательностью (англ. supersequence) последовательности , если существует строго возрастающая последовательность индексов таких, что для всех выполняется соотношение . |
| Определение: |
| Последовательность является общей суперпоследовательностью (англ. common supersequence) последовательностей и , если является суперпоследовательностью как для , так для и . |
| Задача: |
| Пусть имеются последовательности и . Необходимо найти |
Содержание
Наивное решение
Пусть даны две последовательности длины и соответственно. Заметим, что если приписать к одной из данных последовательностей другую, то полученная последовательность будет их суперпоследовательностью с длиной . Запомним все элементы обеих последовательностей и из них построим все возможные последовательности. Тогда искомая гарантированно найдётся, однако время работы алгоритма будет экспоненциально зависеть от длины исходных последовательностей.
Динамическое программирование
Решение
Обозначим за префиксов данных последовательностей и , заканчивающихся в элементах с номерами и соответственно. Наименьшая общая суперпоследовательность и должна содержать каждый символ обеих последовательностей, поэтому если , то это просто последовательность . Аналогичен случай, когда . Если и , то возможны два случая. Если , то SCS должна включать оба этих элемента. Значит нужно выбрать минимальный из ответов для префиксов, включающих один элемент и не включающих второй. Если же , то для последовательностей и должна заканчиваться этим элементом, так как он общий для них. Получается следующее рекуррентное соотношение:
Очевидно, что сложность алгоритма составит , где и — длины последовательностей.
Восстановление ответа
В помимо длины последовательности хранится и символ, добавленный последним. Таким образом, зная длину SCS, можно восстановить и саму последовательность.
Псевдокод
x, y — данные последовательности; — SCS для префикса длины i последовательности x и префикса длины j последовательности y; prev[i][j] — пара индексов элемента таблицы, которые предшествовали .
fun SCS(x: int, y: int): // аналог void
m = x.size
n = y.size
for i = 1 to m
scs[i][0] = i
for j = 0 to n
scs[0][j] = j
for i = 1 to m
for j = 1 to n
if x[i] == y[j]
scs[i][j] = 1 + scs[i - 1][j - 1]
prev[i][j] = pair(i - 1, j - 1)
else
if scs[i - 1][j] <= lcs[i][j - 1]
scs[i][j] = 1 + scs[i - 1][j]
prev[i][j] = pair(i - 1, j)
else
scs[i][j] = 1 + scs[i][j - 1]
prev[i][j] = pair(i, j - 1)
fun printLCS(m: int, n: int): // вывод SCS
i = m
j = n
ans = [] // массив ответа
while i > 0 and j > 0
if prev[i][j] == pair(i - 1, j - 1)
ans.append(x[i])
i -= 1
j -= 1
else
if prev[i][j] == pair(i - 1, j)
ans.append(x[i])
i -= 1
else
ans.append(y[j])
j -= 1
while i > 0 // добавляем оставшиеся символы первой последовательности
ans.append(x[i])
i -= 1
while j > 0
ans.append(y[j]) // добавляем оставшиеся символы второй последовательности
j -= 1
reverse(ans) // разворачиваем последовательность, так как шли с конца
return ans
Связь с наибольшей общей подпоследовательностью
| Теорема: |
, где - длина наибольшей общей подпоследовательности, - длина наименьшей общей суперпоследовательности, и - длины последовательностей и соответсвенно. |
| Доказательство: |
|
Пусть , . Обозначим за их SCS и будем ее строить. Так как являетcя подпоследовательностью , то можно представить так: Мы должны поставить на место некоторых пропусков поставить элементы , так чтобы суммарная длина была минимальна, и был подпоследовательностью . Заметим, что если найдется подпоследовательность такая, что является подпоследовательностью , то все элементы этой подпоследовательности уже находятся в , а значит их не нужно вставлять. Поэтому мы добавим не меньше чем . Длину нужно минимизировать, значит имеет место равенство: . Поэтому: |