Применение метода четырёх русских в задачах ДП на примере задачи о НОП — различия между версиями

Версия 19:45, 7 января 2017

Содержание

1 Описание алгоритма
- 1.1 Предподсчёт
- 1.2 Вычисление НОП на сжатой матрице
2 Анализ алгоритма
- 2.1 Время работы
- 2.2 Используемая память
3 Источники информации

Описание алгоритма

Предподсчёт

Рассмотрим задачу о наибольшей общей подпоследовательности для двух последовательностей одинаковой длины. Тогда таблица динамического программирования имеет размер [math] (n + 1) \times (n + 1) [/math]. Разобьём её на квадраты размера [math] k \times k [/math] следующим образом: выделим каждую [math] k + 1 [/math]-ую строчку, начиная с первой. Аналогично выделяем столбцы.

Требуется, чтобы [math] k [/math] делило [math] n [/math], но это не является ограничением — можно дописать в конец последовательностей символы, которые не встречались в других местах этих последовательностей (символы для каждой последовательности должны быть разными). Тогда ответ на задачу не изменится, а длину можно «довести» до делителя [math] k [/math].

Сделаем предподсчёт действия каждого возможного квадрата. Окончательный результат зависит только от значений в верхнем левом «уголке» над квадратом и подстрок, для которых считается ответ — остальные значения в квадрате однозначно считаются с их помощью. Окончательным результатом будут значения в нижнем правом «уголке» квадрата.

Может показаться, что таких уголков может быть много. Но, так как соседние числа в матрице отличаются не более, чем на один, то результат зависит только от константы в верхнем левом элементе матрицы, и возрастания чисел в верхнем и левом крае квадрата. Возрастание чисел будем хранить с помощью битовых масок: сначала [math] k - 1 [/math] бит кодирует возрастание чисел в верхнем крае квадрата (0 — элемент равен предыдущему, 1 — больше предыдущего на один), потом [math] k - 1 [/math] бит кодируют возрастание чисел в квадрате по левому краю аналогичным образом.

Более того, константу в верхнем левом элементе квадрата можно вообще не хранить: её можно прибавить при необходимости к каждому элементу результата.

Посчитаем эти квадраты для строк abbabb и bababb. Возьмём [math] k = 3 [/math]. Тогда предподсчитанные квадраты, которые понадобятся для дальнейшего вычисления НОП, выглядят так:

		[math]a[/math]	[math]b[/math]	[math]b[/math]
		[math]0[/math]	[math]0[/math]	[math]0[/math]
[math]0[/math]	[math]b[/math]	[math]0[/math]	[math]1[/math]	[math]1[/math]
[math]0[/math]	[math]a[/math]	[math]1[/math]	[math]1[/math]	[math]1[/math]
[math]0[/math]	[math]b[/math]	[math]1[/math]	[math]2[/math]	[math]2[/math]

		[math]a[/math]	[math]b[/math]	[math]a[/math]
		[math]0[/math]	[math]0[/math]	[math]0[/math]
[math]1[/math]	[math]b[/math]	[math]1[/math]	[math]1[/math]	[math]1[/math]
[math]0[/math]	[math]a[/math]	[math]2[/math]	[math]2[/math]	[math]2[/math]
[math]1[/math]	[math]b[/math]	[math]2[/math]	[math]3[/math]	[math]3[/math]

		[math]a[/math]	[math]b[/math]	[math]b[/math]
		[math]1[/math]	[math]1[/math]	[math]0[/math]
[math]0[/math]	[math]a[/math]	[math]1[/math]	[math]2[/math]	[math]2[/math]
[math]0[/math]	[math]b[/math]	[math]1[/math]	[math]2[/math]	[math]3[/math]
[math]0[/math]	[math]b[/math]	[math]1[/math]	[math]2[/math]	[math]3[/math]

		[math]a[/math]	[math]b[/math]	[math]a[/math]
		[math]0[/math]	[math]1[/math]	[math]1[/math]
[math]0[/math]	[math]a[/math]	[math]1[/math]	[math]1[/math]	[math]2[/math]
[math]1[/math]	[math]b[/math]	[math]1[/math]	[math]2[/math]	[math]2[/math]
[math]0[/math]	[math]b[/math]	[math]1[/math]	[math]2[/math]	[math]2[/math]

Вычисление НОП на сжатой матрице

Ответ для самой задачи НОП считается аналогично обычному алгоритму, только рассматривая не каждую ячейку таблицы, а квадраты [math] k \times k [/math]. В очередной квадрат (пусть его левый верхний угол находится в ячейке с координатами [math] i, j [/math]) вставляем значения предподсчитанного квадрата, соответствующего данным подстрокам и битовым маскам, и прибавляем ко всем элементам в квадрате число, стоящее в уголке над квадратом, т.е. в ячейке с координатами [math] i - 1, j - 1 [/math].

Для нашего примера итоговая таблица выглядит так:

Анализ алгоритма

Время работы

При предподсчёте перебирается [math] | \Sigma | ^k [/math] (где [math] | \Sigma | [/math] — мощность алфавита) возможных подстрок первой строки и столько же — второй строки. Для каждой возможной подстроки обеих строк перебирается по [math] 2^{k - 1} [/math] битовых масок. Для самого предподсчёта требуется время [math] O(k^2) [/math]. Дальнейший алгоритм поиска НОП требует . Тогда суммарное время работы алгоритма составляет . Понятно, что для получения выигрыша в производительности по сравнению с обычным алгоритмом необходимо, чтобы первое слагаемое не превышало второе. Найдём [math] k [/math], решив неравенство:

.

Пренебрегая [math] \log k [/math] и [math] \log 2 [/math] как [math] o(k) [/math], получаем

Используемая память

Для каждого предподсчитанного квадрата хранятся подстроки длиной [math] 2k [/math], битовые маски длиной [math] 2k [/math] и результат — нижний «уголок» длины [math] 2k - 1 [/math]. Как уже было подсчитано, всего предподсчитывается квадратов. Дальнейший алгоритм требует , значит, всего требуется памяти.

Источники информации

http://pages.cpsc.ucalgary.ca/~pmohasse/private-lcs.pdf

@@ Строка 14: / Строка 14: @@
 Посчитаем эти квадраты для строк abbabb и bababb. Возьмём <tex> k = 3 </tex>. Тогда предподсчитанные квадраты, которые понадобятся для дальнейшего вычисления НОП, выглядят так:
-[[Файл:4 russians lcs precalc.png]]
+{|
+|
+{|class="wikitable" style="background-color:#FFF; text-align:center; "
+| colspan="2" rowspan="2" |
+! style="background-color:#E0FFFF; width: 40px; height: 40px;" |<tex>0</tex>
+! style="background-color:#E0FFFF; width: 40px; height: 40px;" |<tex>0</tex>
+! style="background-color:#E0FFFF; width: 40px; height: 40px;" |<tex>0</tex>
+|-
+! style="background-color:#FFEECC; width: 40px; height: 40px;" |<tex>a</tex>
+! style="background-color:#FFEECC; width: 40px; height: 40px;" |<tex>b</tex>
+! style="background-color:#FFEECC; width: 40px; height: 40px;" |<tex>b</tex>
+|-
+! style="background-color:#E0FFFF; width: 40px; height: 40px;" |<tex>0</tex>
+! style="background-color:#FFEECC; width: 40px; height: 40px;" |<tex>b</tex>
+|<tex>0</tex>
+|<tex>1</tex>
+|<tex>1</tex>
+|-
+! style="background-color:#E0FFFF; width: 40px; height: 40px;" |<tex>0</tex>
+! style="background-color:#FFEECC; width: 40px; height: 40px;" |<tex>a</tex>
+|<tex>1</tex>
+|<tex>1</tex>
+|<tex>1</tex>
+|-
+! style="background-color:#E0FFFF; width: 40px; height: 40px;" |<tex>0</tex>
+! style="background-color:#FFEECC; width: 40px; height: 40px;" |<tex>b</tex>
+|<tex>1</tex>
+|<tex>2</tex>
+|<tex>2</tex>
+|}
+|&nbsp;||&nbsp;||&nbsp;||&nbsp;||&nbsp;||&nbsp;||&nbsp;||&nbsp;
+|
+{|class="wikitable" style="background-color:#FFF; text-align:center; "
+| colspan="2" rowspan="2" |
+! style="background-color:#E0FFFF; width: 40px; height: 40px;" |<tex>0</tex>
+! style="background-color:#E0FFFF; width: 40px; height: 40px;" |<tex>0</tex>
+! style="background-color:#E0FFFF; width: 40px; height: 40px;" |<tex>0</tex>
+|-
+! style="background-color:#FFEECC; width: 40px; height: 40px;" |<tex>a</tex>
+! style="background-color:#FFEECC; width: 40px; height: 40px;" |<tex>b</tex>
+! style="background-color:#FFEECC; width: 40px; height: 40px;" |<tex>a</tex>
+|-
+! style="background-color:#E0FFFF; width: 40px; height: 40px;" |<tex>1</tex>
+! style="background-color:#FFEECC; width: 40px; height: 40px;" |<tex>b</tex>
+|<tex>1</tex>
+|<tex>1</tex>
+|<tex>1</tex>
+|-
+! style="background-color:#E0FFFF; width: 40px; height: 40px;" |<tex>0</tex>
+! style="background-color:#FFEECC; width: 40px; height: 40px;" |<tex>a</tex>
+|<tex>2</tex>
+|<tex>2</tex>
+|<tex>2</tex>
+|-
+! style="background-color:#E0FFFF; width: 40px; height: 40px;" |<tex>1</tex>
+! style="background-color:#FFEECC; width: 40px; height: 40px;" |<tex>b</tex>
+|<tex>2</tex>
+|<tex>3</tex>
+|<tex>3</tex>
+|}
+|}
+{|
+|
+{|class="wikitable" style="background-color:#FFF; text-align:center; "
+| colspan="2" rowspan="2" |
+! style="background-color:#E0FFFF; width: 40px; height: 40px;" |<tex>1</tex>
+! style="background-color:#E0FFFF; width: 40px; height: 40px;" |<tex>1</tex>
+! style="background-color:#E0FFFF; width: 40px; height: 40px;" |<tex>0</tex>
+|-
+! style="background-color:#FFEECC; width: 40px; height: 40px;" |<tex>a</tex>
+! style="background-color:#FFEECC; width: 40px; height: 40px;" |<tex>b</tex>
+! style="background-color:#FFEECC; width: 40px; height: 40px;" |<tex>b</tex>
+|-
+! style="background-color:#E0FFFF; width: 40px; height: 40px;" |<tex>0</tex>
+! style="background-color:#FFEECC; width: 40px; height: 40px;" |<tex>a</tex>
+|<tex>1</tex>
+|<tex>2</tex>
+|<tex>2</tex>
+|-
+! style="background-color:#E0FFFF; width: 40px; height: 40px;" |<tex>0</tex>
+! style="background-color:#FFEECC; width: 40px; height: 40px;" |<tex>b</tex>
+|<tex>1</tex>
+|<tex>2</tex>
+|<tex>3</tex>
+|-
+! style="background-color:#E0FFFF; width: 40px; height: 40px;" |<tex>0</tex>
+! style="background-color:#FFEECC; width: 40px; height: 40px;" |<tex>b</tex>
+|<tex>1</tex>
+|<tex>2</tex>
+|<tex>3</tex>
+|}
+|&nbsp;||&nbsp;||&nbsp;||&nbsp;||&nbsp;||&nbsp;||&nbsp;||&nbsp;
+|
+{|class="wikitable" style="background-color:#FFF; text-align:center; "
+| colspan="2" rowspan="2" |
+! style="background-color:#E0FFFF; width: 40px; height: 40px;" |<tex>0</tex>
+! style="background-color:#E0FFFF; width: 40px; height: 40px;" |<tex>1</tex>
+! style="background-color:#E0FFFF; width: 40px; height: 40px;" |<tex>1</tex>
+|-
+! style="background-color:#FFEECC; width: 40px; height: 40px;" |<tex>a</tex>
+! style="background-color:#FFEECC; width: 40px; height: 40px;" |<tex>b</tex>
+! style="background-color:#FFEECC; width: 40px; height: 40px;" |<tex>a</tex>
+|-
+! style="background-color:#E0FFFF; width: 40px; height: 40px;" |<tex>0</tex>
+! style="background-color:#FFEECC; width: 40px; height: 40px;" |<tex>a</tex>
+|<tex>1</tex>
+|<tex>1</tex>
+|<tex>2</tex>
+|-
+! style="background-color:#E0FFFF; width: 40px; height: 40px;" |<tex>1</tex>
+! style="background-color:#FFEECC; width: 40px; height: 40px;" |<tex>b</tex>
+|<tex>1</tex>
+|<tex>2</tex>
+|<tex>2</tex>
+|-
+! style="background-color:#E0FFFF; width: 40px; height: 40px;" |<tex>0</tex>
+! style="background-color:#FFEECC; width: 40px; height: 40px;" |<tex>b</tex>
+|<tex>1</tex>
+|<tex>2</tex>
+|<tex>2</tex>
+|}
+|}
 === Вычисление НОП на сжатой матрице ===

Применение метода четырёх русских в задачах ДП на примере задачи о НОП — различия между версиями

Версия 19:45, 7 января 2017

Содержание

Описание алгоритма

Предподсчёт

Вычисление НОП на сжатой матрице

Анализ алгоритма

Время работы

Используемая память

Источники информации

Навигация

Персональные инструменты

Пространства имён

Варианты

Просмотры

Ещё

Поиск

Навигация

Инструменты