Изменения

Перейти к: навигация, поиск

Динамическое программирование по профилю

1157 байт добавлено, 04:46, 21 июня 2018
Пример
{{Определение
|definition='''Динамическое программирование по профилю''' (англ. ''dynamic programming with profile'') {{---}} способ оптимизации перебора количества вариантов с помощью [[Динамическое программирование|динамического программирования]], когда одно из измерений не большоенебольшое.
}}
{{Определение
== Общие принципы ==
Обычно дана таблица и надо посчитать количество замощений этой таблицы некоторыми фигурами (замощение шахматной доски доминошками). Можно перебрать все варианты и выбрать из них удовлетворяющие условию. Но можно воспользоваться методом динамического программирования по профилю и сократить время по одной размерности до линейной. Затем пусть у нас есть правило по которому надо заполнить и для него нам надо <tex>k</tex> предыдущих линий. Тогда можно перебрать все замощения длиной <tex>k\times n</tex>. В итоге нужно заполнить данную таблицу этими замощениями. Получается, что если перебирать все варианты нам понадобиться <tex>O(a^{nm})</tex> времени, а если перебирать только состояния и переходить по ним нам потребуется <tex>O(a^{kn}m)</tex> времени (где <tex>a</tex> {{- --}} количество способов замещения <tex>1</tex> замощения одной клетки).
== '''Задача о замощении домино''' ==
==='''Решение'''===
[[Файл:Домино.png|270px|thumb|right|Переходы (1-правильный переход, 2,3-неправильные)]]
Для удобства можно хранить профили в виде двоичных масок.
В качестве состояния динамики будем использовать профили размерами <tex>n</tex>. В этом профиле <tex>1</tex> будет означать, что домино лежит горизонтально и заканчивается на этом столбце, иначе <tex>0</tex>. Таких профилей будет <tex>2^n</tex>.
Теперь проверим из какого профиля в какой можно перейти.
 
[[Файл:Домино.png|270px|thumb|right|Переходы (1-правильный переход, 2,3-неправильные)]]
Из профиля <tex>i</tex> в профиль <tex>j</tex> можно перейти если выполняются условия:
Тогда <tex>a[k][i]=\displaystyle \sum_{j=0}^{2^n -1} a[k-1][j]\cdot d[j][i]</tex>
Ответом будет <tex> \sum a[m][i]</tex>, где <tex>i</tex> {{---}} профиль, который может быть последним (т.е. все группы из <tex>0</tex> имеют четные размеры).
==='''Реализация'''===
<font color=green>// n, m {{- --}} размер таблицы </font> '''for''' <tex>\mathtt{i } = \mathtt{0}..(\mathtt{1}<<\ \mathtt{n}) - \mathtt{1}</tex> '''for''' <tex>\mathtt{j } = \mathtt{0}..(\mathtt{1}<<\ \mathtt{n}) - \mathtt{1}</tex> '''if''' можно перейти из <tex>\mathtt{i}</tex> в <tex>\mathtt{j}</tex> профиль <tex>\mathtt{d}[\mathtt{i}][\mathtt{j}] = \mathtt{1}</tex>
'''else'''
<tex>\mathtt{d}[\mathtt{i}][\mathtt{j}] = \mathtt{0}</tex>
<tex>\mathtt{a}[\mathtt{0}][\mathtt{0}] = \mathtt{1}</tex> <font color=green>// Так как мы можем начать только с профиля где все клетки 0 </font>
'''for''' <tex>k = \mathtt{1}..\mathtt{m } - \mathtt{1} </tex> '''for''' <tex>\mathtt{i } = \mathtt{0}..(\mathtt{1}<<\ \mathtt{n}) - \mathtt{1}</tex> '''for''' <tex>\mathtt{j } = \mathtt{0}..(\mathtt{1}<<\ \mathtt{n}) - \mathtt{1}</tex> <tex>\mathtt{a}[\mathtt{k}][\mathtt{i}] = \mathtt{a}[\mathtt{k}][\mathtt{i}] + \mathtt{a}[\mathtt{k } - \mathtt{1}][\mathtt{j}] \cdot \mathtt{d}[\mathtt{j}][\mathtt{i}]</tex> <tex>\mathtt{ans } = \mathtt{0}</tex> '''for''' <tex>\mathtt{i } = \mathtt{0}..(\mathtt{1}<<\lt \lt \ \mathtt{n}) - \mathtt{1}</tex> '''if''' можно закончить <tex>\mathtt{i}</tex> профилем <tex>\mathtt{ans } = \mathtt{ans } + \mathtt{a}[\mathtt{m } - \mathtt{1}][\mathtt{i}]</tex> '''return''' <tex>\mathtt{ans}</tex>
''' Оценка сложности: '''
подсчет <tex>d - 2^{2n}</tex> , и подсчет <tex>a - 2^{2n}m</tex> в итоге <tex>O(2^{2n}m)</tex>.
''' Оценка памяти: '''
Тогда <tex>a[k][i]=\displaystyle \sum_{j=0}^{2^n -1} a[k-1][j]\cdot d[j][i]</tex>
Ответом будет <tex> \displaystyle \sum_{ji=0}^{2^n -1} a[m][i]</tex>
==='''Реализация'''===
<font color=green>// n, m {{- --}} размер таблицы </font> '''for''' <tex>\mathtt{i } = \mathtt{0}..(\mathtt{1}<<\ \mathtt{n}) - \mathtt{1}</tex> '''for''' <tex>\mathtt{j } = \mathtt{0}..(\mathtt{1}<<\ \mathtt{n}) - \mathtt{1}</tex> '''if''' можно перейти из <tex>\mathtt{i}</tex> в <tex>\mathtt{j}</tex> профиль <tex>\mathtt{d}[\mathtt{i}][\mathtt{j}]\ =\ \mathtt{1}</tex>
'''else'''
<tex>\mathtt{d}[\mathtt{i}][\mathtt{j}]\ =\ \mathtt{0}</tex> '''for''' <tex>\mathtt{i } = \mathtt{0}..(\mathtt{1}<<\ \mathtt{n}) - \mathtt{1}</tex> <tex>\mathtt{a}[i0][0\mathtt{i}]\ = \mathtt{1}</tex> <font color=green >// Так как мы можем начать c любого профиля</font> '''for''' <tex>\mathtt{k } = \mathtt{1}..\mathtt{m } - \mathtt{1} </tex> '''for''' <tex>\mathtt{i } = \mathtt{0}..(\mathtt{1}<<\ \mathtt{n}) - \mathtt{1}</tex> '''for''' <tex>\mathtt{j } = \mathtt{0}..(\mathtt{1}<<\ \mathtt{n}) - \mathtt{1}</tex> <tex>\mathtt{a}[\mathtt{k}][\mathtt{i}] = \mathtt{a}[\mathtt{k}][\mathtt{i}] + \mathtt{a}[\mathtt{k } - 1][\mathtt{j}] \cdot \mathtt{d}[\mathtt{j}][\mathtt{i}]</tex> <tex>\mathtt{ans } = \mathtt{0}</tex> '''for''' <tex>\mathtt{i } = \mathtt{0}..(\mathtt{1}<<\ \mathtt{n}) - \mathtt{1}</tex> <tex>\mathtt{ans } = \mathtt{ans } + \mathtt{a}[\mathtt{m } - \mathtt{1}][\mathtt{i}]</tex> <font color=green>// Так как мы можем закончить любым профилем </font> '''return''' <tex>\mathtt{ans}</tex>
''' Оценка сложности: '''
подсчет <tex>d - 2^{2n}</tex> , и подсчет <tex>a - 2^{2n}m</tex> в итоге <tex>O(2^{2n}m)</tex>.
''' Оценка памяти: '''
Это очень сильная оптимизация динамики по профилю. Идея в том, чтобы добиться как можно меньшего числа переходов (от одного профиля к другому).
=== Пример ===Еще раз используем в качестве примера задачу о замощении. Базовая линия теперь будет ломаной: при прохождении через <tex>i</tex>-ю горизонталь вертикаль сверху вниз, она переходит на предыдущую вертикаль и спускается до низу. Теперь профиль — это не только маска, но ещё и место излома.
[[Файл:img34.gif|300px|thumb|right|]]
Профилем будет пара <tex>(p, i)</tex>, в <tex>p</tex> будет информация о <tex>n + 1</tex> маленьком квадратике слева от базовой линии, имеющем с ней общие точки; <tex>i</tex> обозначает номер горизонтали, на которой произошел излом. Квадратики профиля будут нумероваться сверху вниз, так что угловой будет иметь номер <tex>i + 1</tex>. Горизонтали будем нумеровать с нуля, так что <tex>i</tex> пробегает значения от <tex>0</tex> до <tex>n - 1</tex>.
Пусть <tex>d[ipr_1][jpr_2] = 1</tex> если из профиля <tex>pr_1</tex> = <tex>(p_1, i_1)</tex> можно перейти в <tex>pr_2 = (p_2, i_2)</tex>, иначе <tex>0</tex>.
* Eсли <tex>i < n - 1</tex>, то <tex>i_1 + 1 = i_2</tex>, иначе <tex>i_2 = 0 </tex>;
<font color=green>//Для профиля (p, i) выводятся все переходы из него (нумерация горизонталей начинается с нуля и i = 0..n - 1)</font>
<font color=green>// Функция bit(x,i), возвращающая единицу или ноль или i-й бит в двоичной записи числа x</font>
'''print_all_links'''(<tex>\mathtt{p}</tex>, <tex>\mathtt{i}</tex>): '''if''' <tex>\mathtt{bit}(\mathtt{p, \mathtt{i } + \mathtt{1}}) == \mathtt{0}</tex> '''if''' <tex>\mathtt{i } == \mathtt{n } - \mathtt{1}</tex> '''println'''<tex>((\mathtt{p } - (\mathtt{2 } << \ \mathtt{i})) << \ \mathtt{1}</tex>, " ", <tex>\mathtt{0})</tex>
'''else'''
'''println'''<tex>(\mathtt{p } - (\mathtt{2 } << \ \mathtt{i})</tex>, " ", <tex>\mathtt{i } + \mathtt{1})</tex>
'''else'''
'''if''' <tex>\mathtt{bit}(\mathtt{p}, \mathtt{i}) == \mathtt{0}</tex> '''if''' <tex>\mathtt{i } == \mathtt{n } - \mathtt{1 } </tex> '''println'''<tex>((\mathtt{p} << \ \mathtt{1})</tex>, " ", <tex>\mathtt{0})</tex>
'''else'''
'''println'''<tex>(\mathtt{p } + (\mathtt{1 } << i\ \mathtt{n})</tex>, " ", <tex>(\mathtt{i } + \mathtt{1}) % \mathtt{n})</tex> '''if''' <tex>\mathtt{i } < \mathtt{n } - \mathtt{1}</tex> && <tex>\mathtt{bit}(\mathtt{p, \mathtt{i } + \mathtt{2}}) == \mathtt{0}</tex> '''println'''<tex>(\mathtt{p } + (\mathtt{4 } << \ \mathtt{i})</tex>, " ", <tex>\mathtt{i } + \mathtt{1})</tex>
[[Файл:ok.jpg|640px|thumb|left|Возможные переходы]]
Отождествим все профили с один переходом с теми, кто их них получается. Это будет выглядеть так: пусть <tex>pr_2</tex> (и только он) получается из <tex>pr_1</tex>, который, в свою очередь, получается из <tex>pr_0</tex>. Тогда имеются такие соотношения: <tex>d[pr_0, pr_1] = 1</tex>, <tex>d[pr_1, pr_2] = 1</tex>. Отождествить <tex>pr_1</tex> и <tex>pr_2</tex> {{---}} это, по сути, заменить эти два соотношение на одно, то есть теперь <tex>d[pr_0, pr_1] = 0</tex> и <tex>d[pr_1, pr_2] = 0</tex>, но <tex>d[pr_0, pr_2] = 1</tex>, и так далее.
 Таким образом, возможно сокращение профилей не менее чем вдвое. Дальнейшие Хотя можно совершить дальнейшие оптимизации мы оставляем читателю. В итоге получаем асимптотику асимптотика составляет <tex>O(2^nnm)</tex>. Она Это доказывает, что данный метод значительно лучше всего, что мы получали до сих пор, и это серьезный повод использовать изломанный профиль вместо обычногопростого способа подсчёта динамики.
== См. также ==
== Источники информации ==
*[http://informatics.mccme.ru/moodle/file.php/9/dyn_prof.pdf Динамическое программирование по профилю]
*[http://informatics.mccme.ru/mod/book/view.php?id=290&chapterid=78 Динамическое программирование по изломанному профилю]
[[Категория: Дискретная математика и алгоритмы]]
[[Категория: Динамическое программирование]]
Анонимный участник

Навигация