Изменения

Динамическое программирование по профилю

1157 байт добавлено, 04:46, 21 июня 2018

→‎Пример

{{Определение

|definition='''Динамическое программирование по профилю''' (англ. ''dynamic programming with profile'') {{---}} способ оптимизации перебора количества вариантов с помощью [[Динамическое программирование|динамического программирования]], когда одно из измерений ~~не большое~~небольшое.

}}

{{Определение

== Общие принципы ==

Обычно дана таблица и надо посчитать количество замощений этой таблицы некоторыми фигурами (замощение шахматной доски доминошками). Можно перебрать все варианты и выбрать из них удовлетворяющие условию. Но можно воспользоваться методом динамического программирования по профилю и сократить время по одной размерности до линейной. Затем пусть у нас есть правило по которому надо заполнить и для него нам надо <tex>k</tex> предыдущих линий. Тогда можно перебрать все замощения длиной <tex>k\times n</tex>. В итоге нужно заполнить данную таблицу этими замощениями. Получается, что если перебирать все варианты нам понадобиться <tex>O(a^{nm})</tex> времени, а если перебирать только состояния и переходить по ним нам потребуется <tex>O(a^{kn}m)</tex> времени (где <tex>a</tex> {{- --}} количество способов ~~замещения <tex>1</tex>~~ замощения одной клетки).

== '''Задача о замощении домино''' ==

==='''Решение'''===

[[Файл:Домино.png|270px|thumb|right|Переходы (1-правильный переход, 2,3-неправильные)]]

Для удобства можно хранить профили в виде двоичных масок.

В качестве состояния динамики будем использовать профили размерами <tex>n</tex>. В этом профиле <tex>1</tex> будет означать, что домино лежит горизонтально и заканчивается на этом столбце, иначе <tex>0</tex>. Таких профилей будет <tex>2^n</tex>.

Теперь проверим из какого профиля в какой можно перейти.

~~[[Файл:Домино.png|270px|thumb|right|Переходы (1-правильный переход, 2,3-неправильные)]]~~

Из профиля <tex>i</tex> в профиль <tex>j</tex> можно перейти если выполняются условия:

Тогда <tex>a[k][i]=\displaystyle \sum_{j=0}^{2^n -1} a[k-1][j]\cdot d[j][i]</tex>

Ответом будет <tex> \sum a[m][i]</tex>, где <tex>i</tex> {{---}} профиль, который может быть последним (т.е. все группы из <tex>0</tex> имеют четные размеры).

==='''Реализация'''===

// n, m {{- --}} размер таблицы '''for''' <tex>\mathtt{i } = \mathtt{0}..(\mathtt{1}<<\ \mathtt{n}) - \mathtt{1}</tex> '''for''' <tex>\mathtt{j } = \mathtt{0}..(\mathtt{1}<<\ \mathtt{n}) - \mathtt{1}</tex> '''if''' можно перейти из <tex>\mathtt{i}</tex> в <tex>\mathtt{j}</tex> профиль <tex>\mathtt{d}[\mathtt{i}][\mathtt{j}] = \mathtt{1}</tex>

'''else'''

<tex>\mathtt{d}[\mathtt{i}][\mathtt{j}] = \mathtt{0}</tex>

<tex>\mathtt{a}[\mathtt{0}][\mathtt{0}] = \mathtt{1}</tex> // Так как мы можем начать только с профиля где все клетки 0

'''for''' <tex>k = \mathtt{1}..\mathtt{m } - \mathtt{1} </tex> '''for''' <tex>\mathtt{i } = \mathtt{0}..(\mathtt{1}<<\ \mathtt{n}) - \mathtt{1}</tex> '''for''' <tex>\mathtt{j } = \mathtt{0}..(\mathtt{1}<<\ \mathtt{n}) - \mathtt{1}</tex> <tex>\mathtt{a}[\mathtt{k}][\mathtt{i}] = \mathtt{a}[\mathtt{k}][\mathtt{i}] + \mathtt{a}[\mathtt{k } - \mathtt{1}][\mathtt{j}] \cdot \mathtt{d}[\mathtt{j}][\mathtt{i}]</tex> <tex>\mathtt{ans } = \mathtt{0}</tex> '''for''' <tex>\mathtt{i } = \mathtt{0}..(\mathtt{1}<<\lt \lt \ \mathtt{n}) - \mathtt{1}</tex> '''if''' можно закончить <tex>\mathtt{i}</tex> профилем <tex>\mathtt{ans } = \mathtt{ans } + \mathtt{a}[\mathtt{m } - \mathtt{1}][\mathtt{i}]</tex> '''return''' <tex>\mathtt{ans}</tex>

''' Оценка сложности: '''

подсчет <tex>d - 2^{2n}</tex> , и подсчет <tex>a - 2^{2n}m</tex> в итоге <tex>O(2^{2n}m)</tex>.

''' Оценка памяти: '''

Тогда <tex>a[k][i]=\displaystyle \sum_{j=0}^{2^n -1} a[k-1][j]\cdot d[j][i]</tex>

Ответом будет <tex> \displaystyle \sum_{ji=0}^{2^n -1} a[m][i]</tex>

==='''Реализация'''===

// n, m {{- --}} размер таблицы '''for''' <tex>\mathtt{i } = \mathtt{0}..(\mathtt{1}<<\ \mathtt{n}) - \mathtt{1}</tex> '''for''' <tex>\mathtt{j } = \mathtt{0}..(\mathtt{1}<<\ \mathtt{n}) - \mathtt{1}</tex> '''if''' можно перейти из <tex>\mathtt{i}</tex> в <tex>\mathtt{j}</tex> профиль <tex>\mathtt{d}[\mathtt{i}][\mathtt{j}]\ =\ \mathtt{1}</tex>

'''else'''

<tex>\mathtt{d}[\mathtt{i}][\mathtt{j}]\ =\ \mathtt{0}</tex> '''for''' <tex>\mathtt{i } = \mathtt{0}..(\mathtt{1}<<\ \mathtt{n}) - \mathtt{1}</tex> <tex>\mathtt{a}[i0][0\mathtt{i}]\ = \mathtt{1}</tex> // Так как мы можем начать c любого профиля '''for''' <tex>\mathtt{k } = \mathtt{1}..\mathtt{m } - \mathtt{1} </tex> '''for''' <tex>\mathtt{i } = \mathtt{0}..(\mathtt{1}<<\ \mathtt{n}) - \mathtt{1}</tex> '''for''' <tex>\mathtt{j } = \mathtt{0}..(\mathtt{1}<<\ \mathtt{n}) - \mathtt{1}</tex> <tex>\mathtt{a}[\mathtt{k}][\mathtt{i}] = \mathtt{a}[\mathtt{k}][\mathtt{i}] + \mathtt{a}[\mathtt{k } - 1][\mathtt{j}] \cdot \mathtt{d}[\mathtt{j}][\mathtt{i}]</tex> <tex>\mathtt{ans } = \mathtt{0}</tex> '''for''' <tex>\mathtt{i } = \mathtt{0}..(\mathtt{1}<<\ \mathtt{n}) - \mathtt{1}</tex> <tex>\mathtt{ans } = \mathtt{ans } + \mathtt{a}[\mathtt{m } - \mathtt{1}][\mathtt{i}]</tex> // Так как мы можем закончить любым профилем '''return''' <tex>\mathtt{ans}</tex>

''' Оценка сложности: '''

подсчет <tex>d - 2^{2n}</tex> , и подсчет <tex>a - 2^{2n}m</tex> в итоге <tex>O(2^{2n}m)</tex>.

''' Оценка памяти: '''

Это очень сильная оптимизация динамики по профилю. Идея в том, чтобы добиться как можно меньшего числа переходов (от одного профиля к другому).

=== Пример ===Еще раз используем в качестве примера задачу о замощении. Базовая линия теперь будет ломаной: при прохождении через <tex>i</tex>-ю ~~горизонталь~~ вертикаль сверху вниз, она переходит на предыдущую вертикаль и спускается до низу. Теперь профиль — это не только маска, но ещё и место излома.

[[Файл:img34.gif|300px|thumb|right|]]

Профилем будет пара <tex>(p, i)</tex>, в <tex>p</tex> будет информация о <tex>n + 1</tex> маленьком квадратике слева от базовой линии, имеющем с ней общие точки; <tex>i</tex> обозначает номер горизонтали, на которой произошел излом. Квадратики профиля будут нумероваться сверху вниз, так что угловой будет иметь номер <tex>i + 1</tex>. Горизонтали будем нумеровать с нуля, так что <tex>i</tex> пробегает значения от <tex>0</tex> до <tex>n - 1</tex>.

Пусть <tex>d[ipr_1][jpr_2] = 1</tex> если из профиля <tex>pr_1</tex> = <tex>(p_1, i_1)</tex> можно перейти в <tex>pr_2 = (p_2, i_2)</tex>, иначе <tex>0</tex>.

* Eсли <tex>i < n - 1</tex>, то <tex>i_1 + 1 = i_2</tex>, иначе <tex>i_2 = 0 </tex>;

//Для профиля (p, i) выводятся все переходы из него (нумерация горизонталей начинается с нуля и i = 0..n - 1)

// Функция bit(x,i), возвращающая единицу или ноль или i-й бит в двоичной записи числа x

'''print_all_links'''(<tex>\mathtt{p}</tex>, <tex>\mathtt{i}</tex>): '''if''' <tex>\mathtt{bit}(\mathtt{p, \mathtt{i } + \mathtt{1}}) == \mathtt{0}</tex> '''if''' <tex>\mathtt{i } == \mathtt{n } - \mathtt{1}</tex> '''println'''<tex>((\mathtt{p } - (\mathtt{2 } << \ \mathtt{i})) << \ \mathtt{1}</tex>, " ", <tex>\mathtt{0})</tex>

'''else'''

'''println'''<tex>(\mathtt{p } - (\mathtt{2 } << \ \mathtt{i})</tex>, " ", <tex>\mathtt{i } + \mathtt{1})</tex>

'''else'''

'''if''' <tex>\mathtt{bit}(\mathtt{p}, \mathtt{i}) == \mathtt{0}</tex> '''if''' <tex>\mathtt{i } == \mathtt{n } - \mathtt{1 } </tex> '''println'''<tex>((\mathtt{p} << \ \mathtt{1})</tex>, " ", <tex>\mathtt{0})</tex>

'''else'''

'''println'''<tex>(\mathtt{p } + (\mathtt{1 } << i\ \mathtt{n})</tex>, " ", <tex>(\mathtt{i } + \mathtt{1}) % \mathtt{n})</tex> '''if''' <tex>\mathtt{i } < \mathtt{n } - \mathtt{1}</tex> && <tex>\mathtt{bit}(\mathtt{p, \mathtt{i } + \mathtt{2}}) == \mathtt{0}</tex> '''println'''<tex>(\mathtt{p } + (\mathtt{4 } << \ \mathtt{i})</tex>, " ", <tex>\mathtt{i } + \mathtt{1})</tex>

[[Файл:ok.jpg|640px|thumb|left|Возможные переходы]]

Отождествим все профили с один переходом с теми, кто их них получается. Это будет выглядеть так: пусть <tex>pr_2</tex> (и только он) получается из <tex>pr_1</tex>, который, в свою очередь, получается из <tex>pr_0</tex>. Тогда имеются такие соотношения: <tex>d[pr_0, pr_1] = 1</tex>, <tex>d[pr_1, pr_2] = 1</tex>. Отождествить <tex>pr_1</tex> и <tex>pr_2</tex> {{---}} это, по сути, заменить эти два соотношение на одно, то есть теперь <tex>d[pr_0, pr_1] = 0</tex> и <tex>d[pr_1, pr_2] = 0</tex>, но <tex>d[pr_0, pr_2] = 1</tex>, и так далее.

Таким образом, возможно сокращение профилей не менее чем вдвое. ~~Дальнейшие~~ Хотя можно совершить дальнейшие оптимизации ~~мы оставляем читателю~~. В итоге ~~получаем асимптотику~~ асимптотика составляет <tex>O(2^nnm)</tex>. ~~Она~~ Это доказывает, что данный метод значительно лучше ~~всего, что мы получали до сих пор, и это серьезный повод использовать изломанный профиль вместо обычного~~простого способа подсчёта динамики.

== См. также ==

== Источники информации ==

*[http://informatics.mccme.ru/moodle/file.php/9/dyn_prof.pdf Динамическое программирование по профилю]

*[http://informatics.mccme.ru/mod/book/view.php?id=290&chapterid=78 Динамическое программирование по изломанному профилю]

[[Категория: Дискретная математика и алгоритмы]]

[[Категория: Динамическое программирование]]

Анонимный участник

93.175.2.121

Изменения

Динамическое программирование по профилю

Навигация

Персональные инструменты

Пространства имён

Варианты

Просмотры

Ещё

Поиск

Навигация

Инструменты