Изменения

Задача об оптимальном префиксном коде с сохранением порядка. Монотонность точки разреза

906 байт добавлено, 18:09, 7 января 2017

м

Нет описания правки

~~__TOC__~~

~~== Определение ==~~

{{Определение

| definition =

'''[[Оптимальный префиксный код с длиной кодового слова не более L бит|Оптимальный префиксный код]] с сохранением порядка''' (англ. ''order-preserving code'', ''alphabetic code''). Пусть у нас есть алфавит <tex> \Sigma </tex>. Каждому символу <tex>c_i </tex> сопоставим его код <tex> p_i </tex>. Кодирование называется оптимальным префиксным с сохранением порядка(алфавитным), если соблюдаются:# Условие порядка {{- --}} <tex> \forall i, j : c_i < c_j \iff p_i < p_j </tex>. То есть, если символ <tex>c_i </tex> лексикографически меньше символа <tex> c_j </tex>, его код также будет [[лексикографический порядок | лексикографически]] меньше, и наоборот.# Условие оптимальности {{- --}} <tex> \sum\limits_{i = 1}^{|\Sigma|} f_i \cdot |p_i| </tex> {{--- }} минимально, где <tex> f_i </tex> {{-- -}} частота встречаемости символа <tex> c_i </tex> в тексте, а <tex> |p_i| </tex> {{- --}} длина его кода.

}}

__TOC__

== Алгоритм ==

Решим задачу, используя ДП на подотрезках. Пусть в ячейке <tex> D[i][j] </tex> хранится минимальная стоимость кодового дерева для отрезка алфавита от <tex> i </tex> до <tex> j</tex>.

Тогда пересчет <tex> D[i][j] </tex> будет происходить так:

Базой динамики будет <tex> D[i][i] = 0 </tex>

Добавочный член <tex>w[i][j] = \sum\limits_{t = i}^{j} f_t </tex> возникает от того что каждым объединением двух подотрезков мы увеличиваем высоту дерева на <tex> 1</tex>, а значит, и длины всех кодов символов <tex> c_i .. c_j </tex> также увеличиваются на <tex> 1</tex>.

Тогда такое ''наибольшее'' <tex> k</tex>, на котором достигается этот минимум, называется точкой разреза для отрезка <tex> i..j </tex>. Пусть в ячейке <tex> R[i][j] </tex> хранится точка разреза на отрезке <tex> i..j </tex>.

Если разрез происходит по какому - то определенному индексу <tex> q </tex> , такой разрез обозначим <tex> D_q[i][j] </tex>.

Таким образом, получили алгоритм, работающий за <tex> O(n^3) </tex>. Коды каждого символа можно легко получить так же, как в алгоритме ~~Хаффмена~~ Хаффмана {{- --}} обходом по построенному дереву.

Если доказать монотонность точки разреза, то можно уменьшить асимптотику алгоритма до <tex> O(n^2) </tex>.

{{Определение

| definition=

Функция <tex> a </tex> удовлетворяет '''неравенству четырехугольника''' (англ. ''quadrangle inequation)'''), если: <tex>\forall i \le leqslant i' \le leqslant j \le leqslant j' : a[i][j] + a[i'][j'] \le leqslant a[i'][j] + a[i][j']</tex>.

}}

{{Лемма

| statement=

<tex> w </tex> удовлетворяет неравенству четырехугольника.

| proof=

Заметим, что <tex> w[i][j] = w[i][t] + w[t+1][j] </tex>, так как <tex> w[i][j] </tex> {{- --}} простая арифметическая сумма. Тогда:: <tex> w[i][j] + w[i'][j'] \le leqslant w[i'][j] + w[i][j']</tex>: <tex> (w[i][i' - 1] + w[i'][j]) + (w[i'][j] + w[j + 1][j']) \le leqslant (w[i'][j]) + (w[i][i' - 1] + w[i'][j] + w[j + 1][j']) </tex>Получили <tex> 0 \~~leq~~ leqslant 0 </tex>~~, что является верным. Лемма доказана~~.

}}

{{Лемма

| statement=

Если <tex> w </tex> удовлетворяет неравенству четырехугольника, то <tex> D </tex> также удовлетворяет неравенству четырехугольника, то есть:

<tex>\forall i \le leqslant i' \le leqslant j \le leqslant j' : D[i][j] + D[i'][j'] \le leqslant D[i'][j] + D[i][j'] </tex>.

| proof=

При <tex> i = i' </tex> или <tex> j = j' </tex>, очевидно, неравенство выполняется.

# <tex> i' = j </tex>

#: <tex> i < i' = j < j' </tex>. Тогда неравенство четырехугольника сводится к:

#: <tex> D[i][j] + D[j][j'] \le leqslant D[i][j'] </tex>

#: Пусть <tex> k = R[i][j'] </tex>. Получили два симметричных случая:

## <tex> k \le leqslant j </tex>##: <tex> D[i][j] + D[j][j'] \le leqslant w[i][j] + D[i][k-1] + D[k][j] + D[j][j'] </tex> {{- --}} по определению <tex> D[i][j] </tex>##: <tex> \le leqslant w[i][j'] + D[i][k-1] + D[k][j] + D[j][j'] </tex> {{- --}} так как <tex> w[i][j'] >= \geqslant w[i][j] </tex>##: <tex> \le leqslant w[i][j'] + D[i][k-1] + D[k][j'] </tex> {{- --}} по индукционному предположению для <tex> D</tex>##: <tex> \le leqslant D[i][j'] </tex> {{- --}} по определению <tex> D[i][j'] </tex>## <tex> k \ge geqslant j </tex> {{--- }} аналогичный предыдущему случай.

# <tex> i' < j </tex>

#: <tex> i < i' < j < j' </tex>

#: Пусть <tex> y = R[i'][j] </tex> и <tex> z = R[i][j'] </tex>. Получили два симметричных случая:

## <tex> z \le leqslant y </tex>##: Получили <tex> i \le leqslant z \le leqslant y \le leqslant j </tex>. Запишем:##: <tex> D[i'][j'] + D[i][j] \le leqslant D_y[i'][j'] + D_z[i][j] = w[i'][j'] + D[i'][y-1] + D[y][j'] + w[i][j] + D[i][z-1] + D[z][j] </tex>##: <tex> \le leqslant w[i][j'] + w[i'][j] + D[i'][y-1] + D[i][z-1] + D[z][j] + D[y][j'] </tex> {{- --}} по неравенству четырехугольника для <tex> w </tex>##: <tex> \le leqslant w[i][j'] + w[i'][j] + D[i'][y-1] + D[i][z-1] + D[y][j] + D[z][j'] </tex> {{--- }} по индукционному предположению для <tex> D</tex>##: <tex> \le leqslant D[i][j'] + D[i'][j] </tex> {{-- -}} по определению <tex> D</tex>## <tex> z \ge geqslant y </tex> доказывается аналогично.~~Лемма доказана~~.

}}

Монотонность точки разреза

| statement=

Если <tex> w </tex> удовлетворяет неравенству четырехугольника, то:

<tex> \forall i \le leqslant j : R[i][j] \le leqslant R[i][j+1] \le leqslant R[i+1][j+1] </tex> .

| proof=

В случае <tex> i = j </tex> неравенство, очевидно, выполняется. Рассматриваем случай <tex> i < j </tex> и только случай <tex> R[i][j] \le leqslant R[i][j+1] </tex>(вторая часть доказывается аналогично):

Так как <tex> R[i][j] </tex> {{--- }} максимальный индекс, в котором достигается минимум, достаточно показать, что:: <tex> \forall i < k \le leqslant k' \le leqslant j: [D_{k'}[i][j] \le leqslant D_k[i][j]] \Rightarrow [D_{k'}[i][j+1] \le leqslant D_k[i][j+1]] </tex> {{--- }} фактически, это означает что если на отрезке <tex> i..j </tex> разрез оптимальнее по <tex> k' </tex>, чем по <tex> k </tex>, то он также будет оптимальнее и на отрезке <tex> i..j+1 </tex>.

Докажем более сильное неравенство:

: <tex> \forall i < k \le leqslant k' \le leqslant j: D_k[i][j] - D_{k'}[i][j] \le leqslant D_k[i][j+1] - D_{k'}[i][j+1] </tex>

: <tex> D_k[i][j] + D_{k'}[i][j+1] \le leqslant D_k[i][j+1] + D_{k'}[i][j] </tex>

: <tex> (w[i][j] + D[i][k-1] + D[h][j]) + (w[i][j+1] + D[i][k'-1] + D[k][j+1]) \le leqslant (w[i][j+1] + D[i][k-1] + D[k][j+1]) + (w[i][j] + D[i][k'-1] + D[k'][j]) </tex> {{- --}} по определению <tex> D</tex>

: <tex> D[k][j] + D[k'][j+1] \le leqslant D[k][j+1] + D[k'][j] </tex> {{- --}} получили неравенство четырехугольника для <tex> k \le leqslant k' \le leqslant j \le leqslant j+1 </tex>, что является верным из предыдущей леммы~~. Теорема доказана~~.

}}

== Объяснение квадратичной асимптотики ==

Рассмотрим матрицу <tex> R</tex>. Так как отрезки <tex> i..j </tex>, где <tex> i > j </tex> мы не рассматриваем, она будет верхнетреугольной. Вначале она будет заполнена так, что <tex> R[i][i] = i </tex>(так как для отрезка, состоящего из одного элемента, он же и является точкой разреза). Далее, для любого элемента <tex> R[i][j] </tex> его значения лежат между <tex> R[i][j-1] </tex> (левый элемент в матрице) и <tex> R[i+1][j] </tex> (нижний элемент в матрице). Так как мы используем динамику по подотрезкам, то сначала мы рассчитаем R для отрезков длины 2, затем 3, и так далее до n. Фактически, мы будем обходить диагонали матрицы, количество которых равно n. ~~Рассмотрим элемент~~ <tex> R~~[i][j]~~ </tex>~~. Для него выполняется~~ для отрезков длины <tex> ~~R[i][j-1] \le R[i][j] \le R[i+1][j]~~ 2 </tex>~~. Следующий элемент~~, ~~который мы будем пересчитывать -~~ затем <tex> ~~R[i+1][j+1]~~ 3 </tex>~~. Для него выполняется~~ , и так далее до <tex> ~~R[i+1][j] \le R[i+1][j+1] \le R[i+2][j+1]~~ n </tex>. ~~Таким образом~~Фактически, ~~заполняя одну диагональ~~мы будем обходить диагонали матрицы, ~~алгоритм сделает не более n шагов, а так как диагоналей n, получили асимптотику~~ количество которых равно <tex> O(n~~^2)~~ </tex>.

~~== Использованные материалы ==~~Рассмотрим элемент <tex> R[~~http:~~i][j] </tex>. Для него выполняется <tex> R[i][j-1] \leqslant R[i][j] \leqslant R[i+1][j] </~~www~~tex>.csСледующий элемент, который мы будем пересчитывать {{---}} <tex> R[i+1][j+1] </tex>.~~ust~~Для него выполняется <tex> R[i+1][j] \leqslant R[i+1][j+1] \leqslant R[i+2][j+1] </tex>.hkТаким образом, заполняя одну диагональ, алгоритм сделает не более <tex> n </~~mjg_lib~~tex> шагов, а так как диагоналей <tex> n </~~Library~~tex>, получили асимптотику <tex> O(n^2) </~~Tut_BST~~tex>.~~pdf S.V. Nagaraj - Tutorial: Optimal binary search trees]~~

==Источники информации ==* [http://www.sciencedirect.com/science/article/pii/S0304397596003209 S.V. Nagaraj {{---}} Tutorial: Optimal binary search trees]* ''Кнут Д. Э. ~~Кнут~~ '' {{--- }} Искусство программирования: , том 3. Сортировка и поиск. — М.: «Вильямс», 2005, ~~Том 3~~стр. 486 - 488

[[Категория:Дискретная математика и алгоритмы]]

[[Категория:Динамическое программирование]]

[[Категория:Способы оптимизации методов динамического программирования]]

Max 27

19

правок

Изменения

Задача об оптимальном префиксном коде с сохранением порядка. Монотонность точки разреза

Навигация

Персональные инструменты

Пространства имён

Варианты

Просмотры

Ещё

Поиск

Навигация

Инструменты