Задача об оптимальном префиксном коде с сохранением порядка. Монотонность точки разреза — различия между версиями
Max 27 (обсуждение | вклад) м |
(→Монотонность точки разреза) |
||
Строка 51: | Строка 51: | ||
{{Лемма | {{Лемма | ||
| statement= | | statement= | ||
− | Если <tex> w </tex> удовлетворяет неравенству четырехугольника, то <tex> D </tex> также удовлетворяет неравенству четырехугольника, то есть: | + | Если <tex> w </tex> удовлетворяет неравенству четырехугольника и монотонна по включению (то есть $w[i'][j] \le w[i][j']$ при $i \leqslant i' \leqslant j \leqslant j'$), то <tex> D </tex> также удовлетворяет неравенству четырехугольника, то есть: |
<tex>\forall i \leqslant i' \leqslant j \leqslant j' : D[i][j] + D[i'][j'] \leqslant D[i'][j] + D[i][j'] </tex>. | <tex>\forall i \leqslant i' \leqslant j \leqslant j' : D[i][j] + D[i'][j'] \leqslant D[i'][j] + D[i][j'] </tex>. | ||
Строка 64: | Строка 64: | ||
## <tex> k \leqslant j </tex> | ## <tex> k \leqslant j </tex> | ||
##: <tex> D[i][j] + D[j][j'] \leqslant w[i][j] + D[i][k-1] + D[k][j] + D[j][j'] </tex> {{---}} по определению <tex> D[i][j] </tex> | ##: <tex> D[i][j] + D[j][j'] \leqslant w[i][j] + D[i][k-1] + D[k][j] + D[j][j'] </tex> {{---}} по определению <tex> D[i][j] </tex> | ||
− | ##: <tex> \leqslant w[i][j'] + D[i][k-1] + D[k][j] + D[j][j'] </tex> {{---}} так как <tex> w[i][j'] \geqslant w[i][j] </tex> | + | ##: <tex> \leqslant w[i][j'] + D[i][k-1] + D[k][j] + D[j][j'] </tex> {{---}} так как <tex> w[i][j'] \geqslant w[i][j] </tex> по монотонности |
##: <tex> \leqslant w[i][j'] + D[i][k-1] + D[k][j'] </tex> {{---}} по индукционному предположению для <tex> D </tex> | ##: <tex> \leqslant w[i][j'] + D[i][k-1] + D[k][j'] </tex> {{---}} по индукционному предположению для <tex> D </tex> | ||
##: <tex> \leqslant D[i][j'] </tex> {{---}} по определению <tex> D[i][j'] </tex> | ##: <tex> \leqslant D[i][j'] </tex> {{---}} по определению <tex> D[i][j'] </tex> |
Версия 18:52, 16 января 2022
Определение: |
Оптимальный префиксный код с сохранением порядка (англ. order-preserving code, alphabetic code).
Пусть у нас есть алфавит . Каждому символу сопоставим его код . Кодирование называется оптимальным префиксным с сохранением порядка (алфавитным), если соблюдаются:
|
Содержание
Алгоритм
Решим задачу, используя ДП на подотрезках. Пусть в ячейке
хранится минимальная стоимость кодового дерева для отрезка алфавита от до .Тогда пересчет
будет происходить так:
Базой динамики будет
Добавочный член
возникает от того что каждым объединением двух подотрезков мы увеличиваем высоту дерева на , а значит, и длины всех кодов символов также увеличиваются на .Тогда такое наибольшее
, на котором достигается этот минимум, называется точкой разреза для отрезка . Пусть в ячейке хранится точка разреза на отрезке .Если разрез происходит по какому-то определенному индексу
, такой разрез обозначим .Таким образом, получили алгоритм, работающий за
. Коды каждого символа можно легко получить так же, как в алгоритме Хаффмана — обходом по построенному дереву.Если доказать монотонность точки разреза, то можно уменьшить асимптотику алгоритма до
.Монотонность точки разреза
Для доказательства этого сперва докажем несколько лемм.
Определение: |
Функция
| удовлетворяет неравенству четырехугольника (англ. quadrangle inequation), если
Лемма: |
удовлетворяет неравенству четырехугольника. |
Доказательство: |
Заметим, что , так как — простая арифметическая сумма. Тогда: |
Лемма: |
Если удовлетворяет неравенству четырехугольника и монотонна по включению (то есть $w[i'][j] \le w[i][j']$ при $i \leqslant i' \leqslant j \leqslant j'$), то также удовлетворяет неравенству четырехугольника, то есть:
. |
Доказательство: |
При или , очевидно, неравенство выполняется.Рассмотрим два случая:
|
Теорема (Монотонность точки разреза): |
Если удовлетворяет неравенству четырехугольника, то:
. |
Доказательство: |
В случае неравенство, очевидно, выполняется. Рассматриваем случай и только случай (вторая часть доказывается аналогично):Так как — максимальный индекс, в котором достигается минимум, достаточно показать, что:
Докажем более сильное неравенство:
|
Объяснение квадратичной асимптотики
Рассмотрим матрицу
. Так как отрезки , где мы не рассматриваем, она будет верхнетреугольной. Вначале она будет заполнена так, что (так как для отрезка, состоящего из одного элемента, он же и является точкой разреза). Далее, для любого элемента его значения лежат между (левый элемент в матрице) и (нижний элемент в матрице). Так как мы используем динамику по подотрезкам, то сначала мы рассчитаем для отрезков длины , затем , и так далее до . Фактически, мы будем обходить диагонали матрицы, количество которых равно .Рассмотрим элемент
. Для него выполняется . Следующий элемент, который мы будем пересчитывать — . Для него выполняется . Таким образом, заполняя одну диагональ, алгоритм сделает не более шагов, а так как диагоналей , получили асимптотику .Источники информации
- S.V. Nagaraj — Tutorial: Optimal binary search trees
- Кнут Д.Э. — Искусство программирования, том 3. Сортировка и поиск. — М.: «Вильямс», 2005, стр. 486 - 488