Неравенство Макмиллана
Необходимые определения
| Определение: |
| Пусть заданы два произвольных конечных множества, которые называются, соответственно, кодируемым алфавитом и кодирующим алфавитом. Их элементы называются символами, а строки (последовательности конечной длины) символов — словами. Длина слова — это число символов, из которого оно состоит. |
В качестве кодирующего алфавита часто рассматривается множество — так называемый двоичный или бинарный алфавит.
| Определение: |
| Кодом для алфавита называется функция , которая для каждого символа из указывает слово , кодирующее этот символ. |
| Определение: |
| Код называется однозначным, если никаким двум словам кодируемого алфавита не может быть сопоставлен один и тот же код.. |
Неравенство Макмиллана
| Теорема: |
(где , а — длины кодовых слов) выполняется не только для любого префиксного кода, но и вообще для любого однозначного кода. |
| Доказательство: |
|
Есть разные способы решить эту задачу, но будет приведено простое и красивое, хотя и несколько загадочное, решение. Вместо нулей и единиц будем использовать и (из чего составлять коды разницы нет). Запишем формально сумму всех кодовых слов как алгебраическое выражение (многочлен от и , в котором одночлены записаны как произведения переменных и , без возведения в степень). Теперь (ещё более странное на первый взгляд действие) возведём это в степень (произвольное натуральное число) и раскроем скобки, сохраняя порядок переменных (не собирая вместе одинаковые переменные) в одночленах: сумма одночленов. Например, для кода со словами (которые теперь записываются как ) и для получаем В этом примере все одночлены в правой части различны (если не переставлять переменные), и это не случайно: так будет для любого однозначного кода. В самом деле, по определению однозначности никакое слово не может быть получено двумя способами при соединении кодовых слов. Теперь подставим в наше неравенство (если оно верно для букв, то оно верно и для любых их числовых значений). Слева получится (в скобке как раз выражение из неравенства Крафта—Макмиллана). Правую часть мы оценим сверху, сгруппировав слова по длинам: имеется не более слагаемых длины , каждое из которых равно , и потому слагаемые данной длины в сумме не превосходят единицы, а правая часть не превосходит максимальной длины слагаемых, то есть . Итак, получаем, что и это верно при любом . Если основание степени в левой части больше единицы, то при больших это неравенство нарушится (показательная функция растет быстрее линейной). Поэтому, для однозначного кода выполняется неравенство Крафта—Макмиллана. Что и требовалось доказать. |
Ссылки
Литература
А. Шень "Программирование: теоремы и задачи" (Издание четвёртое, Москва, Издательство МЦНМО, 2011) стр. 206 - 210