Неравенство Крафта
Рассматриваемое ниже неравенство Крафта показывает, для каких длин кодовых слов существует префиксный код, но приведенное ниже доказательство не является конструктивным.
Теорема (неравенство Крафта): |
Необходимое и достаточное условие существования префиксного кода для источника с алфавитом из символов , где , кодовые слова которого имеют длины , состоит в выполнении неравенства:
|
Доказательство: |
Неравенство Крафта легко доказать с помощью дерева декодирования, существование которого следует из существования префиксного кода. Будем рассуждать по индукции. Для простоты рассмотрим сначала случай двоичного алфавита, т. е. . Если максимальная длина пути на дереве равна , то в дереве есть одно или два ребра длины . Таким образом, либо — для одного символа источника, либо — для двух символов источника.Предположим далее, что неравенство Крафта справедливо для всех деревьев длины меньше . Для данного дерева максимальной длины ребра из первой вершины ведут к двум поддеревьям, длины которых не превышают ; для этих поддеревьев имеем неравенства и , где — значения соответствующих им сумм. Каждая длина в поддереве увеличивается на , когда поддерево присоединяется к основному дереву, поэтому возникает дополнительный множитель . Таким образом, имеем .В случае произвольного недвоичного основания имеется не более ребер, исходящих из каждой вершины, т. е. не более поддеревьев; каждое из них присоединяется к основному дереву, давая дополнительный множитель . Отсюда снова следует утверждение теоремы.
ЗамечанияКогда имеет место строгое неравенство? Легко заметить, что если любая концевая вершина дерева является кодовым словом, то Заметим еще раз, что теорема утверждает существование такого кода и ничего не говорит о конкретных кодах. Может существовать код, который удовлетворяет неравенству Крафта и тем не менее не является мгновенным. . Строгое неравенство имеет место лишь в случае, когда некоторые из концевых вершин не используются. Однако, в случае двоичного кодового алфавита какая-нибудь концевая вершина не используется, то предыдущее решение оказывается лишним, и соответствующая цифра может быть удалена из каждого кодового слова, декодирование которого проходит через эту вершину. Таким образом, если имеет место строгое неравенство, то код неэффективен, но для двоичных деревьев очевидно, как можно его улучшить. |