Кодирование информации
Определение: |
Кодирование информации — отображение данных на кодовые слова. |
Обычно в процессе кодирования информация преобразуется из формы, удобной для непосредственного использования, в форму, удобную для передачи, хранения или автоматической обработки. В более узком смысле кодированием информации называют представление информации в виде кода. Средством кодирования служит таблица соответствия знаковых систем, которая устанавливает взаимно однозначное соответствие между знаками или группами знаков двух различных знаковых систем.
Содержание
Код
Определение: |
Код — правило (алгоритм) сопоставления каждому конкретному сообщению строго определённой комбинации символов (знаков или сигналов). Кодом также называется отдельная комбинация таких символов (знаков) — слово. Для различия этих терминов, код в последнем значении ещё называется кодовым словом. |
Пусть— множество исходных символов, — кодовый алфавит, — строчки из . Код — отображение . .
Виды кодов
- Код фиксированной длины (fixed-length code) — кодирование каждого символа производится с помощью строк одинаковой длины. Также он называется равномерным или блоковым кодом.
Утверждение: |
Любой равномерный код является взаимно однозначным. |
- Код переменной длины (variable-length code) — кодирование производится с помощью строк переменной длины. Также называется неравномерным кодом.
- Разделимый код (однозначно декодируемый) — код, в котором никаким двум словам кодируемого алфавита не может быть сопоставлен один и тот же код.
- Префиксный код — код, в котором, никакое кодовое слово не является началом другого.
Утверждение: |
Любое префиксное кодирование является взаимно однозначным. |
- Постфиксный код (суффиксный) — код, в котором никакое кодовое слово не является концом другого.
Утверждение: |
Любое постфиксное кодирование является взаимно однозначным. |
Примеры кодов
- Азбука Морзе
- ASCII
Однозначно декодируемый код
Определение: |
Однозначно декодируемый код — код, в котором любое слово составленное из кодовых слов можно декодировать только единственным способом. |
Пусть есть код заданный следующей кодовой таблицей.; ; ... ; Составим слово из кодов с использование операции конкатенации: В этом случае, если код однозначно декодируемый, то и выполняется равенство: ; ; ... ;
Заметим, что если среди кодовых слов будут одинаковые, то однозначно декодировать этот код мы уже не сможем.
Где
— кодовый алфавит, а — строчки (слова) из .Теорема (Марков А.А.): | ||||||
Пусть - некоторое кодирование.Пусть — максимальное число кодовых слов, которые "помещаются" подряд внути кодового слова. Пусть - длина слова и . Тогда если кодирование не взаимно однозначно, то существуют два различных слова , , , и | ||||||
Доказательство: | ||||||
Пусть не является взаимно однозначным. Тогда существует некоторое слово , которое допускает две расшифровки. Если слово не является неприводимым, то выбрасывая из куски несколько раз, получим неприводимое слово ; иначе, положим . Очевидно, это всегда можно сделать. Рассмотрим любые две декодировки слова . Разрежем слово в концевых точках кодовых слов каждого из разбиений. Слова нового разбиения разделим на два класса: к I классу отнесём слова, являющиеся элементарными кодами, а ко II классу — все остальные слова (то есть слова, являющиеся началами кодовых слов одного разбиения и концами слов второго разбиения).
| ||||||
Не префиксный и не постфиксный однозначно декодируемый код
Пример:
; ; Возьмём кодовую строку: Мы можем ее однозначно декодировать, т.к. знаем, что слева от двойки и справа от тройки всегда стоит единица.
Алгоритм декодировки:
1. Найдем в кодовой строке все двойки и заменим последовательностьна символ 2. Найдем в кодовой строке все тройки и заменим последовательность на символ 3. Все оставшиеся единички декодируем как символ
В таком случае получаем:
Но, такой код используется очень редко, потому что для его декодировки нужно получить все сообщение целиком.
Префиксный код
Определение: |
Префиксный код — код, в котором никакое кодовое слово не является префиксом какого-то другого кодового слова. |
Любой префиксный код является однозначно декодируемым и разделимым. Также префиксный код иногда называют мгновенным кодом[1].
Предпочтение префиксным кодам отдается из-за того, что они упрощают декодирование. Поскольку никакое кодовое слово не выступает в роли префикса другого, кодовое слово, с которого начинается файл, определяется однозначно, как и все последующие кодовые слова. Поэтому можно декодировать сообщение не получая его целиком, а по мере его поступления. Благодаря этому, префиксный код еще называют мгновенно декодируемым.
Использование префиксного кода очень выгодно для кодирования больших аудио/видео файлов, в этом случае мы сможем слушать/смотреть файл по мере скачивания.
Пример:
; Закодируем строку:
Такой код можно однозначно разбить на слова:
поэтому он является префиксным.
Недостатки префиксных кодов
- Так как префиксные коды являются кодами переменной длины, а данные, в основном, считываются блочно, код приходится считывать побитово, что значительно замедляет скорость считывания данных
- При появлении ошибок в кодовой комбинации, при определенных обстоятельствах, может привести к неправильному декодированию не только данной, но и последующей кодовой комбинации, в отличии от равномерных кодов, где ошибка в кодовой комбинации приводит к неправильному декодированию только ее.
Предположим, что предыдущая последовательность передалась неверно и стала:Разобьем ее согласно словарю:
Полученная строка совпадает только в битах, которые находились до ошибочного, поэтому декодирование неравномерного кода, содержащего ошибки, может дать абсолютно неверные результаты.
- Необходимость хранить словарь декодировки символов.
Примеры префиксных кодов
- Код Хаффмана
- Код Шеннона-Фано
См. также
Примечания
- ↑ Джеймс Андерсон. "Дискретная математика и комбинаторика", 2004г. Глава 18. Теория кодов. стр. 754
Литература
- Томас Кормен, Чарльз Лейзерсон, Рональд Ривест, Клиффорд Штайн. Алгоритмы. Построение и анализ — Издательство: «Вильямс», 2011 г. - 1296 стр. — ISBN 978-5-8459-0857-5, 5-8459-0857-4, 0-07-013151-1
- Джеймс Андерсон. Дискретная математика и комбинаторика — Издательство: «Вильямс», 2004 г. - 960 стр. — ISBN 978-0-13-086998-2
- Новиков. Ф.А. Дискретная математика для программистов — Издательство: «Питер», 2001 г. - 304 стр. — ISBN 5-94723-741-5 978-5-94723-741-2