Избыточное кодирование, код Хэмминга — различия между версиями
Glukos (обсуждение | вклад)  (→Кодирование Хэмминга)  | 
				Glukos (обсуждение | вклад)   | 
				||
| Строка 24: | Строка 24: | ||
*Вторая пара: сумма тех бит, в чьем номере второй бит с конца ноль и сумма тех бит, в чьем номере второй бит с конца единица  | *Вторая пара: сумма тех бит, в чьем номере второй бит с конца ноль и сумма тех бит, в чьем номере второй бит с конца единица  | ||
...  | ...  | ||
| − | *<tex>  | + | *<tex>k</tex>-тая пара: сумма тех бит, в чьем номере <tex>k</tex>-тый бит с конца ноль и сумма тех бит, в чьем номере <tex>k</tex>-тый бит с конца единица  | 
Легко понять, что если в одном бите из строки допущена ошибка, то с помощью дописанных <tex>k</tex> пар бит можно точно определить, какой именно бит ошибочный. Это объясняется тем, что каждая пара определяет один бит номера ошибочного бита в строке. Всего пар <tex>k</tex>, следовательно мы имеем <tex>k</tex> бит номера ошибочного бита, что вполне достаточно: общее число бит строки не превосходит <tex>2^k</tex>.  | Легко понять, что если в одном бите из строки допущена ошибка, то с помощью дописанных <tex>k</tex> пар бит можно точно определить, какой именно бит ошибочный. Это объясняется тем, что каждая пара определяет один бит номера ошибочного бита в строке. Всего пар <tex>k</tex>, следовательно мы имеем <tex>k</tex> бит номера ошибочного бита, что вполне достаточно: общее число бит строки не превосходит <tex>2^k</tex>.  | ||
Итого, увеличивая код длиной <tex>n</tex> на <tex>2\log_2 n</tex>, можно обнаружить и исправить одну ошибку.  | Итого, увеличивая код длиной <tex>n</tex> на <tex>2\log_2 n</tex>, можно обнаружить и исправить одну ошибку.  | ||
| + | |||
| + | == Расстояние Хэмминга ==  | ||
| + | '''Расстояние Хэмминга''' — число позиций, в которых соответствующие цифры двух двоичных слов одинаковой длины различны. В более общем случае расстояние Хэмминга применяется для строк одинаковой длины любых q-ичных алфавитов и служит метрикой различия (функцией, определяющей расстояние в метрическом пространстве) объектов одинаковой размерности.  | ||
| + | |||
| + | Например: <math>d(10{\color{Blue}1}1{\color{Blue}1}01, 10{\color{Red}0}1{\color{Red}0}01)=2</math>  | ||
| + | |||
| + | Расстояние Хэмминга обладает свойствами метрики, удовлетворяя следующим условиям:  | ||
| + | * <math>~d(x,y) \ge 0</math>  | ||
| + | * <math>~d(x,x)=0</math>  | ||
| + | * <math>~d(x,y)=d(y,x)</math>  | ||
| + | * <math>~d(x,z) \le d(x,y) + d(y,z)</math>  | ||
| + | |||
| + | == Определение и устранение ошибок в общем случае ==  | ||
| + | Пусть <tex>\Sigma</tex> - исходный алфавит, <tex>C: \Sigma \to B^m</tex> - код, <tex>B=(0,1)</tex>  | ||
| + | |||
| + | Определим <tex>d = \min</tex> <math>~d(c(x),c(y))</math>, <tex>x,y \in \Sigma</tex>, <tex>x<>y</tex>  | ||
| + | |||
| + | Тогда легко понять, что код, полученный преобразованием <tex>C</tex> может исправлять <math>~[</math><tex>{d-1}\over{2}</tex><math>~]</math> и обнаруживать <tex>[d-1]</tex> ошибок. Действительно, при любом натуральном количестве допустимых ошибок <tex>r</tex> любой код S образует вокруг себя проколотый шар таких строк <tex>S_i</tex>, что <tex>0<d(S,S_i)<=r</tex>. Если этот шар не содержит других кодов (что выполняется при <tex>r<d</tex>) , то можно утверждать, что если в него попадает строка, то она ошибочна. Аналогично можно утверждать, что если шары всех кодов не пересекаются (что выполняется при <tex>r<= {d-1}\over{2} </tex>), то попавшую в шар строку <tex>S_i</tex> можно тождественно исправить на центр шара <tex>-</tex> строку<tex>S</tex>.  | ||
Версия 04:35, 31 октября 2010
Избыточное кодирование - вид кодирования, использующий избыточное количество информации с целью последующего контроля целостности данных при записи/воспроизведении информации или при её передаче по линиям связи.
Содержание
Код, определяющий одну ошибку
Увеличив объем кода на 1 бит, можно получить возможность определять при передаче наличие одной ошибки. Для этого к коду нужно добавить бит x: , такой, чтобы сумма всех единиц была четной. В случае, если контрольная сумма окажется нечетной, следует отправить запрос на повторную посылку элемента, в котором была обнаружена ошибка. Такое кодирование применяется только если вероятность ошибки крайне мала, например, в оперативной памяти компьютера.
Кодирование Хэмминга
Кодирование Хэмминга предусматривает как возможность обнаружения ошибки, так и возможность её исправления. Рассмотрим простой пример закодируем четыре бита: . Полученный код будет иметь длину 8 бит и выглядеть следующим образом: Рассмотрим табличную визуализацию кода:
Как видно из таблицы, даже если один из битов передался с ошибкой, содержащие его -суммы не сойдутся. Итого, зная строку и столбец в проиллюстрированной таблице можно точно исправить ошибочный бит.
По аналогичному принципу можно закодировать любое число бит. Пусть мы имеем исходную строку длиной в бит. Для получения её кода добавим к ней пар бит по следующему принципу:
- Первая пара: сумма четных бит и сумма нечетных бит
 - Вторая пара: сумма тех бит, в чьем номере второй бит с конца ноль и сумма тех бит, в чьем номере второй бит с конца единица
 
...
- -тая пара: сумма тех бит, в чьем номере -тый бит с конца ноль и сумма тех бит, в чьем номере -тый бит с конца единица
 
Легко понять, что если в одном бите из строки допущена ошибка, то с помощью дописанных пар бит можно точно определить, какой именно бит ошибочный. Это объясняется тем, что каждая пара определяет один бит номера ошибочного бита в строке. Всего пар , следовательно мы имеем бит номера ошибочного бита, что вполне достаточно: общее число бит строки не превосходит .
Итого, увеличивая код длиной на , можно обнаружить и исправить одну ошибку.
Расстояние Хэмминга
Расстояние Хэмминга — число позиций, в которых соответствующие цифры двух двоичных слов одинаковой длины различны. В более общем случае расстояние Хэмминга применяется для строк одинаковой длины любых q-ичных алфавитов и служит метрикой различия (функцией, определяющей расстояние в метрическом пространстве) объектов одинаковой размерности.
Например:
Расстояние Хэмминга обладает свойствами метрики, удовлетворяя следующим условиям:
Определение и устранение ошибок в общем случае
Пусть - исходный алфавит, - код,
Определим , ,
Тогда легко понять, что код, полученный преобразованием может исправлять и обнаруживать ошибок. Действительно, при любом натуральном количестве допустимых ошибок любой код S образует вокруг себя проколотый шар таких строк , что . Если этот шар не содержит других кодов (что выполняется при ) , то можно утверждать, что если в него попадает строка, то она ошибочна. Аналогично можно утверждать, что если шары всех кодов не пересекаются (что выполняется при ), то попавшую в шар строку можно тождественно исправить на центр шара строку.