Избыточное кодирование, код Хэмминга — различия между версиями

Версия 04:35, 31 октября 2010

Эта статья находится в разработке!

Избыточное кодирование - вид кодирования, использующий избыточное количество информации с целью последующего контроля целостности данных при записи/воспроизведении информации или при её передаче по линиям связи.

Содержание

1 Код, определяющий одну ошибку
2 Кодирование Хэмминга
3 Расстояние Хэмминга
4 Определение и устранение ошибок в общем случае

Код, определяющий одну ошибку

Увеличив объем кода на 1 бит, можно получить возможность определять при передаче наличие одной ошибки. Для этого к коду нужно добавить бит x: [math]0110..10x[/math], такой, чтобы сумма всех единиц была четной. В случае, если контрольная сумма окажется нечетной, следует отправить запрос на повторную посылку элемента, в котором была обнаружена ошибка. Такое кодирование применяется только если вероятность ошибки крайне мала, например, в оперативной памяти компьютера.

Кодирование Хэмминга

Кодирование Хэмминга предусматривает как возможность обнаружения ошибки, так и возможность её исправления. Рассмотрим простой пример [math]-[/math] закодируем четыре бита: [math]a, b, c, d[/math]. Полученный код будет иметь длину 8 бит и выглядеть следующим образом: Рассмотрим табличную визуализацию кода:

[math]a[/math]	[math]b[/math]	[math]a \oplus b[/math]
[math]c[/math]	[math]d[/math]	[math]c \oplus d[/math]
[math]a \oplus c[/math]	[math]b \oplus d[/math]

Как видно из таблицы, даже если один из битов [math]a, b, c, d[/math] передался с ошибкой, содержащие его [math]xor[/math]-суммы не сойдутся. Итого, зная строку и столбец в проиллюстрированной таблице можно точно исправить ошибочный бит.

По аналогичному принципу можно закодировать любое число бит. Пусть мы имеем исходную строку длиной в [math]2^k[/math] бит. Для получения её кода добавим к ней [math]k[/math] пар бит по следующему принципу:

Первая пара: сумма четных бит и сумма нечетных бит
Вторая пара: сумма тех бит, в чьем номере второй бит с конца ноль и сумма тех бит, в чьем номере второй бит с конца единица

...

[math]k[/math]-тая пара: сумма тех бит, в чьем номере [math]k[/math]-тый бит с конца ноль и сумма тех бит, в чьем номере [math]k[/math]-тый бит с конца единица

Легко понять, что если в одном бите из строки допущена ошибка, то с помощью дописанных [math]k[/math] пар бит можно точно определить, какой именно бит ошибочный. Это объясняется тем, что каждая пара определяет один бит номера ошибочного бита в строке. Всего пар [math]k[/math], следовательно мы имеем [math]k[/math] бит номера ошибочного бита, что вполне достаточно: общее число бит строки не превосходит [math]2^k[/math].

Итого, увеличивая код длиной [math]n[/math] на [math]2\log_2 n[/math], можно обнаружить и исправить одну ошибку.

Расстояние Хэмминга

Расстояние Хэмминга — число позиций, в которых соответствующие цифры двух двоичных слов одинаковой длины различны. В более общем случае расстояние Хэмминга применяется для строк одинаковой длины любых q-ичных алфавитов и служит метрикой различия (функцией, определяющей расстояние в метрическом пространстве) объектов одинаковой размерности.

Например:

Расстояние Хэмминга обладает свойствами метрики, удовлетворяя следующим условиям:

[math]~d(x,y) \ge 0[/math]
[math]~d(x,x)=0[/math]
[math]~d(x,y)=d(y,x)[/math]

Определение и устранение ошибок в общем случае

Пусть [math]\Sigma[/math] - исходный алфавит, [math]C: \Sigma \to B^m[/math] - код, [math]B=(0,1)[/math]

Определим [math]d = \min[/math] [math]~d(c(x),c(y))[/math], [math]x,y \in \Sigma[/math], [math]x\lt \gt y[/math]

Тогда легко понять, что код, полученный преобразованием [math]C[/math] может исправлять [math]~[[/math][math]{d-1}\over{2}[/math][math]~][/math] и обнаруживать [math][d-1][/math] ошибок. Действительно, при любом натуральном количестве допустимых ошибок [math]r[/math] любой код S образует вокруг себя проколотый шар таких строк [math]S_i[/math], что [math]0\lt d(S,S_i)\lt =r[/math]. Если этот шар не содержит других кодов (что выполняется при [math]r\lt d[/math]) , то можно утверждать, что если в него попадает строка, то она ошибочна. Аналогично можно утверждать, что если шары всех кодов не пересекаются (что выполняется при [math]r\lt = {d-1}\over{2} [/math]), то попавшую в шар строку [math]S_i[/math] можно тождественно исправить на центр шара [math]-[/math] строку[math]S[/math].

@@ Строка 24: / Строка 24: @@
 *Вторая пара: сумма тех бит, в чьем номере второй бит с конца ноль и сумма тех бит, в чьем номере второй бит с конца единица
 ...
-*<tex>K</tex>-тая пара: сумма тех бит, в чьем номере <tex>k</tex>-тый бит с конца ноль и сумма тех бит, в чьем номере <tex>k</tex>-тый бит с конца единица
+*<tex>k</tex>-тая пара: сумма тех бит, в чьем номере <tex>k</tex>-тый бит с конца ноль и сумма тех бит, в чьем номере <tex>k</tex>-тый бит с конца единица
 Легко понять, что если в одном бите из строки допущена ошибка, то с помощью дописанных <tex>k</tex> пар бит можно точно определить, какой именно бит ошибочный. Это объясняется тем, что каждая пара определяет один бит номера ошибочного бита в строке. Всего пар <tex>k</tex>, следовательно мы имеем <tex>k</tex> бит номера ошибочного бита, что вполне достаточно: общее число бит строки не превосходит <tex>2^k</tex>.
 Итого, увеличивая код длиной <tex>n</tex> на <tex>2\log_2 n</tex>, можно обнаружить и исправить одну ошибку.
+== Расстояние Хэмминга ==
+'''Расстояние Хэмминга''' — число позиций, в которых соответствующие цифры двух двоичных слов одинаковой длины различны. В более общем случае расстояние Хэмминга применяется для строк одинаковой длины любых q-ичных алфавитов и служит метрикой различия (функцией, определяющей расстояние в метрическом пространстве) объектов одинаковой размерности.
+Например: <math>d(10{\color{Blue}1}1{\color{Blue}1}01, 10{\color{Red}0}1{\color{Red}0}01)=2</math>
+Расстояние Хэмминга обладает свойствами метрики, удовлетворяя следующим условиям:
+* <math>~d(x,y) \ge 0</math>
+* <math>~d(x,x)=0</math>
+* <math>~d(x,y)=d(y,x)</math>
+* <math>~d(x,z) \le d(x,y) + d(y,z)</math>
+== Определение и устранение ошибок в общем случае ==
+Пусть <tex>\Sigma</tex> - исходный алфавит, <tex>C: \Sigma \to B^m</tex> - код, <tex>B=(0,1)</tex>
+Определим <tex>d = \min</tex> <math>~d(c(x),c(y))</math>, <tex>x,y \in \Sigma</tex>, <tex>x<>y</tex>
+Тогда легко понять, что код, полученный преобразованием <tex>C</tex> может исправлять <math>~[</math><tex>{d-1}\over{2}</tex><math>~]</math> и обнаруживать <tex>[d-1]</tex> ошибок. Действительно, при любом натуральном количестве допустимых ошибок <tex>r</tex> любой код S образует вокруг себя проколотый шар таких строк <tex>S_i</tex>, что <tex>0<d(S,S_i)<=r</tex>. Если этот шар не содержит других кодов (что выполняется при <tex>r<d</tex>) , то можно утверждать, что если в него попадает строка, то она ошибочна. Аналогично можно утверждать, что если шары всех кодов не пересекаются (что выполняется при <tex>r<= {d-1}\over{2} </tex>), то попавшую в шар строку <tex>S_i</tex> можно тождественно исправить на центр шара <tex>-</tex> строку<tex>S</tex>.

Избыточное кодирование, код Хэмминга — различия между версиями

Версия 04:35, 31 октября 2010

Содержание

Код, определяющий одну ошибку

Кодирование Хэмминга

Расстояние Хэмминга

Определение и устранение ошибок в общем случае

Навигация

Персональные инструменты

Пространства имён

Варианты

Просмотры

Ещё

Поиск

Навигация

Инструменты