Задача о редакционном расстоянии — различия между версиями
(Новая страница: «'''Расстояние Левенштейна''' (также '''редакционное расстояние''' или '''дистанция редактирова…») |
(→Редакционное предписание) |
||
Строка 12: | Строка 12: | ||
== Редакционное предписание == | == Редакционное предписание == | ||
− | ''Редакционным предписанием'' называется последовательность действий, необходимых для получения из первой строки второй кратчайшим образом. Обычно действия обозначаются так: '''D''' ( | + | ''Редакционным предписанием'' называется последовательность действий, необходимых для получения из первой строки второй кратчайшим образом. Обычно действия обозначаются так: '''D''' (англ. delete) — удалить, '''I''' (англ. insert) — вставить, '''R''' (англ. replace) — заменить, '''M''' (англ. match) — совпадение. |
Например, для 2-х строк «hell123» и «hello214» можно построить следующую таблицу преобразований: | Например, для 2-х строк «hell123» и «hello214» можно построить следующую таблицу преобразований: | ||
− | {| | + | {| border="1" |
− | + | |'''M''' ||'''M''' ||'''M''' ||'''M''' ||'''R''' ||'''M''' ||'''R''' ||'''I''' | |
|- | |- | ||
|'''h''' ||'''e''' ||'''l''' ||'''l''' ||'''1''' ||'''2''' ||'''3''' || | |'''h''' ||'''e''' ||'''l''' ||'''l''' ||'''1''' ||'''2''' ||'''3''' || | ||
|- | |- | ||
|'''h''' ||'''e''' ||'''l''' ||'''l''' ||'''o''' ||'''2''' ||'''1''' ||'''4''' | |'''h''' ||'''e''' ||'''l''' ||'''l''' ||'''o''' ||'''2''' ||'''1''' ||'''4''' | ||
− | |} | + | |
+ | |-} |
Версия 13:52, 10 декабря 2010
Расстояние Левенштейна (также редакционное расстояние или дистанция редактирования) между двумя строками в теории информации и компьютерной лингвистике — это минимальное количество операций вставки одного символа, удаления одного символа и замены одного символа на другой, необходимых для превращения одной строки в другую.
Свойства
Для расстояния Левенштейна справедливы следующие утверждения:
где
— расстояние Левенштейна между строками и , а |S| - длина строки S.Редакционное предписание
Редакционным предписанием называется последовательность действий, необходимых для получения из первой строки второй кратчайшим образом. Обычно действия обозначаются так: D (англ. delete) — удалить, I (англ. insert) — вставить, R (англ. replace) — заменить, M (англ. match) — совпадение.
Например, для 2-х строк «hell123» и «hello214» можно построить следующую таблицу преобразований:
M | M | M | M | R | M | R | I |
h | e | l | l | 1 | 2 | 3 | |
h | e | l | l | o | 2 | 1 | 4 |