|
|
(не показано 39 промежуточных версий 3 участников) |
Строка 1: |
Строка 1: |
− | '''Расстояние Левенштейна''' (также '''редакционное расстояние''' или '''дистанция редактирования''') между двумя строками в теории информации и компьютерной лингвистике — это минимальное количество операций вставки одного символа, удаления одного символа и замены одного символа на другой, необходимых для превращения одной строки в другую.
| + | #перенаправление [[Задача о редакционном расстоянии, алгоритм Вагнера-Фишера]] |
− | | |
− | | |
− | == Свойства ==
| |
− | | |
− | Для расстояния Левенштейна справедливы следующие утверждения:
| |
− | * <math>\rm{d}(S_1,S_2) \ge | |S_1| - |S_2| |</math>
| |
− | * <math>\rm{d}(S_1,S_2) \le max( |S_1| , |S_2| )</math>
| |
− | * <math>\rm{d}(S_1,S_2) = 0 \Leftrightarrow S_1 = S_2</math>
| |
− | где <math>\rm{d}(S_1,S_2)</math> — расстояние Левенштейна между строками <math>S_1</math> и <math>S_2</math>, а |S| - длина строки S.
| |
− | | |
− | == Редакционное предписание ==
| |
− | | |
− | ''Редакционным предписанием'' называется последовательность действий, необходимых для получения из первой строки второй кратчайшим образом. Обычно действия обозначаются так: '''D''' (англ. delete) — удалить, '''I''' (англ. insert) — вставить, '''R''' (англ. replace) — заменить, '''M''' (англ. match) — совпадение.
| |
− | | |
− | Например, для 2-х строк «hell123» и «hello214» можно построить следующую таблицу преобразований:
| |
− | | |
− | {| border="1"
| |
− | |'''M''' ||'''M''' ||'''M''' ||'''M''' ||'''R''' ||'''M''' ||'''R''' ||'''I'''
| |
− | |-
| |
− | |'''h''' ||'''e''' ||'''l''' ||'''l''' ||'''1''' ||'''2''' ||'''3''' ||
| |
− | |-
| |
− | |'''h''' ||'''e''' ||'''l''' ||'''l''' ||'''o''' ||'''2''' ||'''1''' ||'''4'''
| |
− |
| |
− | |-}
| |