Алгоритм Кнута-Морриса-Пратта — различия между версиями
(→Алгоритм решения) |
|||
Строка 3: | Строка 3: | ||
==Алгоритм решения== | ==Алгоритм решения== | ||
− | <tex>t = |T| | + | |
− | + | ==Псевдокод== | |
− | P = <tex>T</tex> + '$' + <tex>S</tex> | + | Пусть <tex>t = |T|</tex>, <tex>s = |S|</tex>, <tex>\$</tex> — любой символ, не входящий в алфавит <tex>S</tex> и <tex>T</tex>. |
+ | P = <tex>T</tex> + '$' + <tex>S</tex> | ||
<вычисление префикс-функции для цепочки P> | <вычисление префикс-функции для цепочки P> | ||
count = 0 | count = 0 |
Версия 18:43, 15 апреля 2012
Постановка задачи
Дана цепочка
и образец . Требуется найти все позиции, начиная с которых входит в .Алгоритм решения
Псевдокод
Пусть
, , — любой символ, не входящий в алфавит и .P =+ '$' + <вычисление префикс-функции для цепочки P> count = 0 for (i = 0 .. (s - 1)) { if ( (t + i + 1) == t) { answer[count] = i + 1 - t count = count + 1 } }
- Корректность работы
Отметим, что из-за символа
значение для всех . По определению , если , то , то есть , то есть входит в , начиная с позиции . Пусть теперь входит в , начиная с позиции . Тогда . Иными словами, , что эквивалентно .- Время работы
(время подсчета для ) + (последующий ) .
- Оценка по памяти
Предложенная реализация имеет оценку по памяти
. Оценки можно добиться за счет незапоминания значений для позиций в меньших (т.е. до начала цепочки )