Алгоритм Кнута-Морриса-Пратта
Постановка задачи
Дана цепочка
и образец . Требуется найти все позиции, начиная с которых входит в .Алгоритм решения
Построим строку
, где — любой символ, не входящий в алфавит и . Посчитаем на ней префикс-функцию .
Псевдокод
Пусть
, . <вычисление префикс-функции для цепочки P>
count = 0
for (i = 0 .. (s - 1)) {
if (
(t + i + 1) == t) {
answer[count] = i + 1 - t
count = count + 1
}
}
Корректность работы
Отметим, что из-за символа
значение для всех . По определению , если , то , то есть , то есть входит в , начиная с позиции . Пусть теперь входит в , начиная с позиции . Тогда . Иными словами, , что эквивалентно .Время работы
(время подсчета для (последующий ) .
Оценка по памяти
Предложенная реализация имеет оценку по памяти
. Оценки можно добиться за счет незапоминания значений для позиций в , меньших (до начала цепочки ).