Алгоритм Кнута-Морриса-Пратта
Постановка задачи
Дана цепочка
и образец . Требуется найти все позиции, начиная с которых входит в .Алгоритм решения
Построим строку префикс-функцию . Благодаря разделительному символу , выполняется . Заметим, что по определению префикс-функции при и подстроки длины , начинающиеся с позиций и , совпадают. Соберем все такие позиции строки , вычтем из каждой позиции , это и будет ответ.
, где — любой символ, не входящий в алфавит и . Посчитаем на нейПсевдокод
Пусть
, . <вычисление префикс-функции для цепочки P>
count = 0
for (i = 0 .. (s - 1)) {
if (
(t + i + 1) == t) {
answer[count] = i + 1 - t
count = count + 1
}
}
Время работы
(время подсчета для (последующий ) .
Оценка по памяти
Предложенная реализация имеет оценку по памяти
. Оценки можно добиться за счет незапоминания значений для позиций в , меньших (до начала цепочки ).Источники
Knuth–Morris–Pratt algorithm
Кормен, Т., Лейзерсон, Ч., Ривест, Р., Штайн — Алгоритмы: построение и анализ / пер. с англ. — изд. 2-е — М.: Издательский дом «Вильямс», 2009. — с.1036. — ISBN 978-5-8459-0857-5.