Алгоритм Кнута-Морриса-Пратта — различия между версиями
Строка 15: | Строка 15: | ||
} | } | ||
*'''Корректность работы''' | *'''Корректность работы''' | ||
− | + | Отметим, что из-за символа <tex>\$</tex> значение <tex>\pi(k) \leq t</tex> для всех <tex>k</tex>. | |
− | + | По определению <tex>\pi()</tex>, если <tex>\pi(k) = t</tex>, то <tex>P[0..t - 1] = P[k - t + 1..k]</tex>, то есть <tex>T = S[k - t - t..k - t - 1]</tex>, то есть <tex>T</tex> входит в <tex>S</tex>, начиная с позиции <tex>k - t - t</tex>. | |
− | + | Пусть теперь <tex>T</tex> входит в <tex>S</tex>, начиная с позиции <tex>i</tex>. Тогда <tex>S[i..i + t - 1] = T[0..t - 1]</tex>. Иными словами, <tex>P[0..t - 1] = P[t + 1 + i..t + i + t]</tex>, что эквивалентно <tex>\pi(t + i + t) = t</tex>. | |
*'''Время работы''' | *'''Время работы''' | ||
− | + | <tex>O(s + t)</tex> (время подсчета <tex>\pi()</tex> для <tex>P</tex>) + <tex>O(s)</tex> (последующий <tex>for</tex>) <tex>= O(s + t)</tex>. | |
*'''Оценка по памяти''' | *'''Оценка по памяти''' | ||
− | + | Предложенная реализация имеет оценку по памяти <tex>O(S+T)</tex>. Оценки <tex>O(S)</tex> можно добиться за счет не запоминания значений <tex>pi()</tex> для позиций в <tex>P</tex> меньших <tex>t + 1</tex> (т.е. до начала цепочки <tex>S</tex>) |
Версия 20:29, 27 июня 2011
Постановка задачи
Дана цепочка
и образец . Требуется найти все позиции, начиная с которых входит в .Алгоритм решения
- любой символ, не входящий в алфавит и
- Псевдокод
P =+ '$' + ; <вычисление префикс-функции для цепочки P> count = 0 for (i = 0 .. (s - 1)) { if ( (t + i + 1) == t) { answer[count] = i + 1 - t count = count + 1 } }
- Корректность работы
Отметим, что из-за символа
значение для всех . По определению , если , то , то есть , то есть входит в , начиная с позиции . Пусть теперь входит в , начиная с позиции . Тогда . Иными словами, , что эквивалентно .- Время работы
(время подсчета для ) + (последующий ) .
- Оценка по памяти
Предложенная реализация имеет оценку по памяти
. Оценки можно добиться за счет не запоминания значений для позиций в меньших (т.е. до начала цепочки )