Алгоритм Кнута-Морриса-Пратта — различия между версиями
(→Время работы) |
(→Время работы) |
||
Строка 21: | Строка 21: | ||
Пусть теперь <tex>T</tex> входит в <tex>S</tex>, начиная с позиции <tex>i</tex>. Тогда <tex>S[i..i + t - 1] = T[0..t - 1]</tex>. Иными словами, <tex>P[0..t - 1] = P[t + 1 + i..t + i + t]</tex>, что эквивалентно <tex>\pi(t + i + t) = t</tex>. | Пусть теперь <tex>T</tex> входит в <tex>S</tex>, начиная с позиции <tex>i</tex>. Тогда <tex>S[i..i + t - 1] = T[0..t - 1]</tex>. Иными словами, <tex>P[0..t - 1] = P[t + 1 + i..t + i + t]</tex>, что эквивалентно <tex>\pi(t + i + t) = t</tex>. | ||
==Время работы== | ==Время работы== | ||
− | <tex>O(s + t)</tex> (время подсчета <tex>\pi()</tex> для <tex>P + O(s)</tex> (последующий <tex>for</tex>) <tex>= O(s + t)</tex>. | + | <tex>O(s + t)</tex> (время подсчета <tex>\pi()</tex> для <tex>P) + O(s)</tex> (последующий <tex>for</tex>) <tex>= O(s + t)</tex>. |
==Оценка по памяти== | ==Оценка по памяти== | ||
Предложенная реализация имеет оценку по памяти <tex>O(S+T)</tex>. Оценки <tex>O(S)</tex> можно добиться за счет незапоминания значений <tex>\pi()</tex> для позиций в <tex>P</tex>, меньших <tex>t + 1</tex> (до начала цепочки <tex>S</tex>). | Предложенная реализация имеет оценку по памяти <tex>O(S+T)</tex>. Оценки <tex>O(S)</tex> можно добиться за счет незапоминания значений <tex>\pi()</tex> для позиций в <tex>P</tex>, меньших <tex>t + 1</tex> (до начала цепочки <tex>S</tex>). |
Версия 19:05, 15 апреля 2012
Содержание
Постановка задачи
Дана цепочка
и образец . Требуется найти все позиции, начиная с которых входит в .Алгоритм решения
Построим строку
, где — любой символ, не входящий в алфавит и . Посчитаем на ней префикс-функцию .
Псевдокод
Пусть
, . <вычисление префикс-функции для цепочки P>
count = 0
for (i = 0 .. (s - 1)) {
if (
(t + i + 1) == t) {
answer[count] = i + 1 - t
count = count + 1
}
}
Корректность работы
Отметим, что из-за символа
значение для всех . По определению , если , то , то есть , то есть входит в , начиная с позиции . Пусть теперь входит в , начиная с позиции . Тогда . Иными словами, , что эквивалентно .Время работы
(время подсчета для (последующий ) .
Оценка по памяти
Предложенная реализация имеет оценку по памяти
. Оценки можно добиться за счет незапоминания значений для позиций в , меньших (до начала цепочки ).