Алгоритм Кнута-Морриса-Пратта — различия между версиями
Строка 16: | Строка 16: | ||
} | } | ||
} | } | ||
− | + | ==Корректность работы== | |
Отметим, что из-за символа <tex>\$</tex> значение <tex>\pi(k) \leq t</tex> для всех <tex>k</tex>. | Отметим, что из-за символа <tex>\$</tex> значение <tex>\pi(k) \leq t</tex> для всех <tex>k</tex>. | ||
По определению <tex>\pi()</tex>, если <tex>\pi(k) = t</tex>, то <tex>P[0..t - 1] = P[k - t + 1..k]</tex>, то есть <tex>T = S[k - t - t..k - t - 1]</tex>, то есть <tex>T</tex> входит в <tex>S</tex>, начиная с позиции <tex>k - t - t</tex>. | По определению <tex>\pi()</tex>, если <tex>\pi(k) = t</tex>, то <tex>P[0..t - 1] = P[k - t + 1..k]</tex>, то есть <tex>T = S[k - t - t..k - t - 1]</tex>, то есть <tex>T</tex> входит в <tex>S</tex>, начиная с позиции <tex>k - t - t</tex>. | ||
Пусть теперь <tex>T</tex> входит в <tex>S</tex>, начиная с позиции <tex>i</tex>. Тогда <tex>S[i..i + t - 1] = T[0..t - 1]</tex>. Иными словами, <tex>P[0..t - 1] = P[t + 1 + i..t + i + t]</tex>, что эквивалентно <tex>\pi(t + i + t) = t</tex>. | Пусть теперь <tex>T</tex> входит в <tex>S</tex>, начиная с позиции <tex>i</tex>. Тогда <tex>S[i..i + t - 1] = T[0..t - 1]</tex>. Иными словами, <tex>P[0..t - 1] = P[t + 1 + i..t + i + t]</tex>, что эквивалентно <tex>\pi(t + i + t) = t</tex>. | ||
− | + | ==Время работы== | |
<tex>O(s + t)</tex> (время подсчета <tex>\pi()</tex> для <tex>P</tex>) + <tex>O(s)</tex> (последующий <tex>for</tex>) <tex>= O(s + t)</tex>. | <tex>O(s + t)</tex> (время подсчета <tex>\pi()</tex> для <tex>P</tex>) + <tex>O(s)</tex> (последующий <tex>for</tex>) <tex>= O(s + t)</tex>. | ||
− | + | ==Оценка по памяти== | |
Предложенная реализация имеет оценку по памяти <tex>O(S+T)</tex>. Оценки <tex>O(S)</tex> можно добиться за счет незапоминания значений <tex>\pi()</tex> для позиций в <tex>P</tex> меньших <tex>t + 1</tex> (т.е. до начала цепочки <tex>S</tex>) | Предложенная реализация имеет оценку по памяти <tex>O(S+T)</tex>. Оценки <tex>O(S)</tex> можно добиться за счет незапоминания значений <tex>\pi()</tex> для позиций в <tex>P</tex> меньших <tex>t + 1</tex> (т.е. до начала цепочки <tex>S</tex>) |
Версия 19:03, 15 апреля 2012
Содержание
Постановка задачи
Дана цепочка
и образец . Требуется найти все позиции, начиная с которых входит в .Алгоритм решения
Построим строку
, где — любой символ, не входящий в алфавит и . Посчитаем на ней префикс-функцию .
Псевдокод
Пусть
, . <вычисление префикс-функции для цепочки P>
count = 0
for (i = 0 .. (s - 1)) {
if (
(t + i + 1) == t) {
answer[count] = i + 1 - t
count = count + 1
}
}
Корректность работы
Отметим, что из-за символа
значение для всех . По определению , если , то , то есть , то есть входит в , начиная с позиции . Пусть теперь входит в , начиная с позиции . Тогда . Иными словами, , что эквивалентно .Время работы
(время подсчета для ) + (последующий ) .
Оценка по памяти
Предложенная реализация имеет оценку по памяти
. Оценки можно добиться за счет незапоминания значений для позиций в меньших (т.е. до начала цепочки )