Алгоритм Кнута-Морриса-Пратта — различия между версиями
(→Алгоритм решения) |
|||
Строка 3: | Строка 3: | ||
==Алгоритм решения== | ==Алгоритм решения== | ||
+ | Построим строку <tex>P = T\#S</tex>, где <tex>\#</tex> — любой символ, не входящий в алфавит <tex>S</tex> и <tex>T</tex>. Посчитаем на ней префикс-функцию <tex>\pi()</tex>. | ||
+ | |||
==Псевдокод== | ==Псевдокод== | ||
− | Пусть <tex>t = |T|</tex>, <tex>s = |S| | + | Пусть <tex>t = |T|</tex>, <tex>s = |S|</tex>. |
− | |||
<вычисление префикс-функции для цепочки P> | <вычисление префикс-функции для цепочки P> | ||
count = 0 | count = 0 |
Версия 19:02, 15 апреля 2012
Постановка задачи
Дана цепочка
и образец . Требуется найти все позиции, начиная с которых входит в .Алгоритм решения
Построим строку
, где — любой символ, не входящий в алфавит и . Посчитаем на ней префикс-функцию .
Псевдокод
Пусть
, . <вычисление префикс-функции для цепочки P>
count = 0
for (i = 0 .. (s - 1)) {
if (
(t + i + 1) == t) {
answer[count] = i + 1 - t
count = count + 1
}
}
- Корректность работы
Отметим, что из-за символа
значение для всех . По определению , если , то , то есть , то есть входит в , начиная с позиции . Пусть теперь входит в , начиная с позиции . Тогда . Иными словами, , что эквивалентно .- Время работы
(время подсчета для ) + (последующий ) .
- Оценка по памяти
Предложенная реализация имеет оценку по памяти
. Оценки можно добиться за счет незапоминания значений для позиций в меньших (т.е. до начала цепочки )