Z-функция — различия между версиями
Glukos (обсуждение | вклад) (→Алгоритм поиска) |
Glukos (обсуждение | вклад) (→Алгоритм поиска) |
||
| Строка 6: | Строка 6: | ||
==Алгоритм поиска== | ==Алгоритм поиска== | ||
Z-блоком назовем подстроку с началом в позиции <tex>i</tex> и длиной <tex>Z[i]</tex>.<br> | Z-блоком назовем подстроку с началом в позиции <tex>i</tex> и длиной <tex>Z[i]</tex>.<br> | ||
| − | Для работы алгоритма заведём две переменные: <tex>left</tex> и <tex>right</tex> — начало и конец | + | Для работы алгоритма заведём две переменные: <tex>left</tex> и <tex>right</tex> — начало и конец Z-блока строки <tex>S</tex> с максимальной позицией конца <tex>right</tex> (среди всех таких Z-блоков, если их несколько, выбирается наибольший). Изначально <tex>left=0</tex> и <tex>right=0</tex>. |
Пусть нам известны значения Z-функции от <tex>0</tex> до <tex>i-1</tex>. Найдём <tex>Z[i]</tex>. | Пусть нам известны значения Z-функции от <tex>0</tex> до <tex>i-1</tex>. Найдём <tex>Z[i]</tex>. | ||
Рассмотрим два случая. | Рассмотрим два случая. | ||
Версия 13:24, 21 июня 2012
Определение
Z-функция от строки и позиции — это длина максимального префикса подстроки, начинающейся с позиции в строке , который одновременно является и префиксом всей строки . Значение -функции от первой позиции не определено, поэтому его обычно приравнивают к нулю или к длине строки.
![]()
Примечание: далее в конспекте символы строки нумеруются с нуля.
Алгоритм поиска
Z-блоком назовем подстроку с началом в позиции и длиной .
Для работы алгоритма заведём две переменные: и — начало и конец Z-блока строки с максимальной позицией конца (среди всех таких Z-блоков, если их несколько, выбирается наибольший). Изначально и .
Пусть нам известны значения Z-функции от до . Найдём .
Рассмотрим два случая.
1) :
Просто пробегаемся по строке и сравниваем символы на позициях и .
Пусть первая позиция в строке для которой не выполняется равенство , тогда это и Z-функция для позиции . Тогда .
2) :
Сравним и . Если меньше, то надо просто пробежаться по строке начиная с позиции и вычислить значение .
Иначе мы уже знаем значение , так как оно равно значению .
Время работы
Этот алгоритм работает за , так как каждая позиция пробегается не более двух раз: при попадании в диапазон от до и при высчитывании -функции простым циклом.
Псевдокод
Zfunction(p)
answer[0] = 0
left = 0
right = 0
for (i = 1..(n - 1))
if (i > right)
j = 0
while (i + j < n && p[i + j] == p[j])
j++
answer[i] = j
left = i
right = i + j - 1
else if (answer[i - left] < right - i + 1)
answer[i] = answer[i - left]
else
j = 1
while (j + right < n && p[j + right - i] == p[right + j])
j++
answer[i] = right + j - i
left = i
right = right + j - 1
return answer
Источники
Поиск подстроки и смежные вопросы — Хабр
Z-функция — Википедия