Z-функция — различия между версиями
Glukos (обсуждение | вклад) (→Определение) |
Glukos (обсуждение | вклад) (→Определение) |
||
| Строка 2: | Строка 2: | ||
Z-функция от строки <tex>S</tex> и позиции <tex>x</tex> — это длина максимального префикса подстроки, начинающейся с позиции <tex>x</tex> в строке <tex>S</tex>, который одновременно является и префиксом всей строки <tex>S</tex>. Значение <tex>Z</tex>-функции от первой позиции не определено, поэтому его обычно приравнивают к нулю или к длине строки. | Z-функция от строки <tex>S</tex> и позиции <tex>x</tex> — это длина максимального префикса подстроки, начинающейся с позиции <tex>x</tex> в строке <tex>S</tex>, который одновременно является и префиксом всей строки <tex>S</tex>. Значение <tex>Z</tex>-функции от первой позиции не определено, поэтому его обычно приравнивают к нулю или к длине строки. | ||
[[Файл:Zfunc-examp.png|600px]]<br> | [[Файл:Zfunc-examp.png|600px]]<br> | ||
| − | Примечание: далее в конспекте символы строки нумеруются с нуля. | + | '''Примечание:''' далее в конспекте символы строки нумеруются с нуля. |
==Алгоритм поиска== | ==Алгоритм поиска== | ||
Версия 13:05, 21 июня 2012
Определение
Z-функция от строки и позиции — это длина максимального префикса подстроки, начинающейся с позиции в строке , который одновременно является и префиксом всей строки . Значение -функции от первой позиции не определено, поэтому его обычно приравнивают к нулю или к длине строки.
![]()
Примечание: далее в конспекте символы строки нумеруются с нуля.
Алгоритм поиска
Для работы алгоритма заведём две переменные: и — начало и конец наибольшего префикса строки с максимальным значением . Изначально и .
Пусть нам известны значения Z-функции от до . Найдём . Рассмотрим два случая.
1) :
Просто пробегаемся по строке и сравниваем символы на позициях и .
Пусть первая позиция в строке для которой не выполняется равенство , тогда это и Z-функция для позиции . Тогда .
2) :
Сравним и . Если меньше, то надо просто пробежаться по строке начиная с позиции и вычислить значение .
Иначе мы уже знаем значение , так как оно равно значению .
Время работы
Этот алгоритм работает за , так как каждая позиция пробегается не более двух раз: при попадании в диапазон от до и при высчитывании -функции простым циклом.
Псевдокод
Zfunction(p)
answer[0] = 0
left = 0
right = 0
for (i = 1..(n - 1))
if (i > right)
j = 0
while (i + j < n && p[i + j] == p[j])
j++
answer[i] = j
left = i
right = i + j - 1
else if (answer[i - left] < right - i + 1)
answer[i] = answer[i - left]
else
j = 1
while (j + right < n && p[j + right - i] == p[right + j])
j++
answer[i] = right + j - i
left = i
right = right + j - 1
return answer
Источники
Поиск подстроки и смежные вопросы — Хабр
Z-функция — Википедия