Z-функция — различия между версиями
Firespace (обсуждение | вклад)  | 
				Firespace (обсуждение | вклад)   | 
				||
| Строка 47: | Строка 47: | ||
       '''if''' i + zf[i] >= right  |        '''if''' i + zf[i] >= right  | ||
         left = i  |          left = i  | ||
| − |          right = i +   | + |          right = i + zf[i]  | 
     '''return''' zf  |      '''return''' zf  | ||
| Строка 58: | Строка 58: | ||
     '''int'''[] zf = zFunction(needle + '#' + source)  |      '''int'''[] zf = zFunction(needle + '#' + source)  | ||
     '''for''' i = m + 1 .. n + m + 1  |      '''for''' i = m + 1 .. n + m + 1  | ||
| − |        '''if'''   | + |        '''if''' zf[i] == m    | 
         '''return''' i  |          '''return''' i  | ||
Версия 20:45, 13 июня 2014
Содержание
Определение
Z-функция от строки и позиции — это длина максимального префикса подстроки, начинающейся с позиции в строке , который одновременно является и префиксом всей строки . Значение Z-функции от первой позиции не определено, поэтому его обычно приравнивают к нулю или к длине строки.
![]()
Примечание: далее в конспекте символы строки нумеруются с нуля.
Тривиальный алгоритм
Простая реализация за , где — длина строки. Для каждой позиции перебираем для неё ответ, начиная с нуля, пока не обнаружим несовпадение или не дойдем до конца строки.
Псевдокод
 int[] zFunction(string s)
   int[] zf = int[n]
   for i = 1 .. n - 1
     while i + zf[i] < n and s[zf[i]] == s[i + zf[i]]
       zf[i]++
   return zf
Эффективный алгоритм поиска
Z-блоком назовем подстроку с началом в позиции  и длиной .
Для работы алгоритма заведём две переменные:  и  — начало и конец Z-блока строки  с максимальной позицией конца  (среди всех таких Z-блоков, если их несколько, выбирается наибольший). Изначально  и .
Пусть нам известны значения Z-функции от  до . Найдём . 
Рассмотрим два случая.
1) :
Просто пробегаемся по строке  и сравниваем символы на позициях  и .
Пусть  первая позиция в строке  для которой не выполняется равенство , тогда  это и Z-функция для позиции . Тогда . В данном случае будет определено корректное значение  в силу того, что оно определяется наивно, путем сравнения с начальными символами строки.
2) :
Сравним  и . Если  меньше, то надо просто наивно пробежаться по строке начиная с позиции  и вычислить значение . Корректность в таком случае также гарантированна.
Иначе мы уже знаем верное значение , так как оно равно значению .
Время работы
Этот алгоритм работает за , так как каждая позиция пробегается не более двух раз: при попадании в диапазон от до и при высчитывании Z-функции простым циклом.
Псевдокод
 int[] zFunction(string s)
   int[] zf = int[n]
   int left = 0, right = 0
   for i = 1 .. n - 1
     zf[i] = max(0, min(right - i, zf[i - left]))
     while i + zf[i] < n and s[zf[i]] == s[i + zf[i]]
       zf[i]++
     if i + zf[i] >= right
       left = i
       right = i + zf[i]
   return zf
Поиск подстроки в строке с помощью Z-функции
 — длина текста.  — длина образца. 
 
Образуем строку , где  — символ, не встречающийся ни в , ни в . Вычисляем Z-функцию от этой строки. В полученном массиве, в позициях в которых значение Z-функции равно , по определению начинается подстрока, совпадающая с . 
Псевдокод
 int substringSearch(string source, string needle)
   int[] zf = zFunction(needle + '#' + source)
   for i = m + 1 .. n + m + 1
     if zf[i] == m 
       return i