Z-функция — различия между версиями
Glukos (обсуждение | вклад) (→Алгоритм поиска) |
Glukos (обсуждение | вклад) (→Алгоритм поиска) |
||
Строка 13: | Строка 13: | ||
1) <tex>i > right</tex>:<br> | 1) <tex>i > right</tex>:<br> | ||
Просто пробегаемся по строке <tex>S</tex> и сравниваем символы на позициях <tex>S[i+j]</tex> и <tex>S[j]</tex>. | Просто пробегаемся по строке <tex>S</tex> и сравниваем символы на позициях <tex>S[i+j]</tex> и <tex>S[j]</tex>. | ||
− | Пусть <tex>j</tex> первая позиция в строке <tex>S</tex> для которой не выполняется равенство <tex>S[i+j] == S[j]</tex>, тогда <tex>j</tex> это и Z-функция для позиции <tex>i</tex>. Тогда <tex>left = i, right = i + j - 1</tex>. | + | Пусть <tex>j</tex> первая позиция в строке <tex>S</tex> для которой не выполняется равенство <tex>S[i+j] == S[j]</tex>, тогда <tex>j</tex> это и Z-функция для позиции <tex>i</tex>. Тогда <tex>left = i, right = i + j - 1</tex>. В данном случае будет определено корректное значение <tex>Z[i]</tex> в силу того, что оно определяется наивно, путем сравнения с начальными символами строки. |
<br> | <br> | ||
2) <tex>i \le right</tex>:<br> | 2) <tex>i \le right</tex>:<br> | ||
− | Сравним <tex>Z[i - left] + i</tex> и <tex>right</tex>. Если <tex>right</tex> меньше, то надо просто пробежаться по строке начиная с позиции <tex>right</tex> и вычислить значение <tex>Z[i]</tex>. | + | Сравним <tex>Z[i - left] + i</tex> и <tex>right</tex>. Если <tex>right</tex> меньше, то надо просто наивно пробежаться по строке начиная с позиции <tex>right</tex> и вычислить значение <tex>Z[i]</tex>. Корректность в таком случае также гарантированна. |
− | Иначе мы уже знаем значение <tex>Z[i]</tex>, так как оно равно значению <tex>Z[i - left]</tex>.<br> | + | Иначе мы уже знаем верное значение <tex>Z[i]</tex>, так как оно равно значению <tex>Z[i - left]</tex>.<br> |
[[Файл:z-func.png]] | [[Файл:z-func.png]] | ||
Версия 13:46, 21 июня 2012
Определение
Z-функция от строки
Примечание: далее в конспекте символы строки нумеруются с нуля.
Алгоритм поиска
Z-блоком назовем подстроку с началом в позиции
Для работы алгоритма заведём две переменные: и — начало и конец Z-блока строки с максимальной позицией конца (среди всех таких Z-блоков, если их несколько, выбирается наибольший). Изначально и .
Пусть нам известны значения Z-функции от до . Найдём .
Рассмотрим два случая.
1) :
Просто пробегаемся по строке и сравниваем символы на позициях и .
Пусть первая позиция в строке для которой не выполняется равенство , тогда это и Z-функция для позиции . Тогда . В данном случае будет определено корректное значение в силу того, что оно определяется наивно, путем сравнения с начальными символами строки.
2) :
Сравним и . Если меньше, то надо просто наивно пробежаться по строке начиная с позиции и вычислить значение . Корректность в таком случае также гарантированна.
Иначе мы уже знаем верное значение , так как оно равно значению .
Время работы
Этот алгоритм работает за
, так как каждая позиция пробегается не более двух раз: при попадании в диапазон от до и при высчитывании -функции простым циклом.Псевдокод
Zfunction(p) answer[0] = 0 left = 0 right = 0 for (i = 1..(n - 1)) if (i > right) j = 0 while (i + j < n && p[i + j] == p[j]) j++ answer[i] = j left = i right = i + j - 1 else if (answer[i - left] < right - i + 1) answer[i] = answer[i - left] else j = 1 while (j + right < n && p[j + right - i] == p[right + j]) j++ answer[i] = right + j - i left = i right = right + j - 1 return answer
Источники
Поиск подстроки и смежные вопросы — Хабр
Z-функция — Википедия