Z-функция — различия между версиями
Kasetkin (обсуждение | вклад) |
Kasetkin (обсуждение | вклад) |
||
| Строка 13: | Строка 13: | ||
Пусть <tex>j</tex> первая позиция в строке <tex>S</tex> для которой не выполняется равенство <tex>S[i+j] == S[j]</tex>, тогда <tex>j</tex> это и Z-функция для позиции <tex>i</tex>. Тогда <tex>left = i, right = i + j - 1</tex>. | Пусть <tex>j</tex> первая позиция в строке <tex>S</tex> для которой не выполняется равенство <tex>S[i+j] == S[j]</tex>, тогда <tex>j</tex> это и Z-функция для позиции <tex>i</tex>. Тогда <tex>left = i, right = i + j - 1</tex>. | ||
| − | Если <tex>i \leq right</tex>, сравним <tex>Z[i - left] + i</tex> и <tex>right</tex>. Если <tex>right</tex> меньше, то надо просто пробежаться по строке начиная с позиции <tex>right</tex> и вычислить значение <tex>Z[i]</tex>. Иначе мы уже знаем значение <tex>Z[i]</tex>, так как оно равно значению <tex>Z[i - left]</tex> | + | Если <tex>i \leq right</tex>, сравним <tex>Z[i - left] + i</tex> и <tex>right</tex>. Если <tex>right</tex> меньше, то надо просто пробежаться по строке начиная с позиции <tex>right</tex> и вычислить значение <tex>Z[i]</tex>. Иначе мы уже знаем значение <tex>Z[i]</tex>, так как оно равно значению <tex>Z[i - left]</tex>. |
| + | *'''Время работы алгоритма''' | ||
| + | Этот алгоритм работает за <tex>O(\mid S \mid)</tex>, так как каждая позиция пробегается не более двух раз: при попадании в диапазон от <tex>left</tex> до <tex>right</tex> и при высчитывании Z-функции простым циклом. | ||
*'''Код алгоритма''' | *'''Код алгоритма''' | ||
Версия 22:53, 7 июня 2011
Определение
Z-функция от строки и позиции , это длина максимального префикса подстроки, начинающейся с позиции в строке , который одновременно является и префиксом всей строки .
Алгоритм поиска
- Задача
Дана строка . Необходимо построить массив , такой что является префикс функцией данной строки с позиции
- Описание алгоритма
Для работы алгоритма заведём две переменные: и - начало и конец наибольшего префикса строки с максимальным значением . Изначально и .
Это динамический алгоритм. Пусть нам известны значения Z-функции от до . Найдём . Есть два случая: и .
Пусть . Тогда просто пробегаемся по строке и сравниваем символы из начала с символами после позиции . () Пусть первая позиция в строке для которой не выполняется равенство , тогда это и Z-функция для позиции . Тогда .
Если , сравним и . Если меньше, то надо просто пробежаться по строке начиная с позиции и вычислить значение . Иначе мы уже знаем значение , так как оно равно значению .
- Время работы алгоритма
Этот алгоритм работает за , так как каждая позиция пробегается не более двух раз: при попадании в диапазон от до и при высчитывании Z-функции простым циклом.
- Код алгоритма
int[] z(String p) {
int[] ans = new int[p.length()];
ans[0] = 0;
int n = p.length();
int left = 0;
int right = 0;
for (int i = 1; i < n; i++) {
if (i > right) {
int j = 0;
while (i + j < n && p.charAt(i+j) == p.charAt(j)) {
j++;
}
ans[i] = j;
left = i;
right = i + j - 1;
} else {
if (ans[i - left] < right - i + 1) {
ans[i] = ans[i - left];
} else {
int j = 1;
while (j + right < n && p.charAt(j+right-i) == p.charAt(right + j)) {
j++;
}
ans[i] = right + j - i;
left = i;
right = right + j - 1;
}
}
}
return ans;
}