Префикс-функция — различия между версиями
Sergej (обсуждение | вклад) (→Доказательство корректности алгоритма) |
Sergej (обсуждение | вклад) (→Доказательство корректности алгоритма) |
||
Строка 89: | Строка 89: | ||
1) <tex>p[n] = 0</tex>. Тогда мы добавляем новый символ, поэтому <tex>q[n]</tex> тоже будет равно <tex>0</tex> | 1) <tex>p[n] = 0</tex>. Тогда мы добавляем новый символ, поэтому <tex>q[n]</tex> тоже будет равно <tex>0</tex> | ||
− | 2) <tex>p[n] > 0</tex>. Предположим, что <tex>q[n] != p[n] </tex> Заметим, что подстрока с 1 по <tex>p[n]</tex> оканчивается на <tex>n</tex>-ом символе ,соответственно,<tex>q[n] > p[n]</tex> | + | 2) <tex>p[n] > 0</tex>. Предположим, что <tex>q[n] != p[n] </tex> Заметим, что подстрока с 1 по <tex>p[n]</tex> оканчивается на <tex>n</tex>-ом символе ,соответственно,<tex>q[n] > p[n]</tex>. Но этого не может быть, так как тогда бы в строке s существовала большая подстрока оканчивающаяся на <tex>n</tex> символе, что противоречит тому что массив <tex>p</tex> корректный. |
+ | |||
+ | Простой пример некорректного <tex>p {0,1,1} </tex> Тогда по алгоритму получится строка <tex>aaa</tex>. Очевидно, что префикс-функции не будут совпадать | ||
== Литература == | == Литература == | ||
Кормен Т., Лейзерсон Ч., Ривест Р. Алгоритмы: построение и анализ. {{---}} 2-е изд. {{---}} М.: Издательский дом «Вильямс», 2007. {{---}} С. 1296. | Кормен Т., Лейзерсон Ч., Ривест Р. Алгоритмы: построение и анализ. {{---}} 2-е изд. {{---}} М.: Издательский дом «Вильямс», 2007. {{---}} С. 1296. |
Версия 11:41, 2 мая 2014
Префикс-функция строки
— функция .Содержание
Алгоритм
Наивный алгоритм вычисляет префикс функцию непосредственно по определению, сравнивая префиксы и суффиксы строк.
Псевдокод
Prefix_function () = [0,..,0] for i = 1 to n for k = 1 to i - 1 if s[1..k] == s[i - k + 1..i] [i] = k return
Пример
Рассмотрим строку abcabcd, для которой значение префикс-функции равно
.Шаг | Строка | Значение функции |
---|---|---|
a | 0 | |
ab | 0 | |
abc | 0 | |
abca | 1 | |
abcab | 2 | |
abcabc | 3 | |
abcabcd | 0 |
Время работы
Всего
итераций цикла, на каждой из который происходит сравнение строк за , что дает в итоге .Оптимизация
Вносятся несколько важных замечаний:
- Следует заметить, что . По определению префикс функции верно, что . В частности, получается, что . Поскольку это наибольший префикс равный суффиксу, то .
- Избавимся от явных сравнений строк. Для этого подберем такое , что . Делаем это следующим образом. За исходное необходимо взять , что следует из первого пункта. В случае, когда символы и не совпадают, — следующее потенциальное наибольшее значение , что видно из рисунка. Последнее утверждение верно, пока , что позволит всегда найти его следующее значение. Если , то при , иначе .
Псевдокод
Prefix_function () [1] = 0 k = 0 for i = 2 to n while k > 0 && s[i] != s[k + 1] k = [k] if s[i] == s[k + 1] k++ [i] = k return
Время работы
Время работы алгоритма составит
. Для доказательства этого нужно заметить, что итоговое количество итераций цикла определяет асимптотику алгоритма. Теперь стоит отметить, что увеличивается на каждом шаге не более чем на единицу, значит максимально возможное значение . Поскольку внутри цикла значение лишь уменьшается, получается, что не может суммарно уменьшиться больше, чем раз. Значит цикл в итоге выполнится не более раз, что дает итоговую оценку времени алгоритма .Построение строки по префикс-функции
Постановка задачи
Восстановить строку по префикс-функции за
( ) (алфавит неограничен).Описание алгоритма
Пусть в массиве
хранятся значения префикс-функции,в будет записан ответ. Пойдем по массиву слева направо. Пусть мы хотим узнать значение , посмотрим на значение если тогда в запишем новый символ, иначе ( мы посчитали раньше(т.к )). Так как подстрока с 1 по заканчивается в то должен быть равенПсевдокод
string s; vector<int> p; for (int i = 0; i < p.size(); i++) { if (p[i] == 0) { s += new char; } else { s += s[p[i]]; } }
Доказательство корректности алгоритма
Докажем, что если нам дали корректную префикс-функцию, то наш алгоритм построит строку с такой же префикс-функцией.(также заметим, что строк с такой префикс-функцией может быть много, и алгоритм строит только одну из них)
Воспользуемся старыми обозначениями
данная префикс-функция, правильная строка, эту строку построил наш алгоритм, массив значений префикс-функции дляДокажем корректность по индукции
База очевидна для строки длиной 1
Переход: Пусть до
позиции мы построили строку, что Возможно два варианта,1)
. Тогда мы добавляем новый символ, поэтому тоже будет равно2)
. Предположим, что Заметим, что подстрока с 1 по оканчивается на -ом символе ,соответственно, . Но этого не может быть, так как тогда бы в строке s существовала большая подстрока оканчивающаяся на символе, что противоречит тому что массив корректный.Простой пример некорректного
Тогда по алгоритму получится строка . Очевидно, что префикс-функции не будут совпадатьЛитература
Кормен Т., Лейзерсон Ч., Ривест Р. Алгоритмы: построение и анализ. — 2-е изд. — М.: Издательский дом «Вильямс», 2007. — С. 1296.