Алгоритм Касаи и др. — различия между версиями
Строка 1: | Строка 1: | ||
− | '''Алгоритм Касаи''' (Аримуры-Арикавы-Касаи-Ли-Парка) --- алгоритм, позволяющий за линейное время вычислить | + | '''Алгоритм Касаи''' (Аримуры-Арикавы-Касаи-Ли-Парка) {{---}} алгоритм, позволяющий за линейное время вычислить |
значения наибольших общих префиксов для соседних циклических сдвигов строки, отсортированных в лексикографическом | значения наибольших общих префиксов для соседних циклических сдвигов строки, отсортированных в лексикографическом | ||
порядке (largest common prefix, далее <tex>lcp</tex>). | порядке (largest common prefix, далее <tex>lcp</tex>). | ||
==Обозначения== | ==Обозначения== | ||
− | <tex>S | + | <tex>S</tex> {{---}} данная строка. |
− | <tex>height[i] | + | <tex>height[i]</tex> {{---}} длина наибольшего общего префикса <tex>i</tex> и <tex>i-1</tex> строк в суффиксном массиве (<tex>suf[i]</tex> и <tex>suf[i-1]</tex> соответственно). |
− | <tex>suf^{-1}</tex> - обратный суффиксный массив, удовлетворяющий свойству <tex>suf^{-1}[suf[i]] = i</tex>. | + | <tex>suf^{-1}</tex> {{---}} обратный суффиксный массив, удовлетворяющий свойству <tex>suf^{-1}[suf[i]] = i</tex>. |
Может быть построен одним линейным проходом по суффиксному массиву. | Может быть построен одним линейным проходом по суффиксному массиву. | ||
Версия 13:00, 22 июня 2011
Алгоритм Касаи (Аримуры-Арикавы-Касаи-Ли-Парка) — алгоритм, позволяющий за линейное время вычислить значения наибольших общих префиксов для соседних циклических сдвигов строки, отсортированных в лексикографическом порядке (largest common prefix, далее
).Обозначения
— данная строка.
— длина наибольшего общего префикса и строк в суффиксном массиве ( и соответственно).
— обратный суффиксный массив, удовлетворяющий свойству . Может быть построен одним линейным проходом по суффиксному массиву.
Все массивы и строка имеют 0-индексацию.
Описание алгоритма
Значения
считаются для все суффиксов строки последовательно. Значение считается наивным методом за линейное время. Покажем, как вычислить , если значение известно.Теорема: |
Если , то .
Доказательство |
Доказательство: |
, . Рассмотрим суффиксный массив и позиции в нем суффиксов : так как и суффикс отличаются только первым символом, как и с , то . Так как суффикс в суффиксном массиве предшествует суффиксу , то суффикс будет предшествовать суффиксу (но необязательно будет непоредственно предыдущим), то , , , откуда . |
Источники
1. Алгоритм Касаи.
2. T.Kasai, G.Lee, H.Arimura, S.Arikawa, K.Park - Linear-Time Longest-Common-Prefix Computation in Suffix Arrays and Its Application.