Алгоритм Манакера — различия между версиями
Rthakohov (обсуждение | вклад) |
|||
Строка 1: | Строка 1: | ||
{{Шаблон:Задача | {{Шаблон:Задача | ||
|definition = | |definition = | ||
− | Пусть дана строка <tex>s</tex>. Требуется найти <tex>d1[i]</tex> | + | Пусть дана строка <tex>s</tex>. Требуется найти <tex>d1[i]</tex> — длина наибольшего палиндрома нечетной длины с центром в позиции <tex>i</tex> и <tex>d2[i]</tex> — аналогично для палиндромов четной длины для всех <tex>i</tex> от 1 до <tex>|s|</tex>. |
}} | }} | ||
Строка 20: | Строка 20: | ||
===Идея=== | ===Идея=== | ||
Алгоритм, который будет описан далее, отличается от наивного тем, что использует значения, посчитанные ранее. | Алгоритм, который будет описан далее, отличается от наивного тем, что использует значения, посчитанные ранее. | ||
− | Будем поддерживать границы самого правого из найденных палиндромов | + | Будем поддерживать границы самого правого из найденных палиндромов — <tex>[l; r]</tex>. Итак, пусть мы хотим вычислить <tex>d1[i]</tex> — т.е. длину наибольшего палиндрома с центром в позиции <tex>i</tex>. При этом все предыдущие значения в массиве <tex>d</tex> уже посчитаны. Возможны два случая: |
# <tex>i > r</tex>, т.е. текущая позиция не попадает в границы самого правого из найденных палиндромов. Тогда просто запустим наивный алгоритм для позиции <tex>i</tex>. | # <tex>i > r</tex>, т.е. текущая позиция не попадает в границы самого правого из найденных палиндромов. Тогда просто запустим наивный алгоритм для позиции <tex>i</tex>. | ||
− | # <tex>i \leq r</tex>. Тогда попробуем воспользоваться значениями, посчитанным ранее. Отразим нашу текущую позицию внутри палиндрома <tex>[l;r] : j = (r - i) + l</tex>. Поскольку <tex>i</tex> и <tex>j</tex> | + | # <tex>i \leq r</tex>. Тогда попробуем воспользоваться значениями, посчитанным ранее. Отразим нашу текущую позицию внутри палиндрома <tex>[l;r] : j = (r - i) + l</tex>. Поскольку <tex>i</tex> и <tex>j</tex> — симметричные позиции, то мы можем утверждать, <tex>d1[i] = d1[j]</tex>. Однако надо не забыть про один граничный случай: что если <tex>i + d1[j] - 1</tex> выходит за границы самого правого палиндрома? Так как информации о том, что происходит за границами это палинлрома у нас нет, то необходимо ограничить значение <tex>d1[i]</tex> следующим образом: <tex>d1[i] = min(r - i, d1[j])</tex>. После этого запустим наивный алгоритм, который будет увеличивать значение <tex>d1[i]</tex>, пока это возможно. |
После каждого шага важно не забывать обновлять значения <tex>[l;r]</tex> | После каждого шага важно не забывать обновлять значения <tex>[l;r]</tex> | ||
Строка 64: | Строка 64: | ||
===Оценка сложности=== | ===Оценка сложности=== | ||
− | Внешний цикл в приведенном алгоритме выполняется ровно <tex>n</tex> раз, где <tex>n</tex> | + | Внешний цикл в приведенном алгоритме выполняется ровно <tex>n</tex> раз, где <tex>n</tex> — длина строки. Попытаемся понять, сколько раз будет выполнен внутренний цикл, ответственный за наивный подсчет значений. Заметим, что каждая итерация вложенного цикла приводит к увеличению <tex>r</tex> на 1. Действительно, возможны следующие случаи: |
# <tex>i > r</tex>, т.е. сразу будет запущен наивный алгоритм и каждая его итерация будет увеличивать значение <tex>r</tex> хотя бы на 1 | # <tex>i > r</tex>, т.е. сразу будет запущен наивный алгоритм и каждая его итерация будет увеличивать значение <tex>r</tex> хотя бы на 1 | ||
Строка 74: | Строка 74: | ||
== См. также == | == См. также == | ||
− | * [[Z | + | * [[Z — функция]] |
== Источники информации == | == Источники информации == |
Версия 22:23, 17 марта 2016
Задача: |
Пусть дана строка | . Требуется найти — длина наибольшего палиндрома нечетной длины с центром в позиции и — аналогично для палиндромов четной длины для всех от 1 до .
Содержание
Наивный алгоритм
Идея
Опишем сначала наивный алгоритм решения задачи. Чтобы посчитать ответ для позиции
, будем на каждом шаге увеличивать длину палиндрома с центром в и убеждаться, что рассматриваемая строка не перестала быть палиндромом, либо не произошел выход за границы массива. Очевидно, что такой алгоритм будет работать заПсевдокод
//— исходная строка // — массивы для записи ответа for i = 1 to n d1[i] = 1 while i - d1[i] > 0 and i + d1[i] <= n and s[i - d1[i]] == s[i + d1[i]] d1[i]++ d2[i] = 0 while i - d2[i] - 1 > 0 and i + d2[i] <= n and s[i - d2[i] - 1] == s[i + d2[i]] d2[i]++
Алгоритм Манакера
Идея
Алгоритм, который будет описан далее, отличается от наивного тем, что использует значения, посчитанные ранее. Будем поддерживать границы самого правого из найденных палиндромов —
. Итак, пусть мы хотим вычислить — т.е. длину наибольшего палиндрома с центром в позиции . При этом все предыдущие значения в массиве уже посчитаны. Возможны два случая:- , т.е. текущая позиция не попадает в границы самого правого из найденных палиндромов. Тогда просто запустим наивный алгоритм для позиции .
- . Тогда попробуем воспользоваться значениями, посчитанным ранее. Отразим нашу текущую позицию внутри палиндрома . Поскольку и — симметричные позиции, то мы можем утверждать, . Однако надо не забыть про один граничный случай: что если выходит за границы самого правого палиндрома? Так как информации о том, что происходит за границами это палинлрома у нас нет, то необходимо ограничить значение следующим образом: . После этого запустим наивный алгоритм, который будет увеличивать значение , пока это возможно.
После каждого шага важно не забывать обновлять значения
Заметим, что массив
считается аналогичным образом, нужно лишь немного изменить индексы.Псевдокод
Приведем код, который вычисляет значения массива
://
— исходная строка
int l = 0
int r = -1
for i = 1 to n
int k = 0
if i <= r
k = min(r - i, d[r - i + l])
while i + k + 1 <= n and i - k - 1 > 0 and s[i + k + 1] == s[i - k - 1]
k++
d1[i] = k
if i + k > r
l = i - k
r = i + k
Вычисление значений массива
://
— исходная строка
int l = 0
int r = -1
for i = 1 to n
int k = 0
if i <= r
k = min(r - i + 1, d[r - i + l + 1])
while i + k <= n and i - k - 1 > 0 and s[i + k] == s[i - k - 1]
k++
d2[i] = k
if i + k - 1 > r
l = i - k
r = i + k - 1
Оценка сложности
Внешний цикл в приведенном алгоритме выполняется ровно
раз, где — длина строки. Попытаемся понять, сколько раз будет выполнен внутренний цикл, ответственный за наивный подсчет значений. Заметим, что каждая итерация вложенного цикла приводит к увеличению на 1. Действительно, возможны следующие случаи:- , т.е. сразу будет запущен наивный алгоритм и каждая его итерация будет увеличивать значение хотя бы на 1
-
- , но тогда, очевидно, ни одной итерации вложенного цикла выполнено не будет
- , тогда каждая итерация вложенного цикла приведет к увеличению хотя бы на 1.
. Здесь опять два случая:
Т.к. значение
не может увеличиваться более раз, то описанный выше алгоритм работает за линейное время.