Участница:Mariashka — различия между версиями

Версия 00:09, 27 апреля 2015

Определение:

Повтором (англ. repeatition) называется непустая строка вида

Алгоритм Мейна-Лоренца (англ. Main-Lorentz algorithm) — алгоритм на строках, позволяющий найти все повторы в строке [math]s[1..n][/math] за [math]O(n \log n)[/math]

Алгоритм

Данный алгоритм — это алгоритм "разделяй и властвуй":

Разделим строку пополам
Заметим, что повторы делятся на две группы: пересекающие и не пересекающие границу раздела
Рекурсивно запустимся от каждой половинки — так мы найдем повторы, которые не пересекают границу раздела
Нахождение повторов, которые пересекают границу раздела

Повторы, пересекающие границу раздела, можно разделить на две группы по положению центра повтора.

Так как повторов строке [math] \Omega(n^2)[/math], мы не можем хранить их в явном виде. Будем хранить повторы блоками вида [math](length, first, last)[/math], где [math] length [/math] — это длина повтора, а [math] [first, last] [/math] — промежуток индексов, в которых заканчиваются повторы такой длины.

Нахождение правых повтров

Рассмотрим строку [math]t = uv[/math], пусть начало [math]t[/math] в исходной строке [math]s[/math] — [math]shift[/math]

Предподсчитаем следующие массивы:
1. , где [math] lcp [/math] — наибольший общий префикс
2. [math] RS[i] = lcs(v[1..i], u) [/math], где [math] lcs [/math] — наибольший общий суффикс
Переберем длину повтора [math] 2p [/math]. Для каждого [math] p [/math] получим интервал индексов конца повтора в строке [math] v [/math]: [math] [x, y] [/math].
Добавим к ответу, учитывая смещение в исходной строке [math] s [/math] :

Докажем следующее утверждение для нахождения интервала [math] [x, y] [/math]:

Утверждение:

Пусть i - индекс конца повтора в строке v, тогда b = 2p - i - длина части повтора принадлежащей u. Пусть наш повтор [math]\alpha\alpha[/math], тогда

TODO

Нахождение левых повтров

Рассмотрим строку [math]t = uv[/math], пусть начало [math]t[/math] в исходной строке [math]s[/math] — [math]shift[/math]

Предподсчитаем следующие массивы:
1. , где [math] lcp [/math] — наибольший общий префикс
2. [math] LS[i] = lcs(u[1..i], u) [/math], где [math] lcs [/math] — наибольший общий суффикс
Переберем длину повтора [math] 2p [/math]. Для каждого [math] p [/math] получим интервал индексов конца повтора в строке [math] v [/math]: [math] [x, y] [/math].
Добавим к ответу, учитывая смещение в исходной строке [math] s [/math] :

Докажем следующее утверждение для нахождения интервала [math] [x, y] [/math]:

Утверждение:

TODO

Результат

Делим строку пополам
Рекурсивно запускаемся от полученных строк
Вычислим LP, LS, RP, RS для t с помощью z-функции: [math] O(t) [/math]
Найдем правые и левые повторы, как изложено выше: [math] O(t) [/math]

Асимптотика

Ассимптотика алгоритма "разделяй и властвуй", каждый рекурсивный запуск которого линеен относительно длины строки, [math] O(n \log n) [/math].

Количество блоков в ответе также будет [math] O(n \log n) [/math], так как при каждом рекрсивном запуске добавляется [math] O(1) [/math] блоков для каждой рассмотренной длины повтора, а их количество линейно относительно длины строки.

@@ Строка 29: / Строка 29: @@
 |id=kindscount
 |statement=<math>2p -RS[p] \leq i \leq p - RP[p + 1]</math>
-|proof= TODO
+|proof= Пусть i - индекс конца повтора в строке v, тогда b = 2p - i - длина части повтора принадлежащей u.
+Пусть наш повтор <math>\alpha\alpha</math>, тогда
+<math>\alpha = u[(u.len - b + 1) .. (u.len)] + v[1 .. (i - p)] = v[(i - p + 1) .. i] </math>
+TODO
 }}
@@ Строка 50: / Строка 54: @@
 === Результат ===
-# Рекурсивно найдем повторы, полностью лежащие в одной из половинок
+# Делим строку пополам
-# Вычислим LP, LS, RP, RS для t с помощью z-функции: <tex> O(n) </tex>
+# Рекурсивно запускаемся от полученных строк
-# Найдем правые и левые повторы, как изложено выше: <tex> O(n) </tex>
+# Вычислим LP, LS, RP, RS для t с помощью z-функции: <tex> O(t) </tex>
+# Найдем правые и левые повторы, как изложено выше: <tex> O(t) </tex>
 == Асимптотика ==

Участница:Mariashka — различия между версиями

Версия 00:09, 27 апреля 2015

Содержание

Алгоритм

Нахождение правых повтров

Нахождение левых повтров

Результат

Асимптотика

Навигация

Персональные инструменты

Пространства имён

Варианты

Просмотры

Ещё

Поиск

Навигация

Инструменты