Алгоритм Апостолико-Крочемора — различия между версиями

Версия 22:23, 4 марта 2016

Эта статья находится в разработке!

Алгоритм Апостолико-Крочемора (англ. Apostolico-Crochemore algorithm) - вариация Алгоритма Бойера-Мура.

Описание алгоритма

Нам даны: [math]y[/math] — текст, [math]x[/math] — образец, [math]m {{=}} |x|[/math], [math]n {{=}} |y|[/math].

Для начала рассмотрим ситуацию, когда мы сравниваем наш образец с [math]y[j \ldots j + m - 1][/math]. Предположим, что первое несовпадение произойдет между [math]x[i][/math] и [math]y[i + j][/math] при [math]0 \lt i \lt m[/math]. Тогда и . Когда сдвиг возможен, разумно ожидать что префикс [math]v[/math] шаблона совпадет c некоторым суффиксом [math]u[/math]. Более того, если мы ходим избежать несовпадения при сдвиге, то нужно чтобы символ, следующий за префиксом [math]v[/math] в шаблоне, не совпадал с [math]a[/math]. Такой наибольший префикс [math]v[/math] называется помеченным бордером строки [math]u[/math].

Определение:

помеченный бордер (англ. tagged border) строки — строка .

Введем обозначение: пусть [math]t[i][/math] — длина наибольшего бордера для [math]x[0 .. i - 1][/math] за которым следует символ [math]c \neq x[i][/math] и [math]-1[/math] если нет такого помеченного бордера, где [math]0 \lt i \le m[/math] ([math]t[0] = -1[/math]). Затем после сдвига сравнение можно продолжить между символами [math]x[t[i]][/math] и [math]y[i + j][/math] не потеряв никакого вхождения [math]x[/math] в [math]y[/math] и избежав отступа по тексту (смотри рис. 1).

Псевдокод

   empty

Пусть теперь [math]l {{=}} 0[/math], если [math]x = c ^ m[/math] и [math]c \in \Sigma[/math], иначе [math]l[/math] равно позиции первого элемента, который не равен [math]x[0][/math] ([math]x {{=}} a ^ l bu[/math], где [math]a[/math] и [math]b \in \Sigma[/math], а [math]u \in \Sigma^*[/math] и [math]a \neq b[/math]). На каждой итерации алгоритма мы выполняем сравнения с шаблоном в следующем порядке: .

Во время поиска вхождений мы рассматриваем данную тройку [math](i, j, k)[/math] где:

шаблон сравнивается с [math]y[j, \ldots , j + m - 1][/math]
[math]0 \le k \le l[/math] и
[math]l \le i \lt m[/math] и

Вначале инициализируем эту тройку [math](l, 0, 0)[/math]. Теперь опишем, как по уже вычисленной тройке [math](i, j, k)[/math] перейти к следующей. Возможны три случая в зависимости от значения [math]i[/math]:

[math]i = l[/math]:
Если [math]x[i] {{=}} y[i + j][/math], тогда следующая тройка [math](i + 1, j, k)[/math].

Если [math]x[i] \neq y[i + j][/math], тогда следующая тройка [math](l, j + 1, \max(0, k - 1))[/math].
[math]l \lt i \lt m [/math]
Если [math]x[i] {{=}} y[i + j][/math], тогда следующая тройка [math](i + 1, j, k)[/math].
Если [math]x[i] \neq y[i + j][/math], тогда возможны два случая в зависимости от значения [math]t[i][/math]:
- Если [math]t[i] \le l[/math], тогда следующая тройка .
- Если [math]t[i] \gt l[/math], тогда следующая тройка [math](t[i], i + j - t[i], l)[/math].
[math]i = m[/math]:
Если [math] k \lt l [/math] и [math]x[k] {{=}} y[j + k][/math], тогда следующая тройка [math](i, j, k + 1)[/math].

Иначе либо [math]k \lt l[/math] и [math]x[k] \ne y[l + k][/math], либо [math]k = l[/math]. Если [math]k = l[/math], то вхождение x в y найдено. В обоих случаях следующая тройка вычисляется как в случае [math]l \lt i \lt m [/math].

Асимптотика алгоритма

Стадия предподсчета, а именно вычисление массива [math]t[/math] и переменной [math]l[/math] занимает [math]O(m)[/math] времени и константное количество памяти. Этап поиска занимает [math]O(n)[/math] времени более того алгоритм в худшем случае выполнит [math]\frac{3}{2} n[/math] сравнений.

@@ Строка 1: / Строка 1: @@
 {{в разработке}}
 '''Алгоритм Апостолико-Крочемора''' (англ. ''Apostolico-Crochemore algorithm'') - вариация [[Алгоритм Бойера-Мура|Алгоритма Бойера-Мура]].
-==Характерные черты==
-* этап предобработки занимает <math>O(m)</math> времени и константное количество памяти,
-* этап поиска занимает <math>O(n)</math> времени,
-* выполняет <tex>\frac{3}{2} n</tex> сравнений в худшем случае.
 ==Описание алгоритма==
@@ Строка 24: / Строка 19: @@
      empty
-Пусть теперь <tex>l {{=}} 0</tex>, если <tex>x = c ^ m</tex> и <tex>c \in \Sigma</tex>, иначе <tex>l</tex> равно позиции первого элемента, который не равен <tex>x[0]</tex> (<tex>x {{=}} (a ^ l)bu</tex>, где <tex>a</tex> и <tex>b \in \Sigma</tex>, а <tex>u \in \Sigma^*</tex> и <tex>a \neq b</tex>). На каждой итерации алгоритма мы выполняем сравнения с шаблоном в следующем порядке: <tex>l, l + 1, \ldots , m - 2, m - 1, 0, 1, \ldots , l - 1</tex>.
+Пусть теперь <tex>l {{=}} 0</tex>, если <tex>x = c ^ m</tex> и <tex>c \in \Sigma</tex>, иначе <tex>l</tex> равно позиции первого элемента, который не равен <tex>x[0]</tex> (<tex>x {{=}} a ^ l bu</tex>, где <tex>a</tex> и <tex>b \in \Sigma</tex>, а <tex>u \in \Sigma^*</tex> и <tex>a \neq b</tex>). На каждой итерации алгоритма мы выполняем сравнения с шаблоном в следующем порядке: <tex>l, l + 1, \ldots , m - 2, m - 1, 0, 1, \ldots , l - 1</tex>.
 Во время поиска вхождений мы рассматриваем данную тройку <tex>(i, j, k)</tex> где:
@@ Строка 44: / Строка 39: @@
 # <tex>i = m</tex>:
 #: Если <tex> k < l </tex> и <tex>x[k] {{=}} y[j + k]</tex>, тогда следующая тройка <tex>(i, j, k + 1)</tex>.
-#: Иначе
+#: Иначе либо <tex>k < l</tex> и <tex>x[k] \ne y[l + k]</tex>, либо <tex>k = l</tex>. Если <tex>k = l</tex>, то вхождение x в y найдено. В обоих случаях следующая тройка вычисляется как в случае <tex>l < i < m </tex>.
+==Асимптотика алгоритма==
+Стадия предподсчета, а именно вычисление массива <tex>t</tex> и переменной <tex>l</tex> занимает <math>O(m)</math> времени и константное количество памяти. Этап поиска занимает  <math>O(n)</math> времени более того алгоритм в худшем случае выполнит <tex>\frac{3}{2} n</tex> сравнений.

Алгоритм Апостолико-Крочемора — различия между версиями

Версия 22:23, 4 марта 2016

Описание алгоритма

Псевдокод

Асимптотика алгоритма

Навигация

Персональные инструменты

Пространства имён

Варианты

Просмотры

Ещё

Поиск

Навигация

Инструменты