Версия 14:09, 13 мая 2014

Эта статья находится в разработке!

Алгоритм Фарача — алгоритм построения суффиксного дерева для заданной строки [math]s[/math], который выполняется за время [math]O(N)[/math], при этом даже не требуется выполнения условия конечности алфавита. Такая эффективность достигается за счет того, что строковые последовательности определяются на индексированном алфавите или, что эквивалентно, на целочисленном алфавите [math]\Sigma = \{1, 2 {...}, a\}[/math], при этом накладывается дополнительное условие, что [math]a \in O(N)[/math]. Такие алфавиты часто встречаются на практике.

описание алгоритма

Основная идея алгоритма, заключается в том что мы уменьшаем размер исходной строки. Для этого мы разбиваем символы сходной строки на пару и пронумеровываем их, а из полученных номеров составляем новую строку, которая уже в 2 раза короче.

Мы опишем алгоритм Фарача в виде пяти выполняемых шагов. Используем в качестве примера строку [math]s = 121112212221[/math], определенную на алфавите [math]А = {1, 2} [/math] (в этом примере N = 12).

шаг 0: суффиксное дерево для сжатой строки

* Строка [math]s[/math] разбивается на пары: [math] 12 11 12 21 22 21 [/math]
* Пары сортирутся поразрядной сортировкой: [math]11 12 12 21 21 22 [/math].
* Удаляются копии: [math]11 12 21 22[/math].
* Парам даются номера (условно, в массиве они и так есть): [math]11-(0), 12-(1), 21-(2), 22-(3)[/math]
* Создаётся новая строка из номеров пар: 1 0 1 2 3 2
* Из полученной строки создаётся суффикcное дерево:

суфдерево для сжатой строки


ID	LCP	STR
1	0	0 1 2 3 2
0	0	1 0 1 2 3 2
2	1	1 2 3 2
3	0	2 3 2
5	1	2
4	0	3 2

шаг 1: построение нечетного дерева

Определение:

Нечетное дерево является деревом суффиксов для строки , узлы-листья которого ограничены нечетными позициями строки .

шаг 2: построение четного дерева по нечетному

шаг 3: слияние четного и нечетного дерева

шаг 4: построение LCP-дерева

шаг 5: построение суффиксного дерева по LCP и слитому

аспекты реализации

корректность и эффективность

@@ Строка 16: / Строка 16: @@
   * Создаётся новая строка из номеров пар: 1 0 1 2 3 2
   * Из полученной строки создаётся суффикcное дерево:
+[[Файл:tree101232.png|300px|thumb|right|суфдерево для сжатой строки]]
+{|class="wikitable"
+|+
+!width="20%"|ID !!width="20%"|LCP !!width="20%"|STR
+|- align = "center"
+|1
+|0
+|0 1 2 3 2
+|- align = "center"
+|0
+|0
+|1 0 1 2 3 2
+|- align = "center"
+|2
+|1
+|1 2 3 2
+|- align = "center"
+|3
+|0
+|2 3 2
+|- align = "center"
+|5
+|1
+|2
+|- align = "center"
+|4
+|0
+|3 2
+|}
 == шаг 1: построение нечетного дерева ==

Алгоритм Фараха — различия между версиями

Версия 14:09, 13 мая 2014

Содержание

описание алгоритма

шаг 0: суффиксное дерево для сжатой строки

шаг 1: построение нечетного дерева

шаг 2: построение четного дерева по нечетному

шаг 3: слияние четного и нечетного дерева

шаг 4: построение LCP-дерева

шаг 5: построение суффиксного дерева по LCP и слитому

аспекты реализации

корректность и эффективность

Навигация

Персональные инструменты

Пространства имён

Варианты

Просмотры

Ещё

Поиск

Навигация

Инструменты