Декомпозиция Линдона — различия между версиями

Версия 21:56, 1 мая 2014

Основные определения

Декомпозиция Линдона была изобретена Роджером Линдоном (англ. Roger Lyndon) в 1954 году. Она используется для нахождения лексикографически минимального и максимального суффиксов строки.

Определение:

Простая строка — строка, которая строго лексикографически меньше любого своего суффикса.

Определение:

Декомпозиция Линдона (англ. Lyndon decomposition) строки — её разложение , где строки просты, и при этом .

Существование и единственность

Лемма:

, — простые и лексикографически. Тогда:

1. [math]s + t \lt t[/math]

2. — простая

Доказательство:

1. Так как [math]s \lt t[/math], и [math]s[j] = t[j][/math], 2. [math]|s| \leqslant |t|[/math] Пусть [math]u[/math] — суффикс строки [math]s + t[/math]

1)

2) [math]|u| \lt |t| \rightarrow u[/math] — суффикс [math]t[/math]. Так как [math]t[/math] — простая,

3) , . Так как — простая, и

Теорема:

Можно построить декомпозицию Линдона любой строки , причем единственным образом.

Доказательство:

1. Существование.

Разобьем строку на символы. Будем их склеивать, если подряд идущие символы: [math]s[i] \lt s[i+1][/math]. Так как символ — простая строка, по лемме [math]s[i..i+1][/math] — тоже простая и [math]s[i..i+1] \lt s[i][/math]. Далее склеиваем строки, не удовлетворяющие условию . Это конечный процесс, так как длина строки конечна [math]\rightarrow[/math] получим нужное разбиение.

Пусть существует хотя бы одно разбиение строки на простые слова. Возьмем разбиение строки на простые слова (без условия ) такое, чтобы [math]k[/math] было минимально. Пусть в нем есть [math]s_i \lt s_{i+1}[/math], тогда эти строки можно сконкатернировать [math]\rightarrow[/math] получим разбиение с меньшим числом слов — противоречие с выбором [math]k[/math].

Получили: [math]k[/math] — минимально [math]\leftrightarrow[/math] нет [math]s_i \lt s_{i+1}[/math]

2. Единственность.

Пусть существует несколько разбиений , удовлетворяющих условию теоремы. Сравним длины первых двух слов [math]s_1[/math] и [math]s_1'[/math], если [math]|s_1| = |s_1'|[/math], сравним вторые и так далее. Если у всех слов длины одинаковы, то разбиения совпадают — противоречие. Иначе Покажем, что такого не может быть:

1) Пусть [math]|s_i| \gt |s_i'|[/math] Тогда , где [math]t[/math] — префикс [math]s_{j+1}'[/math], [math]i \leqslant j[/math] Получаем: [math]s_i \lt t[/math] (так как [math]s_i[/math] простая и по определению меньше своего суффикса), [math]t \lt s_{j+1}'[/math] (так как [math]t[/math] — префикс), [math]s_{j+1}' \lt s_i'[/math] (по условию разбиения), [math]s_i' \lt s_i[/math] (их начало совпадает, и [math]|s_i| \lt |s_i'|[/math] по предположению. Получили противоречие: [math]s_i \lt s_i[/math].

2) Пусть [math]|s_i| \lt |s_i'|[/math] — проверяется аналогично.

То есть не может быть строк несовпадающей длины разбиения равны.

Алгоритм Дюваля

Алгоритм Дюваля (англ. Duval's algorithm) находит для данной строки длины [math]n[/math] декомпозицию Линдона за время [math]O(n)[/math] с использованием [math]O(1)[/math] дополнительной памяти.

Определение:

Предпростая строка — строка , такая что , где — некоторая простая строка, а - некоторый префикс строки .

   string s // входная строка
   string[] words // декомпозиция
   n [math]\leftarrow[/math] |s|
   i [math]\leftarrow[/math] 0
   w [math]\leftarrow[/math] 0
   while (i < n) {
   	j [math]\leftarrow[/math] i + 1
       k [math]\leftarrow[/math] i
   	while (j < n and s[k] <= s[j]) {
   	    if s[k] < s[j]
               k [math]\leftarrow[/math] i
           else
               k [math]\leftarrow[/math] k + 1
           j [math]\leftarrow[/math] j + 1
       }
       while (i <= k) {
           words[w] [math]\leftarrow[/math] s[i..j-k]
           w [math]\leftarrow[/math] w + 1
           i [math]\leftarrow[/math] i + j - k;
       }
   }

@@ Строка 80: / Строка 80: @@
      i <tex>\leftarrow</tex> 0
      w <tex>\leftarrow</tex> 0
-     while (i < n) {
+     '''while''' (i < n) {
      	j <tex>\leftarrow</tex> i + 1
          k <tex>\leftarrow</tex> i
-     	while (j < n and s[k] <= s[j]) {
+     	'''while''' (j < n and s[k] <= s[j]) {
-     	    if s[k] < s[j]
+     	    '''if''' s[k] < s[j]
                  k <tex>\leftarrow</tex> i
-             else
+             '''else'''
                  k <tex>\leftarrow</tex> k + 1
              j <tex>\leftarrow</tex> j + 1
          }
-         while (i <= k) {
+         '''while''' (i <= k) {
              words[w] <tex>\leftarrow</tex> s[i..j-k]
              w <tex>\leftarrow</tex> w + 1

Декомпозиция Линдона — различия между версиями

Версия 21:56, 1 мая 2014

Основные определения

Существование и единственность

Алгоритм Дюваля

Навигация

Персональные инструменты

Пространства имён

Варианты

Просмотры

Ещё

Поиск

Навигация

Инструменты