Период и бордер, их связь — различия между версиями

Материал из Викиконспекты
Перейти к: навигация, поиск
(Переделывание доказательства про НОД)
(Доказательство про НОД дописано)
Строка 46: Строка 46:
 
Утверждение доказано.
 
Утверждение доказано.
 
}}
 
}}
 +
 +
 +
Перед доказательством следующей теоремы сначала докажем пару интуитивно понятных лемм.
  
 
{{Лемма
 
{{Лемма
 
|about=1
 
|about=1
|statement= Пусть строка <tex> w </tex> имеет периоды <tex> p </tex> и <tex> q </tex>, причём <tex> p < q \leqslant |w| </tex>. Тогда суффикс и префикс <tex> w </tex> длины <tex> |w| - q </tex> имеют период <tex> p - q </tex>.  
+
|statement= Пусть строка <tex> s </tex> имеет периоды <tex> p </tex> и <tex> q </tex>, причём <tex> p < q \leqslant |s| </tex>. Тогда суффикс и префикс <tex> s </tex> длины <tex> |s| - q </tex> имеют период <tex> p - q </tex>.  
 
|proof= Покажем истинность утверждения про префикс; с суффиксом доказательство аналогичное.
 
|proof= Покажем истинность утверждения про префикс; с суффиксом доказательство аналогичное.
  
Требуется показать что <tex> s_i = s_{i+p-q} \ \ (i = 1,\dots,n-p) </tex>  
+
Требуется показать что <tex> s_i = s_{i+p-q} \ \ (i = 1,\dots,n-p; \ n=|s|) </tex>  
  
Поскольку <tex> w </tex> имеет период <tex> p </tex>, выполнено <tex> s_i = s_{i+p} </tex>  
+
Поскольку <tex> s </tex> имеет период <tex> p </tex>, выполнено <tex> s_i = s_{i+p} </tex>  
Также <tex> w </tex> имеет период <tex> q </tex> и из ограничений на <tex> i </tex> верно <tex> 1 \leqslant i + p - q \leqslant n - q </tex>, поэтому <tex> s_{i+p-q} = s_{i+p} </tex>   
+
Также <tex> s </tex> имеет период <tex> q </tex> и из ограничений на <tex> i </tex> верно <tex> 1 \leqslant i + p - q \leqslant n - q </tex>, поэтому <tex> s_{i+p-q} = s_{i+p} </tex>   
 
}}
 
}}
  
Строка 63: Строка 66:
 
|proof= Пусть <tex> w = s_1 \dots s_n,\ v = s_h \dots s_k </tex>, где <tex> 1 \leqslant h < k \leqslant n </tex>.  
 
|proof= Пусть <tex> w = s_1 \dots s_n,\ v = s_h \dots s_k </tex>, где <tex> 1 \leqslant h < k \leqslant n </tex>.  
  
Требуется показать: <tex> a_i = a_j \ (j = i + r,\ 1 \leqslant i, j \leqslant n) </tex>.
+
Требуется показать: <tex> s_i = s_j \ (j = i + r,\ 1 \leqslant i, j \leqslant n) </tex>.
 +
 
 +
Заметим, что поскольку <tex> |v| \geqslant q </tex>, то отрезок <tex> [h, k] </tex> содержит ровно <tex> q </tex> целых чисел, так что найдутся <tex>  i',\ j' \in [h, k] </tex>  такие, что <tex> i \equiv i' \pmod q,\ j \equiv j' \pmod q </tex>.
 +
 
 +
Так как <tex> q|r </tex>, можем написать <tex> i \equiv i' \pmod r,\ j \equiv j' \pmod r </tex>.
 +
 
 +
Помимо того <tex> i \equiv j \pmod r </tex>, тогда верно и <tex> i' \equiv j' \pmod r </tex>.
 +
 
 +
Теперь, поскольку <tex> w </tex> имеет период <tex> q </tex>, имеет место <tex> s_i = s_{i'}\ </tex> и <tex>\ s_j = s_{j'} </tex>. Поскольку <tex> v </tex> имеет период <tex> r </tex>, верно <tex> s_{i'} = s_{j'} </tex>. Тогда и <tex> s_i = s_j </tex>.  
  
Заметим, что поскольку <tex> |v| \geqslant q </tex>, то отрезок <tex> [h, k] </tex> содержит по меньшей мере <tex> q </tex> целых чисел, поэтому найдутся <tex>  i' </tex> и <tex> j' </tex> такие, что <tex> i \equiv i' \pmod q,\ j \equiv j' \pmod q </tex>.
 
 
}}
 
}}
  
  
 
{{Теорема
 
{{Теорема
|statement= Если у строки длины <tex>n</tex> есть периоды <tex>p</tex> и <tex>q</tex>, где <tex>p + q - НОД(p, q) \leqslant n</tex>, то НОД<tex>(p, q)</tex> также является периодом этой строки.
+
|statement= Если у строки <tex>w</tex> есть периоды <tex>p</tex> и <tex>q</tex>, где <tex> |w| \geqslant p + q - GCD(p, q) </tex>, то НОД<tex>(p, q)</tex> также является периодом этой строки.
 
|author=Фин и Вильф
 
|author=Фин и Вильф
|proof=
+
|proof=Обозначим <tex> r = GCD(p, q) </tex>. Доказательство будем вести индукцией по <tex> n = (p + q) / r </tex>.
 +
* База
 +
*: При <tex> n = 1 </tex> видно, что <tex> p = q = r </tex> и утверждение истинно.
 +
* Переход
 +
*: Заметим что теперь <tex> q \ne p </tex>, поэтому без ограничения общности можем сказать что, <tex> q < p </tex>.
 +
*: Пусть <tex> w = uv </tex>, где <tex> |u| = q </tex>.
 +
*: По лемме 1 <tex> v </tex> имеет период <tex> p - q </tex>, также <tex> v </tex> имеет период <tex> q </tex> как подстрока <tex> w </tex>. Теперь рассмотрим длину <tex> v </tex>:
 +
*: <tex> |v| = |w| - q \geqslant (p - q) + q - r = (p - q) + q - GCD(p - q, q) </tex>.
 +
*: Тогда по предположению индукции получаем, что <tex> v </tex> также имеет период <tex> GCD(p-q, q)</tex>. Поскольку <tex> GCD(p-q, q) = GCD(p, q) = r </tex>, можем сказать что <tex> v </tex> имеет период <tex> r </tex>.
 +
*: Ещё заметим, что <tex> p - q \geqslant r </tex> (<tex> p > q </tex> и по свойствам НОД), поэтому <tex> |v| = |w| - q \geqslant (p - q) + q - r \geqslant q </tex>, тогда по лемме 2 <tex> w </tex> имеет период <tex> r </tex>.
  
 
}}
 
}}
 +
 +
Ограничение <tex> |w| \geqslant p + q - GCD(p, q) </tex> существенно. Например строка <tex> w = abaababaaba </tex> имеет периоды <tex> 5 </tex> и <tex> 8 </tex>, её длина <tex> 11 < 5 + 8 - 1 </tex>, и периода <tex> 1 </tex> у неё нет.
  
 
== См. также ==
 
== См. также ==

Версия 11:27, 8 мая 2014

Определения

Определение:
Строка [math]\alpha[/math] называется бордером строки [math]\beta[/math], если [math]\alpha[/math] одновременно является и суффиксом, и префиксом [math]\beta[/math].


Определение:
Число [math]p[/math] называется периодом строки [math]\alpha[/math], если [math]\forall i = 1 \ldots n - p[/math] [math]\alpha [i] = \alpha[i + p][/math].


Связь периода и бордера

Теорема:
Если у строки длины [math]n[/math] есть бордер длины [math]k[/math], то у нее есть период длины [math]n - k[/math].
Доказательство:
[math]\triangleright[/math]

Пусть дана строка [math]\alpha[/math].
Напишем формально определения бордера длины [math]k[/math] строки [math]\alpha[/math]:

    [math]\forall i = 1 \ldots k[/math], [math]\alpha [i] = \alpha[i + (n - k)][/math].

Сделаем замену [math]x = n - k[/math]:

    [math]\forall i = 1 \ldots n - x[/math], [math]\alpha [i] = \alpha[i + x][/math].
Получили определение периода длины [math]x[/math]. Но [math]x = n - k[/math], значит у строки [math]\alpha[/math] есть период длины [math]n - k[/math].
[math]\triangleleft[/math]

Свойства периода

Теорема:
Если у строки есть период длины [math]k[/math], то у нее есть период длины [math]kx[/math], где [math] x \in N[/math].
Доказательство:
[math]\triangleright[/math]

Пусть длина строки равна [math]n[/math], сама строка — [math]\alpha[/math].
Доказательство будем вести по индукции по числу [math]x[/math].

  1. Для [math] x = 1 [/math] утверждение очевидно.
  2. Пусть верно для [math]x \leqslant m[/math].
  3. Докажем, что верно для [math]x = m + 1[/math].
    Из определения периода имеем, что
      [math]\forall i = 1 \ldots n - k[/math], [math]\alpha [i] = \alpha[i + k][/math],

    а из предположения индукции, что

      [math]\forall i = 1 \ldots n - km[/math], [math]\alpha [i] = \alpha[i + mk][/math]

    Значит получаем, что

      [math]\forall i = 1 \ldots n - km - k[/math], [math]\alpha [i] = \alpha [i + mk] = \alpha[i + mk + k][/math],

    следовательно

      для [math]\forall i = 1 \ldots n - k(m + 1)[/math], [math]\alpha [i] = \alpha[i + k(m + 1)][/math].
    Значит у строки есть период длины [math]k(m + 1)[/math].
Утверждение доказано.
[math]\triangleleft[/math]


Перед доказательством следующей теоремы сначала докажем пару интуитивно понятных лемм.

Лемма (1):
Пусть строка [math] s [/math] имеет периоды [math] p [/math] и [math] q [/math], причём [math] p \lt q \leqslant |s| [/math]. Тогда суффикс и префикс [math] s [/math] длины [math] |s| - q [/math] имеют период [math] p - q [/math].
Доказательство:
[math]\triangleright[/math]

Покажем истинность утверждения про префикс; с суффиксом доказательство аналогичное.

Требуется показать что [math] s_i = s_{i+p-q} \ \ (i = 1,\dots,n-p; \ n=|s|) [/math]

Поскольку [math] s [/math] имеет период [math] p [/math], выполнено [math] s_i = s_{i+p} [/math]

Также [math] s [/math] имеет период [math] q [/math] и из ограничений на [math] i [/math] верно [math] 1 \leqslant i + p - q \leqslant n - q [/math], поэтому [math] s_{i+p-q} = s_{i+p} [/math]
[math]\triangleleft[/math]
Лемма (2):
Пусть строка [math] w [/math] имеет период [math] q [/math], и существует [math] v [/math] подстрока [math] w [/math] такая, что [math] |v| \geqslant q [/math] и [math] v [/math] имеет период [math] r [/math], где [math] r | q [/math]. Тогда [math] w [/math] имеет период [math] r [/math].
Доказательство:
[math]\triangleright[/math]

Пусть [math] w = s_1 \dots s_n,\ v = s_h \dots s_k [/math], где [math] 1 \leqslant h \lt k \leqslant n [/math].

Требуется показать: [math] s_i = s_j \ (j = i + r,\ 1 \leqslant i, j \leqslant n) [/math].

Заметим, что поскольку [math] |v| \geqslant q [/math], то отрезок [math] [h, k] [/math] содержит ровно [math] q [/math] целых чисел, так что найдутся [math] i',\ j' \in [h, k] [/math] такие, что [math] i \equiv i' \pmod q,\ j \equiv j' \pmod q [/math].

Так как [math] q|r [/math], можем написать [math] i \equiv i' \pmod r,\ j \equiv j' \pmod r [/math].

Помимо того [math] i \equiv j \pmod r [/math], тогда верно и [math] i' \equiv j' \pmod r [/math].

Теперь, поскольку [math] w [/math] имеет период [math] q [/math], имеет место [math] s_i = s_{i'}\ [/math] и [math]\ s_j = s_{j'} [/math]. Поскольку [math] v [/math] имеет период [math] r [/math], верно [math] s_{i'} = s_{j'} [/math]. Тогда и [math] s_i = s_j [/math].
[math]\triangleleft[/math]


Теорема (Фин и Вильф):
Если у строки [math]w[/math] есть периоды [math]p[/math] и [math]q[/math], где [math] |w| \geqslant p + q - GCD(p, q) [/math], то НОД[math](p, q)[/math] также является периодом этой строки.
Доказательство:
[math]\triangleright[/math]

Обозначим [math] r = GCD(p, q) [/math]. Доказательство будем вести индукцией по [math] n = (p + q) / r [/math].

  • База
    При [math] n = 1 [/math] видно, что [math] p = q = r [/math] и утверждение истинно.
  • Переход
    Заметим что теперь [math] q \ne p [/math], поэтому без ограничения общности можем сказать что, [math] q \lt p [/math].
    Пусть [math] w = uv [/math], где [math] |u| = q [/math].
    По лемме 1 [math] v [/math] имеет период [math] p - q [/math], также [math] v [/math] имеет период [math] q [/math] как подстрока [math] w [/math]. Теперь рассмотрим длину [math] v [/math]:
    [math] |v| = |w| - q \geqslant (p - q) + q - r = (p - q) + q - GCD(p - q, q) [/math].
    Тогда по предположению индукции получаем, что [math] v [/math] также имеет период [math] GCD(p-q, q)[/math]. Поскольку [math] GCD(p-q, q) = GCD(p, q) = r [/math], можем сказать что [math] v [/math] имеет период [math] r [/math].
    Ещё заметим, что [math] p - q \geqslant r [/math] ([math] p \gt q [/math] и по свойствам НОД), поэтому [math] |v| = |w| - q \geqslant (p - q) + q - r \geqslant q [/math], тогда по лемме 2 [math] w [/math] имеет период [math] r [/math].
[math]\triangleleft[/math]

Ограничение [math] |w| \geqslant p + q - GCD(p, q) [/math] существенно. Например строка [math] w = abaababaaba [/math] имеет периоды [math] 5 [/math] и [math] 8 [/math], её длина [math] 11 \lt 5 + 8 - 1 [/math], и периода [math] 1 [/math] у неё нет.

См. также

Основные определения, связанные со строками