Период и бордер, их связь — различия между версиями

Материал из Викиконспекты
Перейти к: навигация, поиск
м (rollbackEdits.php mass rollback)
 
(не показано 11 промежуточных версий 5 участников)
Строка 1: Строка 1:
==Определения==
 
{{Определение
 
|definition =
 
Строка <tex>\alpha</tex> называется '''бордером''' строки <tex>\beta</tex>, если <tex>\alpha</tex> одновременно является и [[Основные определения, связанные со строками#Отношения между строками|суффиксом]], и [[Основные определения, связанные со строками#Отношения между строками|префиксом]] <tex>\beta</tex>.
 
|id=border
 
}}
 
 
{{Определение
 
|definition =
 
Число <tex>p</tex> называется '''периодом''' строки <tex>\alpha</tex>, если <tex>\forall i = 1 \ldots n - p</tex> <tex>\alpha [i] = \alpha[i + p]</tex>.
 
|id=border
 
}}
 
 
 
==Связь периода и бордера==
 
==Связь периода и бордера==
 
{{Теорема
 
{{Теорема
|statement= Если у строки длины <tex>n</tex> есть [[Период_и_бордер,_их_связь#Определения|бордер]] длины <tex>k</tex>, то у нее есть [[Период_и_бордер,_их_связь#Определения|период]] длины <tex>n - k</tex>.
+
|statement= Если у строки длины <tex>n</tex> есть [[Основные определения, связанные со строками#border | бордер]] длины <tex>k</tex>, то у нее также имеется [[Основные определения, связанные со строками#period | период]] длины <tex>n - k</tex>.
 
|proof=
 
|proof=
 
Пусть дана строка <tex>\alpha</tex>.
 
Пусть дана строка <tex>\alpha</tex>.
  
Напишем формально определения бордера длины <tex>k</tex> строки <tex>\alpha</tex>:
+
Напишем формально определение бордера длины <tex>k</tex> строки <tex>\alpha</tex>:
  
: <tex>\forall i = 1 \ldots k</tex>, <tex>\alpha [i] = \alpha[i + (n - k)]</tex>.
+
: <tex>\forall i = 1 \ldots k: \ \alpha [i] = \alpha[i + (n - k)]</tex>
 
Сделаем замену <tex>x = n - k</tex>:
 
Сделаем замену <tex>x = n - k</tex>:
: <tex>\forall i = 1 \ldots n - x</tex>, <tex>\alpha [i] = \alpha[i + x]</tex>.
+
: <tex>\forall i = 1 \ldots n - x: \ \alpha [i] = \alpha[i + x]</tex>
 
Получили определение периода длины <tex>x</tex>. Но <tex>x = n - k</tex>, значит у строки <tex>\alpha</tex> есть период длины <tex>n - k</tex>.
 
Получили определение периода длины <tex>x</tex>. Но <tex>x = n - k</tex>, значит у строки <tex>\alpha</tex> есть период длины <tex>n - k</tex>.
 
}}
 
}}
  
 
==Свойства периода==
 
==Свойства периода==
==Теорема о кратном периоде==
 
 
{{Теорема
 
{{Теорема
|statement= Если у строки есть [[Период_и_бордер,_их_связь#Определения|период]] длины <tex>k</tex>, то у нее есть период длины <tex>kx</tex>, где <tex> x \in N</tex>.
+
|author=о кратном периоде
 +
|statement= Если у строки есть период длины <tex>k</tex>, то у нее имеется также период длины <tex>kx</tex>, где <tex> x \in N</tex>.
 
|proof=
 
|proof=
 
Пусть длина строки равна <tex>n</tex>, сама строка {{---}} <tex>\alpha</tex>.
 
Пусть длина строки равна <tex>n</tex>, сама строка {{---}} <tex>\alpha</tex>.
Строка 38: Строка 25:
 
*: Для <tex> x = 1 </tex> утверждение очевидно.
 
*: Для <tex> x = 1 </tex> утверждение очевидно.
 
* Переход
 
* Переход
*: Пусть верно для <tex>x \leqslant m</tex>. Докажем, что верно для <tex>x = m + 1</tex>.
+
*: Пусть верно для <tex>x \leqslant m</tex>. Докажем то же для <tex>x = m + 1</tex>.
 
*: Из определения периода имеем
 
*: Из определения периода имеем
*:: <tex>\forall i = 1 \ldots n - k</tex>, <tex>\alpha [i] = \alpha[i + k]</tex>,
+
*:: <tex>\forall i = 1 \ldots n - k: \ \alpha [i] = \alpha[i + k]</tex>
 
*: а из предположения индукции
 
*: а из предположения индукции
*:: <tex>\forall i = 1 \ldots n - km</tex>, <tex>\alpha [i] = \alpha[i + mk]</tex>.
+
*:: <tex>\forall i = 1 \ldots n - km: \ \alpha [i] = \alpha[i + mk]</tex>
*: Значит получаем, что
+
*: С учётом этого получаем, что
*:: <tex>\forall i = 1 \ldots n - km - k</tex>, <tex>\alpha [i] = \alpha [i + mk] = \alpha[i + mk + k]</tex>,
+
*:: <tex>\forall i = 1 \ldots n - km - k: \ \alpha [i] = \alpha [i + mk] = \alpha[i + mk + k]</tex>
 
*: следовательно
 
*: следовательно
*:: <tex>\forall i = 1 \ldots n - k(m + 1)</tex>, <tex>\alpha [i] = \alpha[i + k(m + 1)]</tex>.
+
*:: <tex>\forall i = 1 \ldots n - k(m + 1): \ \alpha [i] = \alpha[i + k(m + 1)]</tex>
 
*: Значит у строки есть период длины <tex>k(m + 1)</tex>.
 
*: Значит у строки есть период длины <tex>k(m + 1)</tex>.
  
Строка 52: Строка 39:
 
}}
 
}}
  
==Теорема о НОД периодов==
+
Перед доказательством следующей теоремы проверим пару интуитивно понятных утверждений.
Перед доказательством следующей теоремы докажем пару интуитивно понятных утверждений.
 
  
 
{{Лемма
 
{{Лемма
 
|about=1
 
|about=1
|statement= Пусть строка <tex> s </tex> имеет периоды <tex> p </tex> и <tex> q </tex>, причём <tex> p < q \leqslant |s| </tex>. Тогда суффикс и префикс <tex> s </tex> длины <tex> |s| - q </tex> имеют период <tex> p - q </tex>.  
+
|statement= Пусть строка <tex> s </tex> имеет периоды <tex> p </tex> и <tex> q </tex>, причём <tex> q < p \leqslant |s| </tex>. Тогда суффикс и префикс <tex> s </tex> длины <tex> |s| - q </tex> имеют период <tex> p - q </tex>.  
 
|proof= Покажем истинность утверждения про префикс; с суффиксом доказательство аналогичное.
 
|proof= Покажем истинность утверждения про префикс; с суффиксом доказательство аналогичное.
  
Требуется показать что <tex> s_i = s_{i+p-q} \ \ (i = 1,\dots,n-p\ , \ n=|s|) </tex>  
+
Требуется показать: <tex> s_i = s_{i+p-q} \ \ (i = 1 \dots n-p\ , \ n=|s|) </tex>  
  
Поскольку <tex> s </tex> имеет период <tex> p </tex>, выполнено <tex> s_i = s_{i+p} </tex>  
+
Исходя из того, что <tex> s </tex> имеет период <tex> p </tex>, выполнено <tex> s_i = s_{i+p} </tex>  
 
Также <tex> s </tex> имеет период <tex> q </tex> и из ограничений на <tex> i </tex> верно <tex> 1 \leqslant i + p - q \leqslant n - q </tex>, поэтому <tex> s_{i+p-q} = s_{i+p} </tex>   
 
Также <tex> s </tex> имеет период <tex> q </tex> и из ограничений на <tex> i </tex> верно <tex> 1 \leqslant i + p - q \leqslant n - q </tex>, поэтому <tex> s_{i+p-q} = s_{i+p} </tex>   
 
}}
 
}}
Строка 73: Строка 59:
 
Требуется показать: <tex> s_i = s_j \ (j = i + r,\ 1 \leqslant i, j \leqslant n) </tex>.
 
Требуется показать: <tex> s_i = s_j \ (j = i + r,\ 1 \leqslant i, j \leqslant n) </tex>.
  
Заметим, что поскольку <tex> |v| \geqslant q </tex>, то отрезок <tex> [h, k] </tex> содержит ровно <tex> q </tex> целых чисел, так что найдутся <tex>  i',\ j' \in [h, k] </tex>  такие, что <tex> i \equiv i' \pmod q,\ j \equiv j' \pmod q </tex>.
+
Зафиксируем <tex> i </tex> и <tex> j </tex>. Заметим, что поскольку <tex> |v| \geqslant q </tex>, отрезок <tex> [h, k] </tex> содержит по меньшей мере <tex> q </tex> целых чисел, так что найдутся <tex>  i',\ j' \in [h, k]: \ \ i \equiv i' \pmod q,\ j \equiv j' \pmod q,\ i \ne j </tex>.
  
 
С учётом <tex> q </tex> <tex dpi=90>\,\vdots\, </tex> <tex> r </tex> можем написать <tex> i \equiv i' \pmod r,\ j \equiv j' \pmod r </tex> <ref>[[Сравнения,_система_вычетов,_решение_линейных_систем_по_модулю#Свойства сравнений | Свойство сравнений (№8)]]</ref>.  
 
С учётом <tex> q </tex> <tex dpi=90>\,\vdots\, </tex> <tex> r </tex> можем написать <tex> i \equiv i' \pmod r,\ j \equiv j' \pmod r </tex> <ref>[[Сравнения,_система_вычетов,_решение_линейных_систем_по_модулю#Свойства сравнений | Свойство сравнений (№8)]]</ref>.  
  
Помимо того <tex> i \equiv j \pmod r </tex>, тогда верно и <tex> i' \equiv j' \pmod r </tex>.
+
Помимо того <tex> i \equiv j \pmod r </tex>, а в таком случае верно и <tex> i' \equiv j' \pmod r </tex>.
  
Теперь воспользуемся тем фактом, что если строка <tex> s </tex> имеет период <tex> r </tex>, то <tex> i \equiv j \pmod r \ \Rightarrow\ s_i = s_j </tex>  (действительно, без ограничения общности можем сказать, что <tex> i \leqslant j </tex>, тогда <tex> s_i = s_{i + r},\ \ s_{i + r} = s_{i + 2r},\ \ \dots \ , \ s_{j - r} = s_j </tex>).
+
Теперь воспользуемся следующим фактом: если строка <tex> s </tex> имеет период <tex> r </tex>, то <tex> i \equiv j \pmod r \ \Rightarrow\ s_i = s_j </tex>  (действительно, без ограничения общности можем сказать, что <tex> i \leqslant j </tex>, и исходя из этого выстроить цепочку равенств <tex> s_i = s_{i + r},\ \ s_{i + r} = s_{i + 2r},\ \ \dots \ , \ s_{j - r} = s_j </tex>).
  
Поскольку <tex> w </tex> имеет период <tex> q </tex>, имеют место равенства <tex> s_i = s_{i'}\ </tex> и <tex>\ s_j = s_{j'} </tex>. Поскольку <tex> v </tex> имеет период <tex> r </tex>, верно <tex> s_{i'} = s_{j'} </tex>. Тогда и <tex> s_i = s_j </tex>.  
+
В виду того, что <tex> w </tex> имеет период <tex> q </tex>, имеют место равенства <tex> s_i = s_{i'}\ </tex> и <tex>\ s_j = s_{j'} </tex>. Кроме того <tex> v </tex> имеет период <tex> r </tex>, потому верно <tex> s_{i'} = s_{j'} </tex>. Тогда и <tex> s_i = s_j </tex>.  
  
 
}}
 
}}
Строка 90: Строка 76:
 
|author=Фин и Вильф
 
|author=Фин и Вильф
 
|proof=Обозначим <tex> r = \gcd(p, q) </tex>. Доказательство будем вести индукцией по <tex> n = (p + q) / r </tex>.
 
|proof=Обозначим <tex> r = \gcd(p, q) </tex>. Доказательство будем вести индукцией по <tex> n = (p + q) / r </tex>.
 +
 +
В случае <tex> p = q </tex> видим что <tex> n = 2 </tex>, что соответствует базе, в то время как при <tex> p \ne q </tex> выполнено <tex> \max(p, q) > \gcd(p, q) </tex>, так что <tex> n > 2 </tex>.
 
* База
 
* База
*: При <tex> n = 2 </tex> видно, что <tex> p = q = r </tex> и потому утверждение истинно.
+
*: Истинность утверждения следует из <tex> p = q = r </tex>.
 
* Переход
 
* Переход
*: Заметим что теперь <tex> q \ne p </tex> (так как <tex> n > 2 </tex>), поэтому без ограничения общности можем сказать, что <tex> q < p </tex>.
+
*: В силу того, что <tex> p \ne q </tex>, без ограничения общности будем считать <tex> q < p </tex> (вообще говоря, исходя из свойств НОД можно дать более строгую оценку: <tex> p - q \geqslant r </tex>, чем мы позже воспользуемся).
 
*: Пусть <tex> w = uv </tex>, где <tex> |u| = q </tex>.  
 
*: Пусть <tex> w = uv </tex>, где <tex> |u| = q </tex>.  
 
*: По '''лемме 1''' <tex> v </tex> имеет период <tex> p - q </tex>, также <tex> v </tex> имеет период <tex> q </tex> как подстрока <tex> w </tex>. Теперь рассмотрим длину <tex> v </tex>:  
 
*: По '''лемме 1''' <tex> v </tex> имеет период <tex> p - q </tex>, также <tex> v </tex> имеет период <tex> q </tex> как подстрока <tex> w </tex>. Теперь рассмотрим длину <tex> v </tex>:  
*: <tex> |v| = |w| - q \geqslant (p - q) + q - r = (p - q) + q - \gcd(p - q, q) </tex>.
+
*: <tex> |v| = |w| - q \geqslant (p + q - r) - q \geqslant (p - q) + q - r = (p - q) + q - \gcd(p - q, q) </tex>.
*: Тогда по предположению индукции получаем, что <tex> v </tex> также имеет период <tex> \gcd(p-q, q)</tex>. Поскольку <tex> \gcd(p-q, q) = \gcd(p, q) = r </tex>, можем сказать что <tex> v </tex> имеет период <tex> r </tex>.
+
*: Ещё заметим, что для периодов <tex> p - q,\ q </tex> будет меньшее <tex> n </tex>, нежели чем для <tex> p,\ q </tex>, поскольку <tex> \gcd(p-q, q) = \gcd(p, q) </tex>. А тогда по предположению индукции заключаем: <tex> v </tex> имеет период <tex> \gcd(p-q, q)</tex>. Учитывая <tex> \gcd(p-q, q) = \gcd(p, q) = r </tex>, можем сказать что <tex> v </tex> имеет период <tex> r </tex>.
*: Ещё заметим, что <tex> p - q \geqslant r </tex> (<tex> p > q </tex> и по свойствам НОД), поэтому <tex> |v| = |w| - q \geqslant (p + q - r) - q \geqslant q + (p - q) - r \geqslant q </tex>, тогда по '''лемме 2''' <tex> w </tex> имеет период <tex> r </tex>.
+
*: Как уже упоминалось, <tex> p - q \geqslant r </tex>, поэтому <tex> |v| \geqslant (p - q) + q - r \geqslant q </tex>, в следствие чего по '''лемме 2''' <tex> w </tex> имеет период <tex> r </tex>.
 
 
 
}}
 
}}
  
Строка 108: Строка 95:
 
<references/>
 
<references/>
  
== Литература ==
+
== Источники информации ==
 
* [[wikipedia:en:Substring | Wikipedia {{---}} Substring ]]
 
* [[wikipedia:en:Substring | Wikipedia {{---}} Substring ]]
* Lothaire M. Algebraic Combinatorics on Words Cambridge University Press, 2002. с. 272. ISBN 0-521-81220-8
+
* ''Lothaire M.'' Algebraic Combinatorics on Words {{---}} Cambridge University Press, 2002. {{---}} с. 272. {{---}} ISBN 0-521-81220-8
  
 
[[Категория:Алгоритмы и структуры данных]]
 
[[Категория:Алгоритмы и структуры данных]]
 
[[Категория:Основные определения. Простые комбинаторные свойства слов]]
 
[[Категория:Основные определения. Простые комбинаторные свойства слов]]

Текущая версия на 19:17, 4 сентября 2022

Связь периода и бордера

Теорема:
Если у строки длины [math]n[/math] есть бордер длины [math]k[/math], то у нее также имеется период длины [math]n - k[/math].
Доказательство:
[math]\triangleright[/math]

Пусть дана строка [math]\alpha[/math].

Напишем формально определение бордера длины [math]k[/math] строки [math]\alpha[/math]:

[math]\forall i = 1 \ldots k: \ \alpha [i] = \alpha[i + (n - k)][/math]

Сделаем замену [math]x = n - k[/math]:

[math]\forall i = 1 \ldots n - x: \ \alpha [i] = \alpha[i + x][/math]
Получили определение периода длины [math]x[/math]. Но [math]x = n - k[/math], значит у строки [math]\alpha[/math] есть период длины [math]n - k[/math].
[math]\triangleleft[/math]

Свойства периода

Теорема (о кратном периоде):
Если у строки есть период длины [math]k[/math], то у нее имеется также период длины [math]kx[/math], где [math] x \in N[/math].
Доказательство:
[math]\triangleright[/math]

Пусть длина строки равна [math]n[/math], сама строка — [math]\alpha[/math].

Доказательство будем вести индукцией по числу [math]x[/math].

  • База
    Для [math] x = 1 [/math] утверждение очевидно.
  • Переход
    Пусть верно для [math]x \leqslant m[/math]. Докажем то же для [math]x = m + 1[/math].
    Из определения периода имеем
    [math]\forall i = 1 \ldots n - k: \ \alpha [i] = \alpha[i + k][/math]
    а из предположения индукции
    [math]\forall i = 1 \ldots n - km: \ \alpha [i] = \alpha[i + mk][/math]
    С учётом этого получаем, что
    [math]\forall i = 1 \ldots n - km - k: \ \alpha [i] = \alpha [i + mk] = \alpha[i + mk + k][/math]
    следовательно
    [math]\forall i = 1 \ldots n - k(m + 1): \ \alpha [i] = \alpha[i + k(m + 1)][/math]
    Значит у строки есть период длины [math]k(m + 1)[/math].
Утверждение доказано.
[math]\triangleleft[/math]

Перед доказательством следующей теоремы проверим пару интуитивно понятных утверждений.

Лемма (1):
Пусть строка [math] s [/math] имеет периоды [math] p [/math] и [math] q [/math], причём [math] q \lt p \leqslant |s| [/math]. Тогда суффикс и префикс [math] s [/math] длины [math] |s| - q [/math] имеют период [math] p - q [/math].
Доказательство:
[math]\triangleright[/math]

Покажем истинность утверждения про префикс; с суффиксом доказательство аналогичное.

Требуется показать: [math] s_i = s_{i+p-q} \ \ (i = 1 \dots n-p\ , \ n=|s|) [/math]

Исходя из того, что [math] s [/math] имеет период [math] p [/math], выполнено [math] s_i = s_{i+p} [/math]

Также [math] s [/math] имеет период [math] q [/math] и из ограничений на [math] i [/math] верно [math] 1 \leqslant i + p - q \leqslant n - q [/math], поэтому [math] s_{i+p-q} = s_{i+p} [/math]
[math]\triangleleft[/math]
Лемма (2):
Пусть строка [math] w [/math] имеет период [math] q [/math], и существует [math] v [/math] подстрока [math] w [/math] такая, что [math] |v| \geqslant q [/math] и [math] v [/math] имеет период [math] r [/math], где [math] q [/math] [math]\,\vdots\, [/math] [math] r [/math]. Тогда [math] w [/math] имеет период [math] r [/math].
Доказательство:
[math]\triangleright[/math]

Пусть [math] w = s_1 \dots s_n,\ v = s_h \dots s_k [/math], где [math] 1 \leqslant h \lt k \leqslant n [/math].

Требуется показать: [math] s_i = s_j \ (j = i + r,\ 1 \leqslant i, j \leqslant n) [/math].

Зафиксируем [math] i [/math] и [math] j [/math]. Заметим, что поскольку [math] |v| \geqslant q [/math], отрезок [math] [h, k] [/math] содержит по меньшей мере [math] q [/math] целых чисел, так что найдутся [math] i',\ j' \in [h, k]: \ \ i \equiv i' \pmod q,\ j \equiv j' \pmod q,\ i \ne j [/math].

С учётом [math] q [/math] [math]\,\vdots\, [/math] [math] r [/math] можем написать [math] i \equiv i' \pmod r,\ j \equiv j' \pmod r [/math] [1].

Помимо того [math] i \equiv j \pmod r [/math], а в таком случае верно и [math] i' \equiv j' \pmod r [/math].

Теперь воспользуемся следующим фактом: если строка [math] s [/math] имеет период [math] r [/math], то [math] i \equiv j \pmod r \ \Rightarrow\ s_i = s_j [/math] (действительно, без ограничения общности можем сказать, что [math] i \leqslant j [/math], и исходя из этого выстроить цепочку равенств [math] s_i = s_{i + r},\ \ s_{i + r} = s_{i + 2r},\ \ \dots \ , \ s_{j - r} = s_j [/math]).

В виду того, что [math] w [/math] имеет период [math] q [/math], имеют место равенства [math] s_i = s_{i'}\ [/math] и [math]\ s_j = s_{j'} [/math]. Кроме того [math] v [/math] имеет период [math] r [/math], потому верно [math] s_{i'} = s_{j'} [/math]. Тогда и [math] s_i = s_j [/math].
[math]\triangleleft[/math]


Теорема (Фин и Вильф):
Если у строки [math]w[/math] есть периоды [math]p[/math] и [math]q[/math], где [math] |w| \geqslant p + q - \gcd(p, q) [/math], то [math]\gcd(p, q)[/math] также является периодом этой строки.
Доказательство:
[math]\triangleright[/math]

Обозначим [math] r = \gcd(p, q) [/math]. Доказательство будем вести индукцией по [math] n = (p + q) / r [/math].

В случае [math] p = q [/math] видим что [math] n = 2 [/math], что соответствует базе, в то время как при [math] p \ne q [/math] выполнено [math] \max(p, q) \gt \gcd(p, q) [/math], так что [math] n \gt 2 [/math].

  • База
    Истинность утверждения следует из [math] p = q = r [/math].
  • Переход
    В силу того, что [math] p \ne q [/math], без ограничения общности будем считать [math] q \lt p [/math] (вообще говоря, исходя из свойств НОД можно дать более строгую оценку: [math] p - q \geqslant r [/math], чем мы позже воспользуемся).
    Пусть [math] w = uv [/math], где [math] |u| = q [/math].
    По лемме 1 [math] v [/math] имеет период [math] p - q [/math], также [math] v [/math] имеет период [math] q [/math] как подстрока [math] w [/math]. Теперь рассмотрим длину [math] v [/math]:
    [math] |v| = |w| - q \geqslant (p + q - r) - q \geqslant (p - q) + q - r = (p - q) + q - \gcd(p - q, q) [/math].
    Ещё заметим, что для периодов [math] p - q,\ q [/math] будет меньшее [math] n [/math], нежели чем для [math] p,\ q [/math], поскольку [math] \gcd(p-q, q) = \gcd(p, q) [/math]. А тогда по предположению индукции заключаем: [math] v [/math] имеет период [math] \gcd(p-q, q)[/math]. Учитывая [math] \gcd(p-q, q) = \gcd(p, q) = r [/math], можем сказать что [math] v [/math] имеет период [math] r [/math].
    Как уже упоминалось, [math] p - q \geqslant r [/math], поэтому [math] |v| \geqslant (p - q) + q - r \geqslant q [/math], в следствие чего по лемме 2 [math] w [/math] имеет период [math] r [/math].
[math]\triangleleft[/math]

См. также

Примечания

Источники информации

  • Wikipedia — Substring
  • Lothaire M. Algebraic Combinatorics on Words — Cambridge University Press, 2002. — с. 272. — ISBN 0-521-81220-8