Автокорреляционный многочлен

Определение:

Автокорреляционный многочлен (англ. autocorrelation polynomial) для строки длины — это многочлен вида , причем , если префикс строки длины совпадает с суффиксом строки длины , иначе :

Пример построения автокорреляционного многочлена

Пусть имеем алфавит [math]\Sigma = \{0, 1\}[/math], рассмотрим строку [math]p=001100[/math]. Будем проверять факт совпадения суффикса и префикса строки [math]p[/math], используя следующую таблицу:

0	0	1	1	0	0						c₀ = 1
0	0	1	1	0	0						c₀ = 1

0	0	1	1	0	0						c₁ = 0
	0	0	1	1	0	0					c₁ = 0

0	0	1	1	0	0						c₂ = 0
		0	0	1	1	0	0				c₂ = 0

0	0	1	1	0	0						c₃ = 0
			0	0	1	1	0	0			c₃ = 0

0	0	1	1	0	0						c₄ = 1
				0	0	1	1	0	0		c₄ = 1

0	0	1	1	0	0						c₅ = 1
					0	0	1	1	0	0	c₅ = 1

В итоге автокорреляционный многочлен строки [math]p=001100[/math] равен [math]C(z) = 1 + z^4 + z^5[/math].

Несложно заметить, что [math]c_0[/math] всегда равняется [math]1[/math], ибо префикс и суффикс длины [math]k[/math] являются исходной строкой и, следовательно, всегда совпадают. [math]c_{k-1}[/math] равняется [math]1[/math] только в том случае, если первый и последний символы строки совпадают.

Примеры решений задач с использованием автокорреляционного многочлена

Задача:

Пусть — данный алфавит, — данная непустая строка над алфавитом . Найти производящую функцию множества слов, не содержащих как подстроку.

Пусть [math]|\Sigma| = m[/math] — мощность алфавита [math]\Sigma[/math], [math]S[/math] — множество слов, не содержащих [math]p[/math] как подстроку, [math]\alpha \in S[/math] — произвольное слово из [math]S[/math], [math]T[/math] — множество слов, содержащих [math]p[/math] как подстроку только в самом конце. Рассмотрим все слова вида , где — все символы алфавита [math]\Sigma[/math]. Так как слово [math]\alpha[/math] не содержало подстроку [math]p[/math], то после добавления символа [math]\sigma_i[/math] новая строка либо так же не содержит [math]p[/math] как подстроку, и, следовательно, [math]\alpha\sigma_i \in S[/math], либо содержит, но только в самом конце, и тогда [math]\alpha\sigma_i \in T[/math]. Очевидно также, что от удаления последнего символа у слова из [math]T[/math] всегда получается слово из [math]S[/math], то есть, путём добавления ко всем [math]\alpha \in S[/math] символа мы получим все непустые слова из [math]T[/math] и [math]S[/math]. В контексте комбинаторных объектов это выражается в равенстве , где [math]\epsilon [/math] — комбинаторный объект веса 0, соответствующий пустой строке.

Рассмотрим теперь слова вида [math]\alpha p[/math]. После добавления к слову [math]\alpha[/math] строки [math]p[/math] мы точно получим все строки из [math]T[/math], но, кроме них, могут также получиться строки, имеющие первое вхождение [math]p[/math] не в самом конце, следовательно, нельзя утверждать, что [math]\alpha p[/math] всегда принадлежит [math]T[/math]. Несложно заметить, что [math] \alpha p \notin T [/math] тогда и только тогда, когда [math] \alpha p [/math] имеет 2 перекрывающихся вхождения строки [math]p[/math]. Для того чтобы [math] \alpha p [/math] имело 2 перекрывающихся вхождения строки [math]p[/math] необходимо, чтобы [math]p[/math] имела какой-нибудь суффикс, совпадающий с каким-нибудь префиксом, иначе говоря, чтобы [math]p[/math] имело автокорреляционный многочлен [math]C(z) \ne 1[/math]. В результате выходит, что при добавлении ко всем [math]\alpha \in S[/math] строки [math]p[/math] получим все строки из [math]T[/math], а также все строки, имеющие 2 перекрывающиеся вхождения строки [math]p[/math], иными словами, все строки вида (или, что то же, ), где [math]\gamma[/math] — некоторый префикс [math]\alpha[/math], [math]i \in \overline{1, k-1}[/math], — номер некоторого ненулевого коэффициента автокорреляционного многочлена [math]C(z)[/math] строки [math]p[/math]. Нетрудно заметить, что можно представить как некую строку [math]t \in T[/math] с приписанным в конец суффиксом строки [math]p[/math] длины [math]i[/math]. В контексте комбинаторных объектов суффикс строки [math]p[/math] длины [math]i[/math] является комбинаторным объектом веса [math]i[/math], а его производящей функцией является [math]z^i[/math], то есть, по сути, это слагаемое автокорреляционного многочлена [math]C(z)[/math]. Тогда получаем следующее равенство: , где [math]C[/math] — комбинаторный класс, соответствующий автокорреляционному многочлену [math]C(z)[/math].

В результате имеем 2 уравнения:

В терминах производящих функций эти уравнения выглядят так:

Решим полученную систему относительно [math]S(z)[/math]:

В итоге получаем искомую производящую функцию множества [math]S[/math] слов, не содержащих данную непустую [math]p[/math] как подстроку:

, где — автокорреляционный многочлен , , .

Задача:

Пусть — данный алфавит, — данная непустая строка над алфавитом . Найти производящую функцию множества слов, содержащих как подстроку.

Пусть [math]m[/math] — мощность данного алфавита [math]\Sigma[/math]. Ясно, что слов длины [math]n[/math] над алфавитом мощности [math]m[/math] будет [math]m^n[/math] штук. Тогда производящей функцией множества всех слов над алфавитом мощности [math]m[/math] будет [math]\dfrac{1}{1-mz}[/math]. Вычтя из нее полученную ранее производящую функцию множества слов, не содержащих [math]p[/math] как подстроку, получим искомую производящую функцию: , где [math]C(z)[/math] — автокорреляционный многочлен [math]p[/math], [math]k = |p|[/math].

Задача:

Пусть — данный алфавит, — данная непустая строка над алфавитом . Найти производящую функцию множества слов, имеющих единственное вхождение как подстроки в самом конце.

Пусть [math]T[/math] — множество слов, содержащих [math]p[/math] как подстроку только в самом конце. Вернемся к системе уравнений, полученной при решении первой задачи, и воспользуемся найденным выражением [math]S(z)[/math]:

В результате получаем искомую производящую функцию [math]T(z)[/math]:

, где — автокорреляционный многочлен , , .

См. также

Источники информации

Васильев А. Т. Лекции по дискретной математике // Связь ПФ с регулярными языками, автокорреляция и пентагональная теорема Эйлера, 2020. URL: https://youtu.be/EmhScUQwXT0?t=2034.
Wikipedia — Autocorrelation (words)

Автокорреляционный многочлен

Пример построения автокорреляционного многочлена

Примеры решений задач с использованием автокорреляционного многочлена

См. также

Источники информации

Навигация

Персональные инструменты

Пространства имён

Варианты

Просмотры

Ещё

Поиск

Навигация

Инструменты