Теорема Парика

Содержание

1 Используемые определения
2 Теорема Парика
3 Примеры
4 См. также
5 Источники

Используемые определения

В этом разделе предполагается, что зафиксирован некоторый линейный порядок на алфавите [math]\Sigma[/math]. Пусть .

Определение:

Через будем обозначать функцию , определённую следующим образом: , где — количество появлений символа в слове . Аналогично, каждому языку ставится в соответствие множество , определённое так: .

Пусть [math]\Sigma = \{a, b\}[/math] и [math]L = \{a, abb, bba\}[/math]. Тогда .

Определение:

Пусть при — вектора в множестве . Множество называется линейным (англ. linear) подмножеством множества .

Говоря проще, линейное подмножество [math]\mathbb {N}^{m}[/math] может быть построено с помощью любого m-размерного вектора [math]x_{0}[/math] добавлением к нему произвольного числа m-размерных векторов из конечного множества, например, 1 раз [math]x_{1}[/math] и 0 раз остальные вектора, 1 раз [math]x_{1}[/math], 1 раз [math]x_{2}[/math] и 0 раз остальные, и так далее.
Множество является линейным.

Определение:

Подмножество множества называется полулинейным (англ. semilinear), если оно является объединением конечного числа линейных множеств.

Любое конечное подмножество [math]\mathbb {N}^{m}[/math] — полулинейно.
Полулинейные множества замкнуты относительно операции объединения, пересечения, разности и проекции.
Полулинейные множества по теореме Гинзбурга-Спаниера (англ. Ginsburg and Spanier theorem) — те, которые определяемы в арифметика Пресбургера (англ. Presburger arithmetic).

Пусть , , [math]L_{1}[/math] и [math]L_{2}[/math] линейные подмножества [math]\mathbb {N}^{2}[/math], а [math]L = L_{1} \cup L_{2}[/math] является полулинейным подмножеством [math]\mathbb {N}^{2}[/math].

Теорема Парика

Теорема (Парика, англ. Parikh's theorem):

Если язык является контекстно-свободным, то множество является полулинейным.

Доказательство:

Пусть — контекстно-свободная грамматика. Вместо того, чтобы рассматривать [math]L(\Gamma)[/math], рассмотрим язык [math]L^{\sim}(\Gamma)[/math], содержащий только строки, порожденные выводами, в которых встречаются все нетерминалы грамматики. Так как теорема Парика говорит о том, что для [math]L(\Gamma)[/math] множество [math]\Psi_{\Sigma}(L)[/math] полулинейно, то же самое должно сохраняться и для [math]L^{\sim}(\Gamma)[/math].

Лемма:

Если множество полулинейно для всех контекстно-свободных языков, тогда множество также полулинейно.

Доказательство:

Построим грамматики для какого-то путем удаления из грамматики нетерминалов. Тогда . Так как для каждого из языков множество полулинейно, то, по свойствам полулинейных множеств, для также полулинейно.

Стоит заметить, что число таких языков в лемме ограничено числом нетерминалов в грамматике: [math]k = 2^{|N|} - 1[/math]. Вычитание происходит из-за того, что начальный нетерминал [math]S[/math] не должен быть удален.

Теперь определим три множества деревьев разбора.

Определение:

Пусть — множество всех терминальных деревьев разбора с корнем , которые удовлетворяют двум условиям:

1. Каждый нетерминал [math]N[/math] встречается в в дереве.

2. Каждый нетерминал встречается не более чем раз в дереве.

Деревья из этого множества соотносятся с деревьями разбора языка [math]L^{\sim}(\Gamma)[/math], так как при выводе каждого слова из этого языка также используются все нетерминалы грамматики.

В отличие от предыдущего определения, для следующего множества число [math]k[/math] для любого нетерминала не ограничено.

Определение:

Пусть — множество всех терминальных деревьев разбора с корнем , которые удовлетворяют первому условию из предыдущего определения.

Последнее множество относится к тем правилам грамматики, которые делают строку больше в процессе вывода, то есть [math]A \Rightarrow uAv[/math], где [math]u, v \in \Sigma[/math]. Эти деревья могут быть использованы, чтобы увеличить дерево разбора в множестве [math]T'[/math] замещением нетерминала [math]A[/math] в некотором дереве [math]t'[/math] на дерево из множества [math]I[/math], определение которого написано ниже.

Определение:

Пусть — множество всех деревьев разбора с корнем , содержащих только один нетерминальный лист, который также помечен как .

В дополнение, деревья разбора множества [math]I[/math] должны удовлетворять условию 2 в определении [math]T[/math]. Еще можно заметить, что деревья из [math]T[/math] и [math]I[/math] имеют конечную высоту.

Теперь перейдем к доказательству теоремы.
Пусть [math]w_{1},...,w_{q}[/math] при [math]q \in \mathbb {N}^{+}[/math] будут множеством строк, порожденных деревьями из [math]T[/math], и множество [math]W[/math] — набором всех строк [math]uv[/math], для которых [math]uAv[/math] будет результатом, полученным с помощью дерева разбора из [math]I[/math] с вершиной [math]A \in N[/math]. Элементы множества [math]W[/math] представляют возможные поддеревья, которые могут быть использованы для того, чтобы увеличить длину пути в некотором дереве.

Лемма:

Для языка выполняется равенство

Доказательство:

Можем заметить, пустая строка может быть удалена из множества [math]W[/math], так как она не влияет на суммирование. Обозначим объединение сумм в лемме как [math]\Phi[/math].

Доказывать лемму будем в две стадии по индукции.

[math]\Longrightarrow[/math] .

.

Теорема Парика связывает два понятия: функцию [math]\Psi_{\Sigma}[/math] контекстно-свободного языка и полулинейное множество. Например, для языка функция .
Эта теорема, так же, как и лемма о накачке и лемма Огдена, не является достаточной: язык не является контекстно-свободным, однако его множество является полулинейным: .

Примеры

Язык [math]\{a^{p} \mid p[/math] — простое число[math]\}[/math] не является контекстно-свободным, так как множество простых чисел не является полулинейным (в арифметике Пресбургера нельзя определить множество простых чисел).

Язык [math]\{a^{m}b^{n} \mid m \gt n[/math] или [math]m[/math] — простое и [math]m \leq n\}[/math] не является контекстно свободным, так как множество, порождаемое функцией [math]\Psi_{\Sigma}[/math], не является полулинейным: множество таких пар — линейно, множество таких пар — линейно, при этом множество простых чисел не является полулинейным, и, как следствие, множество [math]\{m[/math] — простое и [math]m \leq n\}[/math] не является полулинейным, [math]\Psi_{\Sigma}[/math] так же не полулинейно.

См. также

Лемма о разрастании для КС-грамматик

Источники

Гинзбург С. — Математическая теория контекстно-свободных языков
Håkan Lindqvist — Parikh’s theorem

Теорема Парика

Содержание

Используемые определения

Теорема Парика

Примеры

См. также

Источники

Навигация

Персональные инструменты

Пространства имён

Варианты

Просмотры

Ещё

Поиск

Навигация

Инструменты