Теорема Парика

Версия 18:44, 30 декабря 2016

Содержание

1 Линейные множества
2 Теорема Парика
3 Примеры
4 См. также
5 Примечания
6 Источники информации

Линейные множества

В этом разделе предполагается, что зафиксирован некоторый линейный порядок на алфавите [math]\Sigma[/math]. Пусть .

Определение:

Через будем обозначать функцию , определённую следующим образом: , где — число появлений символа в слове . Аналогично, каждому языку ставится в соответствие множество , определённое так: . Функция называется отображением Парика (англ. Parikh's mapping) соответственно слова и языка.

Пусть [math]\Sigma = \{a, b\}[/math] и [math]L = \{a, abb, bba\}[/math]. Тогда .

Определение:

Пусть при — вектора в множестве . Множество называется линейным (англ. linear) подмножеством множества .

Говоря проще, линейное подмножество [math]\mathbb {N}^{m}[/math] может быть построено с помощью любого m-размерного вектора [math]x_{0}[/math] добавлением к нему произвольного числа m-размерных векторов из конечного множества, например, 1 раз [math]x_{1}[/math] и 0 раз остальные вектора, 1 раз [math]x_{1}[/math], 1 раз [math]x_{2}[/math] и 0 раз остальные, и так далее.
Множество является линейным.

Определение:

Подмножество множества называется полулинейным (англ. semilinear), если оно является объединением конечного числа линейных множеств.

Полулинейное множество имеет следующие свойства:

Любое конечное подмножество [math]\mathbb {N}^{m}[/math] — полулинейно.
Полулинейные множества замкнуты относительно операции объединения, пересечения, разности и проекции.
Полулинейные множества по теореме Гинзбурга-Спаниера (англ. Ginsburg and Spanier theorem) — те, которые определяемы в арифметике Пресбургера (англ. Presburger arithmetic)^[1].

Пусть , , [math]L_{1}[/math] и [math]L_{2}[/math] линейные подмножества [math]\mathbb {N}^{2}[/math], а [math]L = L_{1} \cup L_{2}[/math] является полулинейным подмножеством [math]\mathbb {N}^{2}[/math].

Пусть — контекстно-свободная грамматика.

Далее маленькими латинскими буквами [math]s, t, \ldots[/math] будем обозначать деревья разбора. Для деревьев результатом ([math]res(s)[/math]) будем называть строку из нетерминалов и терминалов, записанных в листьях, упорядоченную слева направо, глубина дерева ([math]dep(s)[/math]) — длина наибольшего пути от листов до корня дерева, будем писать [math]N(s)[/math], чтобы обозначить множество нетерминалов в дереве, а [math]root(s)[/math] — корень дерева.

Обозначим за [math]p[/math] деревья такого вида:

оно содержит хотя бы два узла.
[math]res(p) = u * root(p) * v[/math], где [math]u, v \in \Sigma^{*}[/math], то есть все листья помечены терминалами, за исключением одного, который совпадает с корнем дерева.

Будем обозначать [math]s \# t[/math] если [math]t[/math] может быть получен из [math]s[/math] вставкой дерева [math]p[/math] с нетерминалом [math]A[/math] в качестве корня на место нетерминала [math]A[/math] в дереве [math]s[/math], то есть, можно увеличить [math]s[/math] с помощью некоторого дерева [math]p[/math] так, чтобы получить [math]t[/math]. В [math]s[/math] строго меньше узлов, чем в [math]t[/math].

Пусть [math]p[/math] называется базовым, если оно [math]\#[/math]-минимально среди всех [math]p[/math], то есть не содержит в себе другое [math]p[/math], которое можно вырезать. Или, иначе, [math]p[/math] является базовым, если в [math]s \# t[/math] [math]s[/math] является только тривиальным деревом с одним узлом (который же является и корнем).

Лемма:

Если является базовым, то , где количество нетерминалов в N.

Доказательство:

Обозначим за [math]\gamma[/math] путь от листа с нетерминалом [math]root(p)[/math] до корня. Пусть [math]\gamma[/math] не может быть длиннее, чем [math]n[/math], потому что если бы был, то он содержал бы повторяющийся нетерминал, и, тем самым, содержал бы в себе другое дерево [math]p'[/math], что противоречит тому, что [math]p[/math] базовое.

Для других же листов путь должен не превышать по тем же причинам. Таким образом, длина любого пути не больше .

Из леммы и из конечности нетерминалов и продукций в грамматике [math]\Gamma[/math] следует, что количество таких базовых деревьев [math]p[/math] конечно.

Лемма:

Любое дерево разбора с либо -минимально, либо содержит в себе базовое .

Доказательство:

Пусть не -минимально, тогда оно по определению содержит дерево . Пусть будет -минимально среди всех , содержащихся в , тогда является базовым, так как если нет, то оно содержит в себе другое , что противоречит -минимальности.

Пусть [math]s \leqslant t[/math] если [math]t[/math] может быть получен из [math]s[/math] конечной последовательностью вставок базовых [math]p[/math], для которых [math]N(p) \subset N(s)[/math]. Другими словами, нам позволено выбирать любой нетерминал A в дереве и вставлять на это место базовое [math]p[/math] с корнем А в том случае, если [math]p[/math] содержит только те нетерминалы, что есть в [math]s[/math]. Если с помощью таких операций можно получить [math]t[/math], то [math]s \leqslant t[/math].

Если строка , то за [math]\Psi_{\Sigma}(\alpha)[/math] будем обозначать [math]\Psi_{\Sigma}(x)[/math], где [math]x[/math] получен из [math]\alpha[/math] удалением всех нетерминалов. За [math]\Psi_{\Sigma}(t)[/math] будем обозначать [math]\Psi_{\Sigma}(res(t))[/math].

Лемма:

Множество линейно.

Доказательство:

является базовым, и его .

Будем называть [math]s[/math] [math]\leqslant[/math]-минимальным, если оно не содержит в себе повторяющихся базовых [math]p[/math].

Лемма:

Если -минимально, то его , где — размер , а — число различных базовых в дереве.

Доказательство:

Если путь длиннее, чем , то тогда он может быть поделен на сегмент, каждый из которых длины как минимум , и каждый имеет повторяющийся нетерминал, а, следовательно, содержит непересекающееся поддерево (деревья называются непересекающимися в данном случае, если у них нет общих узлов, или если корень одного является листом другого дерева), каждое из которых, в соответствие с леммой, либо само является базовым, либо содержит базовое в себе, следовательно, в дереве содержится непересекающихся базовых . Но так как число различных базовых равно , какое-то появляется в этом наборе дважды, что противоречит -минимальности.

Теорема (Парика, англ. Parikh's theorem):

Если язык является контекстно-свободным, то множество является полулинейным.

Доказательство:

Воспользуемся ранее полученными результатами в доказательстве.

Зададим [math]M = \{s \mid s[/math] [math]\leqslant[/math]-минимально, .

Покажем, что . Это множество полулинейно по предпоследней и последней лемме ([math]M[/math] по ней конечно, так как число базовых [math]p[/math] конечно).

Любое такое , что для некоторого имеет корень , и его , значит , и значит . В обратную сторону, любая строка имеет дерево разбора с корнем и , и должно существовать -минимальное (в противном бы случае это означало, что не содержит базовых , и значит оно само является -минимальным), и тогда .

Теорема Парика связывает два понятия: функцию [math]\Psi_{\Sigma}[/math] контекстно-свободного языка и полулинейное множество. Например, для языка функция .
Эта теорема, так же, как и лемма о накачке и лемма Огдена, не является достаточной: язык не является контекстно-свободным, однако его множество является полулинейным: .

Примеры

Язык [math]\{a^{p} \mid p[/math] — простое число[math]\}[/math] не является контекстно-свободным, так как множество простых чисел не является полулинейным (в арифметике Пресбургера нельзя определить множество простых чисел).

Язык [math]\{a^{m}b^{n} \mid m \gt n[/math] или [math]m[/math] — простое и [math]m \leqslant n\}[/math] не является контекстно свободным, так как множество, порождаемое функцией [math]\Psi_{\Sigma}[/math], не является полулинейным: множество таких пар — линейно, множество таких пар — линейно, при этом множество простых чисел не является полулинейным, и, как следствие, множество [math]\{m[/math] — простое и [math]m \leqslant n\}[/math] не является полулинейным, [math]\Psi_{\Sigma}[/math] так же не полулинейно.

См. также

Примечания

↑ Wikipedia — Presburger arithmetic

Источники информации

Гинзбург С. — Математическая теория контекстно-свободных языков
Dexter C. Kozen — Automata and Computability
Stack Exchange — How to prove that a language is not context-free?

[1] Wikipedia — Presburger arithmetic

[1]

@@ Строка 89: / Строка 89: @@
 Покажем, что  <tex>\Psi_{\Sigma}(L(\Gamma)) = \bigcup \limits_{s \in M} \{\Psi_{\Sigma}(t) \mid s \leqslant t\}</tex>. Это множество полулинейно по предпоследней и последней лемме (<tex>M</tex> по ней конечно, так как число базовых <tex>p</tex> конечно).
-Любое такое <tex>t</tex>, что <tex>s \leqslant t</tex>  для некоторого <tex>s \in M</tex> имеет корень <tex>root(t) = S</tex>, и его <tex>res(t) \in \Sigma^{*}</tex>, значит <tex>t \in L(\Gamma)</tex>, и значит <tex>\Psi_{\Sigma}(t) \in \Psi_{\Sigma}(L(\Gamma))</tex>. В обратную сторону, любая строка <tex>x \in L(\Gamma)</tex> имеет дерево разбора <tex>t</tex> с корнем <tex>root(t) = S</tex> и <tex>res(t) = x</tex>, и должно существовать <tex>leqslant</tex>-минимальное <tex>s \leqslant t</tex> (в противном бы случае это означало, что <tex>t</tex> не содержит базовых <tex>p</tex>, и значит оно само является <tex>\leqslant</tex>-минимальным), и тогда <tex>\Psi_{\Sigma}(x) \in \{\Psi_{\Sigma}(t) \mid s \leqslant t\}</tex>.
+Любое такое <tex>t</tex>, что <tex>s \leqslant t</tex>  для некоторого <tex>s \in M</tex> имеет корень <tex>root(t) = S</tex>, и его <tex>res(t) \in \Sigma^{*}</tex>, значит <tex>t \in L(\Gamma)</tex>, и значит <tex>\Psi_{\Sigma}(t) \in \Psi_{\Sigma}(L(\Gamma))</tex>. В обратную сторону, любая строка <tex>x \in L(\Gamma)</tex> имеет дерево разбора <tex>t</tex> с корнем <tex>root(t) = S</tex> и <tex>res(t) = x</tex>, и должно существовать <tex>\leqslant</tex>-минимальное <tex>s \leqslant t</tex> (в противном бы случае это означало, что <tex>t</tex> не содержит базовых <tex>p</tex>, и значит оно само является <tex>\leqslant</tex>-минимальным), и тогда <tex>\Psi_{\Sigma}(x) \in \{\Psi_{\Sigma}(t) \mid s \leqslant t\}</tex>.
 }}

Теорема Парика — различия между версиями

Версия 18:44, 30 декабря 2016

Содержание

Линейные множества