Существенно неоднозначные языки

Материал из Викиконспекты
Версия от 01:49, 27 ноября 2011; 192.168.0.2 (обсуждение) (Неоднозначные грамматики)
Перейти к: навигация, поиск

Неоднозначные грамматики

Определение:
Неоднозначной грамматикой называется грамматика, в которой можно вывести некоторое слово более чем одним способом (то есть для строки есть более одного дерева разбора).


Пример:

Рассмотрим грамматику [math]E \rightarrow E + E | E * E[/math] и выводимое слово [math]E + E * E[/math]. Его можно вывести двумя способами:

[math]E \Rightarrow E + E \Rightarrow E + E * E[/math]

[math]E \Rightarrow E * E \Rightarrow E + E * E[/math]

Эта грамматика неоднозначна.

Существенно неоднозначные языки

Язык называется существенно неоднозначным, если он может быть порождён только неоднозначными грамматиками.

Пример такого языка: [math]0^a 1^b 2^c[/math], где либо [math]a=b[/math], либо [math]b=c[/math]

Докажем, что для любой грамматики [math]\Gamma[/math] [math]\exists k: 0^k 1^k 2^k[/math] имеет хотя бы 2 дерева разбора в грамматике [math]\Gamma[/math].

Возьмем [math]k[/math] и рассмотрим слово [math]0^k 1^k 2^{k+k!}[/math].

Пометим первые [math]k[/math] нулей, по лемме Огдена данное слово можно разбить на 5 частей: [math]0^k1^k2^{k+k!}=uvxyz[/math].

Понятно, что [math]v[/math] состоит полностью из нулей, а [math]y[/math] состоит полностью из единиц, а также длины [math]v[/math] и [math]y[/math] равны, так как иначе при накачке мы можем получить слово, не принадлежащее языку.

Пусть [math]|v|=|y|=t[/math], тогда возьмём слово [math]q=uv^{\frac{n!}{t} + 1}xy^{\frac{n!}{t} + 1}z[/math]. По лемме Огдена слово [math]q[/math] принадлежит языку, а также существует нетерминал [math]A[/math] такой, что с помощью него можно породить слово [math]q[/math].

TreeA.png

Теперь рассмотрим слово [math]0^{k+k!} 1^k 2^k[/math], в котором отмечены все двойки. Аналогичными рассуждениями мы получаем, что слово [math]q[/math] принадлежит языку, а также существует нетерминал [math]B[/math] такой, что с помощью него можно породить слово [math]q[/math].

TreeB.png

Очевидно, что поддеревья, соответствующие [math]A[/math] и [math]B[/math] — разные деревья и одно не является потомком другого.


Пусть в этих двух случай дерево разбора было одно и тоже, то это дерево порождает слово вида [math]0^{k+k!+t} 1^{k+k!+t+p} 2^{k+k!+p}[/math], которое не принадлежит языку.

В результате мы имеем 2 дерева разбора для одного слова. Значит, язык существенно не однозначен.