Изменения

Перейти к: навигация, поиск

Существенно неоднозначные языки

2896 байт добавлено, 19:38, 4 сентября 2022
м
rollbackEdits.php mass rollback
== Неоднозначные грамматики ==
{{Определение|id=defambigous|definition ='''Неоднозначной грамматикой ''' (англ. ''ambiguous grammar'') называется грамматика, по в которой можно вывести некоторое слово более чем одним способом (то есть для одной цепочки существует строки есть более одного [[Контекстно-свободные грамматики, вывод, лево- и правосторонний вывод, дерево разбора|дерева разбора]]).}}
===Пример:===
Рассмотрим грамматику <tex>E \rightarrow E + E | E * E| N</tex> и выводимую цепочкувыводимое слово <tex>E N + E N * EN</tex>. Ее Его можно вывести двумя способами:
<tex>E \Rightarrow E + E \Rightarrow E + E * E\Rightarrow N + N * N</tex>
<tex>E \Rightarrow E * E \Rightarrow E + E * E\Rightarrow N + N * N</tex>
Эта граматика грамматика неоднозначна. В данном случае мы нашли пример слова из языка (который задается грамматикой), которое имеет более одного вывода, и показали, что грамматика является существенно неоднозначной. Однако в общем случае проверка грамматики на неоднозначность является [[Примеры неразрешимых задач: однозначность грамматики|алгоритмически неразрешимой задачей]].
== Существенно неоднозначные языки ==
Язык называется существенно неоднозначным, если любая его грамматика неоднозначна.
Пример такого языка: <tex>0^a 1^b 2^c</tex>, где <tex>a=b \vee b=c</tex>
Докажем, что <tex>\forall \Gamma \exists k: 0^k 1^k 2^k</tex> имеет хотя бы 2 дерева разбора.
Лемма:{{Определение|definition =<tex>\forall \Gamma : \exists k \ge 1: z \in LЯзык называется '''существенно неоднозначным''' (\Gammaангл. ''inherently ambiguous language''), |z| \ge k</tex> и в z выбраны хотябы k позицийесли любая грамматика, порождающая его, то z представимо в виде является неоднозначной.}}===Пример:=== Язык <tex>z = uvwxy0^a 1^b 2^c</tex>, где либо <tex>uvwa=b</tex> или , либо <tex>wxyb=c</tex> содержат хотя бы по одной выбранной позиции и <tex>vwx</tex> содержит не более k выбраных позиций и <tex>\exists A</tex> - нетерминал, такой, что <tex>\forall i: S \Rightarrow^* uAy \Rightarrow^* uvAxy \Rightarrow^* uv^i Ax^i y \Rightarrow^* uv^i wx^i y</tex>является существенно неоднозначным.
ДоказательствоДокажем, что для любой грамматики <tex>\Gamma</tex> <tex>\exists n:0^n 1^n 2^n</tex> имеет хотя бы <tex>2</tex> дерева разбора в грамматике <tex>\Gamma</tex>. Пусть в грамматике m нетерминалов, длина всех правых частей не превосходит l, значит высота дерева разбора хотя бы 2mВозьмем <tex>k</tex> и рассмотрим слово <tex>0^k 1^k 2^{k+1k!}</tex>.
Выбираем Пометим первые <tex>k=l</tex> нулей, по [[Лемма Огдена|лемме Огдена]] данное слово можно разбить на <tex>5</tex> частей: <tex>0^k1^k2^{2mk+3k!}=uvxyz</tex>.
Вершина ветвитсяПонятно, если хотя бы 2 ребенкачто <tex>v</tex> состоит полностью из нулей, а <tex>y</tex> состоит полностью из единиц, а также длины <tex>v</tex> и <tex>y</tex> равны, так как иначе при накачке мы можем получить слово, не принадлежащее языку.
Если Пусть <tex>|v|=|y|=t</tex>, тогда возьмём слово <tex>q=uv^{k! / t + 1}xy^{k! / t + 1}z</tex>. По лемме Огдена слово <tex>q</tex> принадлежит языку, а также существует нетерминал <tex>A</tex> такой, что с помощью него можно породить слово <tex>q</tex>, то есть сын с помечеными детьми в поддереве - идем в негограмматике можно вывести <tex>uAz</tex>, и из <tex>A</tex> можно вывести <tex>vAy</tex> и <tex>x</tex>. (Заметим, что <tex>q = 0^{k! + k}1^{k! + k}2^{k! + k}</tex>, ветвится - идем где большето есть <tex>n = k! + k</tex>.)
Вершина ветвится влево, если слева от него есть помеченные листья. Так же определяеся ветвление вправо[[Файл:TreeA.png]]
Одного из этих типов хотя бы mТеперь рассмотрим слово <tex>0^{k+k!} 1^k 2^k</tex>, в котором отмечены все двойки. Аналогичными рассуждениями мы получаем, что слово <tex>q</tex> принадлежит языку, а также существует нетерминал <tex>B</tex> такой, что с помощью него можно породить слово <tex>q</tex>, где <tex>|v|=|y|=p</tex>.
Пусть m+2 ветвится влево. Рассмотрим нижние m+1 - среди них встретится повторяющийся нетерминал A. Для него уже выполнено условие леммы. В частности uvw - помечены. Из всех прочих выбираем один, в средней части не более k помеченных[[Файл:TreeB.png]]
Лемма доказанаЗаметим, что поддеревья, соответствующие <tex>A</tex> и <tex>B</tex> {{---}} разные деревья и одно не является потомком другого, иначе или в поддереве <tex>A</tex> были бы двойки, или в поддереве <tex>B</tex> были бы нули {{---}} что не является правдой.
Неоднозначность:
Возьмем kПусть в этих двух случаях дерево разбора было одно и тоже, тогда с помощью <tex>A</tex> и <tex>B</tex> можно породить слово вида <tex>0^{k+k !+t} 1^{k +k!+t+p} 2^{k+k!+p}</tex>, пометим первые k нулейкоторое не принадлежит языку.
По лемме можно разбить на 5 частейВ результате мы имеем два [[Контекстно-свободные грамматики, вывод, лево- и правосторонний вывод, дерево разбора|дерева разбора]] для одного слова. Значит, язык существенно неоднозначен.
== См. также ==* [[Лемма_Огдена|Лемма Огдена]]* [[Лемма_о_разрастании_для_КС-грамматик|Лемма о разрастании для КС-грамматик]]* [Файл:uvwxy.png[Теорема_Парика|Теорема Парика]]
== Источники информации ==*[http://ru.wikipedia.org/wiki/Алгоритмически_неразрешимая_задача Википедия {{---}} Алгоритмически неразрешимая задача]*[Файлhttp:tree//en.png]wikipedia.org/wiki/Ambiguous_grammar Wikipedia {{---}} Ambiguous grammar]
{{Теорема[[Категория: Теория формальных языков]]|statement=[[Категория: Контекстно-свободные грамматики]]Для [[Категория: Опровержение контекстно-свободности языка принимаемого ДМП-автоматом существует однозначная КС-грамматика}}]]
1632
правки

Навигация