Существенно неоднозначные языки — различия между версиями

Материал из Викиконспекты
Перейти к: навигация, поиск
(Пример:)
м (rollbackEdits.php mass rollback)
 
(не показано 9 промежуточных версий 4 участников)
Строка 1: Строка 1:
 
== Неоднозначные грамматики ==
 
== Неоднозначные грамматики ==
 
{{Определение
 
{{Определение
 +
|id=defambigous
 
|definition =
 
|definition =
'''Неоднозначной грамматикой''' (''ambiguous grammar'') называется грамматика, в которой можно вывести некоторое слово более чем одним способом (то есть для строки есть более одного [[Контекстно-свободные грамматики, вывод, лево- и правосторонний вывод, дерево разбора|дерева разбора]]).
+
'''Неоднозначной грамматикой''' (англ. ''ambiguous grammar'') называется грамматика, в которой можно вывести некоторое слово более чем одним способом (то есть для строки есть более одного [[Контекстно-свободные грамматики, вывод, лево- и правосторонний вывод, дерево разбора|дерева разбора]]).
 
}}
 
}}
 
===Пример:===
 
===Пример:===
Строка 19: Строка 20:
 
{{Определение
 
{{Определение
 
|definition =
 
|definition =
Язык называется '''существенно неоднозначным''' (''inherently ambiguous language''), если любая грамматика, порождающая его, является неоднозначной.
+
Язык называется '''существенно неоднозначным''' (англ. ''inherently ambiguous language''), если любая грамматика, порождающая его, является неоднозначной.
 
}}
 
}}
 
===Пример:===
 
===Пример:===
Строка 25: Строка 26:
 
Язык <tex>0^a 1^b 2^c</tex>, где либо <tex>a=b</tex>, либо <tex>b=c</tex>, является существенно неоднозначным.
 
Язык <tex>0^a 1^b 2^c</tex>, где либо <tex>a=b</tex>, либо <tex>b=c</tex>, является существенно неоднозначным.
  
Докажем, что для любой грамматики <tex>\Gamma</tex>  <tex>\exists n: 0^n 1^n 2^n</tex> имеет хотя бы 2 дерева разбора в грамматике  <tex>\Gamma</tex>.
+
Докажем, что для любой грамматики <tex>\Gamma</tex>  <tex>\exists n: 0^n 1^n 2^n</tex> имеет хотя бы <tex>2</tex> дерева разбора в грамматике  <tex>\Gamma</tex>.
  
 
Возьмем <tex>k</tex> и рассмотрим слово <tex>0^k 1^k 2^{k+k!}</tex>.
 
Возьмем <tex>k</tex> и рассмотрим слово <tex>0^k 1^k 2^{k+k!}</tex>.
  
Пометим первые <tex>k</tex> нулей, по [[Лемма Огдена|лемме Огдена]] данное слово можно разбить на 5 частей: <tex>0^k1^k2^{k+k!}=uvxyz</tex>.
+
Пометим первые <tex>k</tex> нулей, по [[Лемма Огдена|лемме Огдена]] данное слово можно разбить на <tex>5</tex> частей: <tex>0^k1^k2^{k+k!}=uvxyz</tex>.
  
 
Понятно, что <tex>v</tex> состоит полностью из нулей, а <tex>y</tex> состоит полностью из единиц, а также длины <tex>v</tex> и <tex>y</tex> равны, так как иначе при накачке мы можем получить слово, не принадлежащее языку.
 
Понятно, что <tex>v</tex> состоит полностью из нулей, а <tex>y</tex> состоит полностью из единиц, а также длины <tex>v</tex> и <tex>y</tex> равны, так как иначе при накачке мы можем получить слово, не принадлежащее языку.
Строка 49: Строка 50:
  
 
== См. также ==
 
== См. также ==
[http://ru.wikipedia.org/wiki/Алгоритмически_неразрешимая_задача Алгоритмически неразрешимая задача]
+
* [[Лемма_Огдена|Лемма Огдена]]
 +
* [[Лемма_о_разрастании_для_КС-грамматик|Лемма о разрастании для КС-грамматик]]
 +
* [[Теорема_Парика|Теорема Парика]]
 +
 
 +
== Источники информации ==
 +
*[http://ru.wikipedia.org/wiki/Алгоритмически_неразрешимая_задача Википедия {{---}} Алгоритмически неразрешимая задача]
 +
*[http://en.wikipedia.org/wiki/Ambiguous_grammar Wikipedia {{---}} Ambiguous grammar]
  
[http://en.wikipedia.org/wiki/Ambiguous_grammar Ambiguous grammar]
 
 
[[Категория: Теория формальных языков]]
 
[[Категория: Теория формальных языков]]
 
[[Категория: Контекстно-свободные грамматики]]
 
[[Категория: Контекстно-свободные грамматики]]
 +
[[Категория: Опровержение контекстно-свободности языка]]

Текущая версия на 19:38, 4 сентября 2022

Неоднозначные грамматики

Определение:
Неоднозначной грамматикой (англ. ambiguous grammar) называется грамматика, в которой можно вывести некоторое слово более чем одним способом (то есть для строки есть более одного дерева разбора).

Пример:

Рассмотрим грамматику [math]E \rightarrow E + E | E * E | N[/math] и выводимое слово [math]N + N * N[/math]. Его можно вывести двумя способами:

[math]E \Rightarrow E + E \Rightarrow E + E * E \Rightarrow N + N * N[/math]

[math]E \Rightarrow E * E \Rightarrow E + E * E \Rightarrow N + N * N[/math]

Эта грамматика неоднозначна.

В данном случае мы нашли пример слова из языка (который задается грамматикой), которое имеет более одного вывода, и показали, что грамматика является существенно неоднозначной. Однако в общем случае проверка грамматики на неоднозначность является алгоритмически неразрешимой задачей.

Существенно неоднозначные языки

Определение:
Язык называется существенно неоднозначным (англ. inherently ambiguous language), если любая грамматика, порождающая его, является неоднозначной.

Пример:

Язык [math]0^a 1^b 2^c[/math], где либо [math]a=b[/math], либо [math]b=c[/math], является существенно неоднозначным.

Докажем, что для любой грамматики [math]\Gamma[/math] [math]\exists n: 0^n 1^n 2^n[/math] имеет хотя бы [math]2[/math] дерева разбора в грамматике [math]\Gamma[/math].

Возьмем [math]k[/math] и рассмотрим слово [math]0^k 1^k 2^{k+k!}[/math].

Пометим первые [math]k[/math] нулей, по лемме Огдена данное слово можно разбить на [math]5[/math] частей: [math]0^k1^k2^{k+k!}=uvxyz[/math].

Понятно, что [math]v[/math] состоит полностью из нулей, а [math]y[/math] состоит полностью из единиц, а также длины [math]v[/math] и [math]y[/math] равны, так как иначе при накачке мы можем получить слово, не принадлежащее языку.

Пусть [math]|v|=|y|=t[/math], тогда возьмём слово [math]q=uv^{k! / t + 1}xy^{k! / t + 1}z[/math]. По лемме Огдена слово [math]q[/math] принадлежит языку, а также существует нетерминал [math]A[/math] такой, что с помощью него можно породить слово [math]q[/math], то есть в грамматике можно вывести [math]uAz[/math], и из [math]A[/math] можно вывести [math]vAy[/math] и [math]x[/math]. (Заметим, что [math]q = 0^{k! + k}1^{k! + k}2^{k! + k}[/math], то есть [math]n = k! + k[/math].)

TreeA.png

Теперь рассмотрим слово [math]0^{k+k!} 1^k 2^k[/math], в котором отмечены все двойки. Аналогичными рассуждениями мы получаем, что слово [math]q[/math] принадлежит языку, а также существует нетерминал [math]B[/math] такой, что с помощью него можно породить слово [math]q[/math], где [math]|v|=|y|=p[/math].

TreeB.png

Заметим, что поддеревья, соответствующие [math]A[/math] и [math]B[/math] — разные деревья и одно не является потомком другого, иначе или в поддереве [math]A[/math] были бы двойки, или в поддереве [math]B[/math] были бы нули — что не является правдой.


Пусть в этих двух случаях дерево разбора было одно и тоже, тогда с помощью [math]A[/math] и [math]B[/math] можно породить слово вида [math]0^{k+k!+t} 1^{k+k!+t+p} 2^{k+k!+p}[/math], которое не принадлежит языку.

В результате мы имеем два дерева разбора для одного слова. Значит, язык существенно неоднозначен.

См. также

Источники информации