Иерархия Хомского формальных грамматик — различия между версиями

Материал из Викиконспекты
Перейти к: навигация, поиск
(Класс 2)
м (rollbackEdits.php mass rollback)
 
(не показано 19 промежуточных версий 5 участников)
Строка 1: Строка 1:
 
{{Определение
 
{{Определение
 
|definition=
 
|definition=
'''Иерархия Хомского''' классификация [[формальные грамматики|формальных грамматик]] и [[формальные грамматики|задаваемых ими языков]], согласно которой они делятся на 4 класса по их условной сложности.
+
'''Иерархия Хомского''' (англ. ''Chomsky hierarchy'') {{---}} классификация [[формальные грамматики|формальных грамматик]] и [[формальные грамматики|задаваемых ими языков]], согласно которой они делятся на 4 класса по их условной сложности.
 
}}
 
}}
 
== Класс 0 ==
 
== Класс 0 ==
Строка 11: Строка 11:
  
 
Практического применения в силу своей сложности такие грамматики не имеют.
 
Практического применения в силу своей сложности такие грамматики не имеют.
 +
 +
===Пример===
 +
Продукции:
 +
 +
<tex>
 +
S \rightarrow aBcc \\
 +
B \rightarrow A \\
 +
BAA \rightarrow d \\
 +
Ac \rightarrow B \\
 +
A \rightarrow AAA\ |\ dB \\
 +
</tex>
 +
 +
Выведем в данной грамматике строку <tex>addd</tex>:
 +
 +
<tex>\boldsymbol{S} \Rightarrow a\boldsymbol{B}cc \Rightarrow a\boldsymbol{Ac}c \Rightarrow a\boldsymbol{B}c \Rightarrow a\boldsymbol{Ac} \Rightarrow a\boldsymbol{B} \Rightarrow a\boldsymbol{A} \Rightarrow ad\boldsymbol{B} \Rightarrow ad\boldsymbol{A} \Rightarrow ad\boldsymbol{A}AA \Rightarrow add\boldsymbol{BAA} \Rightarrow addd</tex>
  
 
== Класс 1 ==
 
== Класс 1 ==
 
Первый класс представлен '''неукорачивающими''' и '''контекстно-зависимыми''' грамматиками.
 
Первый класс представлен '''неукорачивающими''' и '''контекстно-зависимыми''' грамматиками.
 
 
{{Определение
 
{{Определение
 
|id = Неукорачивающие грамматики
 
|id = Неукорачивающие грамматики
 
|definition =
 
|definition =
'''Неукорачивающая грамматика''' (англ. ''noncontracting grammar'') {{---}} это формальная грамматика, всякое правило из <tex>P</tex> которой имеет вид <tex>\alpha\rightarrow\beta</tex>, где <tex>\alpha , \beta \in \{\Sigma\cup N\}^{+}</tex> и <tex>|\alpha|\leq|\beta|</tex> (возможно правило <tex>S  \rightarrow \varepsilon</tex>, но тогда <tex>S</tex> не встречается в правых частях правил).
+
'''Неукорачивающая грамматика''' (англ. ''noncontracting grammar'') {{---}} это формальная грамматика, всякое правило из <tex>P</tex> которой имеет вид <tex>\alpha\rightarrow\beta</tex>, где <tex>\alpha , \beta \in \{\Sigma\cup N\}^{+}</tex> и <tex>|\alpha| \leqslant |\beta|</tex> (возможно правило <tex>S  \rightarrow \varepsilon</tex>, но тогда <tex>S</tex> не встречается в правых частях правил).
 
}}
 
}}
 
 
{{Определение
 
{{Определение
 
|definition =
 
|definition =
 
'''Контекстно-зависимая грамматика''' (англ. ''context-sensitive grammar'') {{---}} это формальная грамматика, всякое правило из <tex>P</tex> которой имеет вид <tex>\alpha A \beta\rightarrow\alpha\gamma\beta</tex>, где <tex>\alpha , \beta \in \{\Sigma\cup N\}^{*}</tex>, <tex>A \in N</tex> и <tex>\gamma \in \{\Sigma\cup N\}^{+}</tex> (возможно правило <tex>S  \rightarrow \varepsilon</tex>, но тогда <tex>S</tex> не встречается в правых частях правил).
 
'''Контекстно-зависимая грамматика''' (англ. ''context-sensitive grammar'') {{---}} это формальная грамматика, всякое правило из <tex>P</tex> которой имеет вид <tex>\alpha A \beta\rightarrow\alpha\gamma\beta</tex>, где <tex>\alpha , \beta \in \{\Sigma\cup N\}^{*}</tex>, <tex>A \in N</tex> и <tex>\gamma \in \{\Sigma\cup N\}^{+}</tex> (возможно правило <tex>S  \rightarrow \varepsilon</tex>, но тогда <tex>S</tex> не встречается в правых частях правил).
 
}}
 
}}
 +
Языки, заданные этими грамматиками, распознаются с помощью '''линейно ограниченного автомата''' (англ. ''linear bounded automaton'') (недетерминированная машина Тьюринга, чья лента ограничена константой, зависящей от длины входа.)
  
Языки, заданные этими грамматиками, распознаются с помощью '''линейного ограниченного автомата''' (англ. ''linear bounded automaton'') (недетерминированная машина Тьюринга, чья лента ограничена константой, зависящей от длины входа.)
+
[[Неукорачивающие и контекстно-зависимые грамматики, эквивалентность|Известно]], что неукорачивающие грамматики эквивалентны контекстно-зависимым.
 
 
Как будет показано [[Неукорачивающие и контекстно-зависимые грамматики, эквивалентность|далее]], неукорачивающие грамматики эквивалентны контекстно-зависимым.
 
  
 
===Пример===
 
===Пример===
Язык <tex>0^n1^n2^n</tex>.
+
<tex>L=\{w \in \Sigma^* \mid w = 0^n1^n2^n, n \geqslant 1\}</tex>
  
<tex>\Sigma = \{0, 1, 2\}</tex>;
+
Продукции:
  
 
<tex>
 
<tex>
 
S \rightarrow 012 \\
 
S \rightarrow 012 \\
S \rightarrow 0TS2 \\
+
S \rightarrow 0AS2 \\
T0 \rightarrow 0T \\  
+
A0 \rightarrow 0A \\  
T1 \rightarrow 11  
+
A1 \rightarrow 11  
 
</tex>
 
</tex>
  
 
== Класс 2 ==
 
== Класс 2 ==
 
Второй класс составляют [[Контекстно-свободные грамматики, вывод, лево- и правосторонний вывод, дерево разбора|контекстно-свободные грамматики]], которые задают контекстно-свободные языки. Эти языки распознаются с помощью [[Автоматы_с_магазинной_памятью|автоматов с магазинной памятью]].
 
Второй класс составляют [[Контекстно-свободные грамматики, вывод, лево- и правосторонний вывод, дерево разбора|контекстно-свободные грамматики]], которые задают контекстно-свободные языки. Эти языки распознаются с помощью [[Автоматы_с_магазинной_памятью|автоматов с магазинной памятью]].
 
 
{{Определение
 
{{Определение
 
|definition =
 
|definition =
 
'''Контекстно-свободная грамматика''' (англ. ''context-free grammar'') {{---}} это формальная грамматика, всякое правило из <tex>P</tex> которой имеет вид <tex>A \rightarrow\beta</tex>, где <tex>A\in N </tex>, <tex>\beta \in \{\Sigma \cup N\}^{+}</tex>.
 
'''Контекстно-свободная грамматика''' (англ. ''context-free grammar'') {{---}} это формальная грамматика, всякое правило из <tex>P</tex> которой имеет вид <tex>A \rightarrow\beta</tex>, где <tex>A\in N </tex>, <tex>\beta \in \{\Sigma \cup N\}^{+}</tex>.
 
}}
 
}}
 
+
То есть грамматика допускает появление в левой части правила только одного нетерминального символа.
То есть грамматика допускает появление в левой части правила только нетерминального символа.
 
  
 
===Пример===
 
===Пример===
'''Язык палиндромов'''. Задаётся формулой <tex>L=\{w \in \Sigma^* | w = w^R\}</tex>
+
<tex>L=\{w \in \Sigma^* \mid w = w^R\}</tex> (язык палиндромов).
 
 
Терминалы: буквы алфавита <tex>\Sigma</tex>;
 
 
 
Нетерминал: <tex>S</tex>;
 
 
 
Продукции: <tex>S\rightarrow\alpha S\alpha\,|\,\alpha\,|\,\varepsilon, \alpha \in \Sigma</tex>;
 
  
Начальный нетерминал {{---}} <tex>S</tex>.
+
Продукции: <tex>S\rightarrow\alpha S\alpha\,|\,\alpha\,|\,\varepsilon, \alpha \in \Sigma</tex>
  
 
== Класс 3 ==
 
== Класс 3 ==
Элементами третьего класса являются '''праволинейные (автоматные)''' грамматики.
+
К третьему типу относятся '''автоматные''' или '''регулярные грамматики''' (англ. ''regular grammars'') {{---}} самые простые из формальных грамматик, которые задают [[Регулярные_языки:_два_определения_и_их_эквивалентность|регулярные языки]]. Они являются контекстно-свободными, но с ограниченными возможностями.
  
К третьему типу относятся [[регулярные грамматики]] (автоматные) — самые простые из формальных грамматик. Они являются контекстно-свободными, но с ограниченными возможностями.
+
Все регулярные грамматики могут быть разделены на два эквивалентных класса следующего вида:
 +
{{Определение
 +
|definition =
 +
'''Леволинейная грамматика''' (англ. ''left-regular grammar'') {{---}} это формальная грамматика, всякое правило из <tex>P</tex> которой имеет вид <tex>A \rightarrow B\gamma</tex> или <tex>A \rightarrow \gamma</tex>, где <tex>\gamma \in \Sigma, A, B \in N</tex>.
 +
}}
 +
{{Определение
 +
|definition =
 +
'''Праволинейная грамматика''' (англ. ''right-regular grammar'') {{---}} это формальная грамматика, всякое правило из <tex>P</tex> которой имеет вид <tex>A \rightarrow \gamma B</tex>; или <tex>A \rightarrow \gamma</tex>, где <tex>\gamma \in \Sigma, A, B \in N</tex>.
 +
}}
 +
Оба вида задают одинаковые языки. При этом если правила леволинейной и праволинейной грамматик объединить, то язык уже не обязан быть регулярным.
  
Все регулярные грамматики могут быть разделены на два эквивалентных класса, которые для грамматики вида III будут иметь правила следующего вида:
+
Также можно [[Правоконтекстные_грамматики,_эквивалентность_автоматам|показать]], что множество языков, задаваемых праволинейными грамматиками, совпадает со множеством языков, задаваемых [[Детерминированные конечные автоматы|конечными автоматами]].
* <tex>A \rightarrow B\gamma</tex> или <tex>A \rightarrow \gamma</tex>, где <tex>\gamma \in V_T^*, A, B \in V_N</tex> (для леволинейных грамматик).
 
* <tex>A \rightarrow \gamma B</tex>; или <tex>A \rightarrow \gamma</tex>, где <tex>\gamma \in V_T^*, A, B \in V_N</tex> (для праволинейных грамматик).
 
Регулярные грамматики применяются для описания простейших конструкций: [[идентификатор]]ов, [[Строковый тип|строк]], [[Константа (программирование)|констант]], а также [[язык ассемблера|языков ассемблера]], [[командный процессор|командных процессоров]] и др.
 
  
Type-3 grammars (regular grammars) generate the regular languages. Such a grammar restricts its rules to a single nonterminal on the left-hand side and a right-hand side consisting of a single terminal, possibly followed by a single nonterminal (right regular). Alternatively, the right-hand side of the grammar can consist of a single terminal, possibly preceded by a single nonterminal (left regular); these generate the same languages – however, if left-regular rules and right-regular rules are combined, the language need no longer be regular. The rule S \rightarrow \epsilon is also allowed here if S does not appear on the right side of any rule. These languages are exactly all languages that can be decided by a finite state automaton. Additionally, this family of formal languages can be obtained by regular expressions. Regular languages are commonly used to define search patterns and the lexical structure of programming languages.
+
===Пример===
 +
<tex>L</tex> для регулярного выражения <tex>a^*bc^*</tex>.
  
{{Определение
+
Продукции:
|definition =
 
'''Праволинейные (автоматные) грамматики''' — это формальные грамматики, всякое правило из <tex>P</tex> которых имеет вид <tex>A \rightarrow tB</tex> либо <tex>A \rightarrow t</tex>, где <tex>A\in N</tex>,<tex>B\in N</tex>, <tex>t\in \Sigma </tex>.}}
 
  
== Распознавание ==
+
<tex>
Для языков, которые задаются грамматиками из иерархии Хомского, есть машины, которые их распознают. Следующая таблица сопоставляет классы иерархии Хомского, языки, которые ими задаются, и машины, которые распознают эти языки.
+
S \rightarrow aS\ |\ bA \\
{| class="wikitable"
+
A \rightarrow \varepsilon\ |\ cA
|-
+
</tex>
! Грамматика
 
! Языки
 
! Машина
 
|-
 
| Класс 0
 
| [[ Перечислимые языки | рекурсивно перечислимые ]]
 
| [http://ru.wikipedia.org/wiki/%D0%9C%D0%B0%D1%88%D0%B8%D0%BD%D0%B0_%D0%A2%D1%8C%D1%8E%D1%80%D0%B8%D0%BD%D0%B3%D0%B0 машина Тьюринга]
 
|-
 
| Класс 1
 
| контекстно-зависимые
 
| [http://en.wikipedia.org/wiki/Linear_bounded_automaton ЛПА]
 
|-
 
| Класс 2
 
| контекстно-свободные
 
| [[Автоматы с магазинной памятью|автоматы с магазинной памятью]]
 
|-
 
| Класс 3
 
| [[Регулярные языки: два определения и их эквивалентность|регулярные]]
 
| [[Детерминированные конечные автоматы|конечные автоматы]]
 
|}
 
  
 
== См. также ==
 
== См. также ==
* [[Разрешимые_(рекурсивные)_языки|Разрешимые (рекурсивные) языки]]
+
* [[Правоконтекстные грамматики, эквивалентность автоматам]]
 
* [[Возможность_порождения_формальной_грамматикой_произвольного_перечислимого_языка|Возможность порождения формальной грамматикой произвольного перечислимого языка]]
 
* [[Возможность_порождения_формальной_грамматикой_произвольного_перечислимого_языка|Возможность порождения формальной грамматикой произвольного перечислимого языка]]
  
Строка 115: Строка 104:
 
[[Категория: Теория формальных языков]]
 
[[Категория: Теория формальных языков]]
 
[[Категория: Контекстно-свободные грамматики]]
 
[[Категория: Контекстно-свободные грамматики]]
 +
[[Категория: Базовые понятия о грамматиках]]

Текущая версия на 19:18, 4 сентября 2022

Определение:
Иерархия Хомского (англ. Chomsky hierarchy) — классификация формальных грамматик и задаваемых ими языков, согласно которой они делятся на 4 класса по их условной сложности.

Класс 0

К нулевому классу относятся все формальные грамматики. Элементы этого класса называются неограниченными грамматиками (англ. unrestricted grammars), поскольку на них не накладывается никаких ограничений. Они задают все языки, которые могут быть распознаны машиной Тьюринга. Эти языки также известны как рекурсивно перечислимые (англ. recursively enumerable).

Правила можно записать в виде:

[math]\alpha \rightarrow \beta[/math], где [math]\alpha[/math] — любая непустая цепочка, содержащая хотя бы один нетерминальный символ, а [math]\beta[/math] — любая цепочка символов из алфавита.

Практического применения в силу своей сложности такие грамматики не имеют.

Пример

Продукции:

[math] S \rightarrow aBcc \\ B \rightarrow A \\ BAA \rightarrow d \\ Ac \rightarrow B \\ A \rightarrow AAA\ |\ dB \\ [/math]

Выведем в данной грамматике строку [math]addd[/math]:

[math]\boldsymbol{S} \Rightarrow a\boldsymbol{B}cc \Rightarrow a\boldsymbol{Ac}c \Rightarrow a\boldsymbol{B}c \Rightarrow a\boldsymbol{Ac} \Rightarrow a\boldsymbol{B} \Rightarrow a\boldsymbol{A} \Rightarrow ad\boldsymbol{B} \Rightarrow ad\boldsymbol{A} \Rightarrow ad\boldsymbol{A}AA \Rightarrow add\boldsymbol{BAA} \Rightarrow addd[/math]

Класс 1

Первый класс представлен неукорачивающими и контекстно-зависимыми грамматиками.

Определение:
Неукорачивающая грамматика (англ. noncontracting grammar) — это формальная грамматика, всякое правило из [math]P[/math] которой имеет вид [math]\alpha\rightarrow\beta[/math], где [math]\alpha , \beta \in \{\Sigma\cup N\}^{+}[/math] и [math]|\alpha| \leqslant |\beta|[/math] (возможно правило [math]S \rightarrow \varepsilon[/math], но тогда [math]S[/math] не встречается в правых частях правил).


Определение:
Контекстно-зависимая грамматика (англ. context-sensitive grammar) — это формальная грамматика, всякое правило из [math]P[/math] которой имеет вид [math]\alpha A \beta\rightarrow\alpha\gamma\beta[/math], где [math]\alpha , \beta \in \{\Sigma\cup N\}^{*}[/math], [math]A \in N[/math] и [math]\gamma \in \{\Sigma\cup N\}^{+}[/math] (возможно правило [math]S \rightarrow \varepsilon[/math], но тогда [math]S[/math] не встречается в правых частях правил).

Языки, заданные этими грамматиками, распознаются с помощью линейно ограниченного автомата (англ. linear bounded automaton) (недетерминированная машина Тьюринга, чья лента ограничена константой, зависящей от длины входа.)

Известно, что неукорачивающие грамматики эквивалентны контекстно-зависимым.

Пример

[math]L=\{w \in \Sigma^* \mid w = 0^n1^n2^n, n \geqslant 1\}[/math]

Продукции:

[math] S \rightarrow 012 \\ S \rightarrow 0AS2 \\ A0 \rightarrow 0A \\ A1 \rightarrow 11 [/math]

Класс 2

Второй класс составляют контекстно-свободные грамматики, которые задают контекстно-свободные языки. Эти языки распознаются с помощью автоматов с магазинной памятью.

Определение:
Контекстно-свободная грамматика (англ. context-free grammar) — это формальная грамматика, всякое правило из [math]P[/math] которой имеет вид [math]A \rightarrow\beta[/math], где [math]A\in N [/math], [math]\beta \in \{\Sigma \cup N\}^{+}[/math].

То есть грамматика допускает появление в левой части правила только одного нетерминального символа.

Пример

[math]L=\{w \in \Sigma^* \mid w = w^R\}[/math] (язык палиндромов).

Продукции: [math]S\rightarrow\alpha S\alpha\,|\,\alpha\,|\,\varepsilon, \alpha \in \Sigma[/math]

Класс 3

К третьему типу относятся автоматные или регулярные грамматики (англ. regular grammars) — самые простые из формальных грамматик, которые задают регулярные языки. Они являются контекстно-свободными, но с ограниченными возможностями.

Все регулярные грамматики могут быть разделены на два эквивалентных класса следующего вида:

Определение:
Леволинейная грамматика (англ. left-regular grammar) — это формальная грамматика, всякое правило из [math]P[/math] которой имеет вид [math]A \rightarrow B\gamma[/math] или [math]A \rightarrow \gamma[/math], где [math]\gamma \in \Sigma, A, B \in N[/math].


Определение:
Праволинейная грамматика (англ. right-regular grammar) — это формальная грамматика, всякое правило из [math]P[/math] которой имеет вид [math]A \rightarrow \gamma B[/math]; или [math]A \rightarrow \gamma[/math], где [math]\gamma \in \Sigma, A, B \in N[/math].

Оба вида задают одинаковые языки. При этом если правила леволинейной и праволинейной грамматик объединить, то язык уже не обязан быть регулярным.

Также можно показать, что множество языков, задаваемых праволинейными грамматиками, совпадает со множеством языков, задаваемых конечными автоматами.

Пример

[math]L[/math] для регулярного выражения [math]a^*bc^*[/math].

Продукции:

[math] S \rightarrow aS\ |\ bA \\ A \rightarrow \varepsilon\ |\ cA [/math]

См. также

Источники информации