Иерархия Хомского формальных грамматик — различия между версиями
Kabanov (обсуждение | вклад) (→Класс 2) |
Kabanov (обсуждение | вклад) |
||
Строка 1: | Строка 1: | ||
{{Определение | {{Определение | ||
|definition= | |definition= | ||
− | '''Иерархия Хомского''' | + | '''Иерархия Хомского''' {{---}} классификация [[формальные грамматики|формальных грамматик]] и [[формальные грамматики|задаваемых ими языков]], согласно которой они делятся на 4 класса по их условной сложности. |
}} | }} | ||
== Класс 0 == | == Класс 0 == | ||
Строка 11: | Строка 11: | ||
Практического применения в силу своей сложности такие грамматики не имеют. | Практического применения в силу своей сложности такие грамматики не имеют. | ||
+ | |||
+ | ===Пример=== | ||
+ | Терминалы: {a, c, d}; | ||
+ | |||
+ | Нетерминалы: {S, A, B}; | ||
+ | |||
+ | Продукции: | ||
+ | |||
+ | <tex> | ||
+ | S \rightarrow aBc \\ | ||
+ | aB \rightarrow cA \\ | ||
+ | Ac \rightarrow d | ||
+ | </tex> | ||
== Класс 1 == | == Класс 1 == | ||
Строка 26: | Строка 39: | ||
}} | }} | ||
− | Языки, заданные этими грамматиками, распознаются с помощью ''' | + | Языки, заданные этими грамматиками, распознаются с помощью '''линейно ограниченного автомата''' (англ. ''linear bounded automaton'') (недетерминированная машина Тьюринга, чья лента ограничена константой, зависящей от длины входа.) |
Как будет показано [[Неукорачивающие и контекстно-зависимые грамматики, эквивалентность|далее]], неукорачивающие грамматики эквивалентны контекстно-зависимым. | Как будет показано [[Неукорачивающие и контекстно-зависимые грамматики, эквивалентность|далее]], неукорачивающие грамматики эквивалентны контекстно-зависимым. | ||
===Пример=== | ===Пример=== | ||
− | Язык <tex>0^n1^n2^n</tex> | + | Язык <tex>L=\{w \in \Sigma^* | w = 0^n1^n2^n, n \ge 1\}</tex> |
− | <tex> | + | Терминалы: <tex>\{0, 1, 2\}</tex>; |
+ | |||
+ | Нетерминалы: <tex>\{S, A\}</tex>; | ||
+ | |||
+ | Продукции: | ||
<tex> | <tex> | ||
S \rightarrow 012 \\ | S \rightarrow 012 \\ | ||
− | S \rightarrow | + | S \rightarrow 0AS2 \\ |
− | + | A0 \rightarrow 0A \\ | |
− | + | A1 \rightarrow 11 | |
</tex> | </tex> | ||
Строка 53: | Строка 70: | ||
===Пример=== | ===Пример=== | ||
− | + | Язык <tex>L=\{w \in \Sigma^* | w = w^R\}</tex> (язык палиндромов). | |
Терминалы: буквы алфавита <tex>\Sigma</tex>; | Терминалы: буквы алфавита <tex>\Sigma</tex>; | ||
− | + | Нетерминалы: <tex>S</tex>; | |
Продукции: <tex>S\rightarrow\alpha S\alpha\,|\,\alpha\,|\,\varepsilon, \alpha \in \Sigma</tex>; | Продукции: <tex>S\rightarrow\alpha S\alpha\,|\,\alpha\,|\,\varepsilon, \alpha \in \Sigma</tex>; | ||
− | + | == Класс 3 == | |
+ | К третьему типу относятся '''автоматные''' или '''регулярные грамматики''' (англ. ''regular grammars'') {{---}} самые простые из формальных грамматик, которые задают [[Регулярные_языки:_два_определения_и_их_эквивалентность|регулярные языки]]. Они являются контекстно-свободными, но с ограниченными возможностями. | ||
− | = | + | Все регулярные грамматики могут быть разделены на два эквивалентных класса следующего вида: |
− | + | {{Определение | |
+ | |definition = | ||
+ | '''Леволинейная грамматика''' (англ. ''left-regular grammar'') {{---}} это формальная грамматика, всякое правило из <tex>P</tex> которой имеет вид <tex>A \rightarrow B\gamma</tex> или <tex>A \rightarrow \gamma</tex>, где <tex>\gamma \in \Sigma, A, B \in N</tex>. | ||
+ | }} | ||
+ | |||
+ | {{Определение | ||
+ | |definition = | ||
+ | '''Праволинейная грамматика''' (англ. ''right-regular grammar'') {{---}} это формальная грамматика, всякое правило из <tex>P</tex> которой имеет вид <tex>A \rightarrow \gamma B</tex>; или <tex>A \rightarrow \gamma</tex>, где <tex>\gamma \in \Sigma, A, B \in N</tex>. | ||
+ | }} | ||
+ | |||
+ | Оба вида задают одинаковые языки. При этом если правила леволинейной и праволинейной грамматик объединить, то язык будет уже не обязан быть регулярным. | ||
+ | |||
+ | Эти языки распознаются с помощью [[Детерминированные конечные автоматы|конечных автоматов]]. | ||
− | + | ===Пример=== | |
+ | Язык <tex>L</tex> для регулярного выражения <tex>a^*bc^*</tex>. | ||
− | + | Терминалы: {a, b, c}; | |
− | |||
− | |||
− | |||
− | + | Нетерминалы: {S, A}; | |
− | + | Продукции: | |
− | |||
− | |||
− | + | <tex> | |
− | + | S \rightarrow aS\ |\ bA \\ | |
− | + | A \rightarrow \varepsilon\ |\ cA | |
− | + | </tex> | |
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | | | ||
− | | | ||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
== См. также == | == См. также == | ||
* [[Разрешимые_(рекурсивные)_языки|Разрешимые (рекурсивные) языки]] | * [[Разрешимые_(рекурсивные)_языки|Разрешимые (рекурсивные) языки]] | ||
* [[Возможность_порождения_формальной_грамматикой_произвольного_перечислимого_языка|Возможность порождения формальной грамматикой произвольного перечислимого языка]] | * [[Возможность_порождения_формальной_грамматикой_произвольного_перечислимого_языка|Возможность порождения формальной грамматикой произвольного перечислимого языка]] | ||
+ | * [[wikipedia:Linear_bounded_automaton|Wikipedia {{---}} Linear bounded automaton]] | ||
==Источники информации== | ==Источники информации== |
Версия 22:32, 16 ноября 2014
Определение: |
Иерархия Хомского — классификация формальных грамматик и задаваемых ими языков, согласно которой они делятся на 4 класса по их условной сложности. |
Содержание
Класс 0
К нулевому классу относятся все формальные грамматики. Элементы этого класса называются неограниченными грамматиками (англ. unrestricted grammars), поскольку на них не накладывается никаких ограничений. Они задают все языки, которые могут быть распознаны машиной Тьюринга. Эти языки также известны как рекурсивно перечислимые (англ. recursively enumerable).
Правила можно записать в виде:
, где — любая непустая цепочка, содержащая хотя бы один нетерминальный символ, а — любая цепочка символов из алфавита.
Практического применения в силу своей сложности такие грамматики не имеют.
Пример
Терминалы: {a, c, d};
Нетерминалы: {S, A, B};
Продукции:
Класс 1
Первый класс представлен неукорачивающими и контекстно-зависимыми грамматиками.
Определение: |
Неукорачивающая грамматика (англ. noncontracting grammar) — это формальная грамматика, всякое правило из | которой имеет вид , где и (возможно правило , но тогда не встречается в правых частях правил).
Определение: |
Контекстно-зависимая грамматика (англ. context-sensitive grammar) — это формальная грамматика, всякое правило из | которой имеет вид , где , и (возможно правило , но тогда не встречается в правых частях правил).
Языки, заданные этими грамматиками, распознаются с помощью линейно ограниченного автомата (англ. linear bounded automaton) (недетерминированная машина Тьюринга, чья лента ограничена константой, зависящей от длины входа.)
Как будет показано далее, неукорачивающие грамматики эквивалентны контекстно-зависимым.
Пример
Язык
Терминалы:
;Нетерминалы:
;Продукции:
Класс 2
Второй класс составляют контекстно-свободные грамматики, которые задают контекстно-свободные языки. Эти языки распознаются с помощью автоматов с магазинной памятью.
Определение: |
Контекстно-свободная грамматика (англ. context-free grammar) — это формальная грамматика, всякое правило из | которой имеет вид , где , .
То есть грамматика допускает появление в левой части правила только нетерминального символа.
Пример
Язык
(язык палиндромов).Терминалы: буквы алфавита
;Нетерминалы:
;Продукции:
;Класс 3
К третьему типу относятся автоматные или регулярные грамматики (англ. regular grammars) — самые простые из формальных грамматик, которые задают регулярные языки. Они являются контекстно-свободными, но с ограниченными возможностями.
Все регулярные грамматики могут быть разделены на два эквивалентных класса следующего вида:
Определение: |
Леволинейная грамматика (англ. left-regular grammar) — это формальная грамматика, всякое правило из | которой имеет вид или , где .
Определение: |
Праволинейная грамматика (англ. right-regular grammar) — это формальная грамматика, всякое правило из | которой имеет вид ; или , где .
Оба вида задают одинаковые языки. При этом если правила леволинейной и праволинейной грамматик объединить, то язык будет уже не обязан быть регулярным.
Эти языки распознаются с помощью конечных автоматов.
Пример
Язык
для регулярного выражения .Терминалы: {a, b, c};
Нетерминалы: {S, A};
Продукции:
См. также
- Разрешимые (рекурсивные) языки
- Возможность порождения формальной грамматикой произвольного перечислимого языка
- Wikipedia — Linear bounded automaton
Источники информации
- А. Ахо, Дж. Ульман. Теория синтаксического анализа, перевода и компиляции. Синтаксический анализ. Том 2. Пер. с англ. — М.: Книга по Требованию, 2012. — ISBN 978-5-458-27407-4
- Wikipedia — Chomsky hierarchy
- Википедия — Иерархия Хомского