Нормальная форма Хомского — различия между версиями
KK (обсуждение | вклад) (→Пример) |
м (rollbackEdits.php mass rollback) |
||
(не показано 7 промежуточных версий 2 участников) | |||
Строка 1: | Строка 1: | ||
{{Определение | {{Определение | ||
|definition=Грамматикой в '''нормальной форме Хомского''' (англ. ''Chomsky normal form'') называется [[Контекстно-свободные грамматики, вывод, лево- и правосторонний вывод, дерево разбора|контекстно-свободная грамматика]], в которой могут содержаться правила только следующего вида: | |definition=Грамматикой в '''нормальной форме Хомского''' (англ. ''Chomsky normal form'') называется [[Контекстно-свободные грамматики, вывод, лево- и правосторонний вывод, дерево разбора|контекстно-свободная грамматика]], в которой могут содержаться правила только следующего вида: | ||
− | <tex>A \rightarrow B C </tex>, | + | :<tex>A \rightarrow B C </tex>, |
− | <tex>A \rightarrow a </tex>, | + | :<tex>A \rightarrow a </tex>, |
− | <tex>S \rightarrow \varepsilon </tex>, | + | :<tex>S \rightarrow \varepsilon </tex>, |
где <tex> a </tex> {{---}} терминал, <tex> A, B, C </tex> {{---}} нетерминалы, <tex> S </tex> {{---}} стартовая вершина, <tex> \varepsilon </tex> {{---}} пустая строка, стартовая вершина не содержится в правых частях правил. | где <tex> a </tex> {{---}} терминал, <tex> A, B, C </tex> {{---}} нетерминалы, <tex> S </tex> {{---}} стартовая вершина, <tex> \varepsilon </tex> {{---}} пустая строка, стартовая вершина не содержится в правых частях правил. | ||
Строка 30: | Строка 30: | ||
Таким образом, мы получили грамматику в нормальной форме Хомского, которая допускает тот же язык, что и <tex> \Gamma </tex>. | Таким образом, мы получили грамматику в нормальной форме Хомского, которая допускает тот же язык, что и <tex> \Gamma </tex>. | ||
− | Стоит заметить, что порядок выполнения операций важен. Первое правило должно быть выполнено перед вторым, иначе время нормализации ухудшится до <tex>O(2^{\left| \Gamma \right|})</tex>. Третье правило идет после второго, потому что после удаления <tex>\varepsilon</tex>-правил, могут образоваться новые цепные правила. Также четвертое правило должно быть выполнено позже третьего, так как | + | Стоит заметить, что порядок выполнения операций важен. Первое правило должно быть выполнено перед вторым, иначе время нормализации ухудшится до <tex>O(2^{\left| \Gamma \right|})</tex>. Третье правило идет после второго, потому что после удаления <tex>\varepsilon</tex>-правил, могут образоваться новые цепные правила. Также четвертое правило должно быть выполнено позже третьего и второго, так как они могут порождать бесполезные символы. |
При таком порядке действий размеры грамматики возрастают полиномиально. | При таком порядке действий размеры грамматики возрастают полиномиально. | ||
Строка 44: | Строка 44: | ||
== Пример == | == Пример == | ||
− | {| border="1" class="wikitable" style="width: | + | {| border="1" class="wikitable" style="width: 500px; height: 500px; float: left;" |
− | !style="background:# | + | !style="background:#41aef0"|Текущий шаг |
− | !style="background:# | + | !style="background:#41aef0"|Грамматика после применения правила |
|- | |- | ||
|''0. Исходная грамматика'' | |''0. Исходная грамматика'' | ||
Строка 64: | Строка 64: | ||
|- | |- | ||
|''5. Уберём ситуации, когда в правиле встречаются несколько терминалов.'' | |''5. Уберём ситуации, когда в правиле встречаются несколько терминалов.'' | ||
− | |<tex>S\rightarrow S_{ | + | |<tex>S\rightarrow S_{3}S_{1}</tex><br> <tex>X\rightarrow S_{3}Y|X_{1}Y</tex> <br> <tex>Y\rightarrow S_{3}Y|X_{1}Y|Y_{1}Y_{1}</tex> <br> <tex>S_{1}\rightarrow XS_{2}|S_{4}X|y</tex> <br> <tex>S_{2}\rightarrow S_{4}X|y</tex> <br> <tex>S_{3}\rightarrow a</tex> <br> <tex>S_{4}\rightarrow y</tex> <br> <tex>X_{1}\rightarrow b</tex> <br> <tex>Y_{1}\rightarrow c</tex> |
|} | |} | ||
+ | <div style="clear:both;"></div> | ||
== См. также == | == См. также == | ||
Строка 74: | Строка 75: | ||
==Источники информации== | ==Источники информации== | ||
* [[wikipedia:en:Chomsky normal form | Wikipedia {{---}} Chomsky normal form]] | * [[wikipedia:en:Chomsky normal form | Wikipedia {{---}} Chomsky normal form]] | ||
− | * ''Хопкрофт Д., Мотвани Р., Ульман Д.'' — '''Введение в теорию автоматов, языков и вычислений''', 2-е изд. : Пер. с англ. — Москва, Издательский дом «Вильямс», 2002. — | + | * ''Хопкрофт Д., Мотвани Р., Ульман Д.'' — '''Введение в теорию автоматов, языков и вычислений''', 2-е изд. : Пер. с англ. — Москва, Издательский дом «Вильямс», 2002. — 528с. : ISBN 5-8459-0261-4 (рус.) |
Текущая версия на 19:17, 4 сентября 2022
Определение: |
Грамматикой в нормальной форме Хомского (англ. Chomsky normal form) называется контекстно-свободная грамматика, в которой могут содержаться правила только следующего вида:
|
Содержание
Приведение грамматики к нормальной форме Хомского
Теорема: |
Любую контекстно-свободную грамматику можно привести к нормальной форме Хомского. |
Доказательство: |
Рассмотрим контекстно-свободную грамматику . Для приведения ее к нормальной форме Хомского необходимо выполнить пять шагов. На каждом шаге мы строим новую , которая допускает тот же язык, что и .
Таким образом, мы получили грамматику в нормальной форме Хомского, которая допускает тот же язык, что и .Стоит заметить, что порядок выполнения операций важен. Первое правило должно быть выполнено перед вторым, иначе время нормализации ухудшится до . Третье правило идет после второго, потому что после удаления -правил, могут образоваться новые цепные правила. Также четвертое правило должно быть выполнено позже третьего и второго, так как они могут порождать бесполезные символы.При таком порядке действий размеры грамматики возрастают полиномиально. После удалении длинных правил из каждого правила длины могло появиться новых правил, причем их длина не превышает двух. На этом шаге размер грамматики возрастает не более, чем вдвое.При удалении -правил из грамматики, содержащей правила длины и , размеры грамматики могли вырасти не больше, чем в раза.Всего цепных правил в грамматике не больше, чем Наконец, на последнем шаге может произойти добавление не более, чем , где — число нетерминалов. При удалении цепных правил мы берем каждую из цепных пар и производим добавление нецепных правил, выводимых из второго нетерминала в паре. Если максимальная суммарная длина всех правил, выводимых из какого-либо нетерминала, равна , то размер грамматики возрастет не больше, чем на . ( — алфавит грамматики) новых правил, причем все они будут длины . |
Пример
Текущий шаг | Грамматика после применения правила |
---|---|
0. Исходная грамматика | |
1. Удаление длинных правил | |
2. Удаление | -правил|
3. Удаление цепных правил | |
4. Удаление бесполезных символов | |
5. Уберём ситуации, когда в правиле встречаются несколько терминалов. |
См. также
- Контекстно-свободные грамматики
- Нормальная форма Куроды
- Приведение грамматики к ослабленной нормальной форме Грейбах
Источники информации
- Wikipedia — Chomsky normal form
- Хопкрофт Д., Мотвани Р., Ульман Д. — Введение в теорию автоматов, языков и вычислений, 2-е изд. : Пер. с англ. — Москва, Издательский дом «Вильямс», 2002. — 528с. : ISBN 5-8459-0261-4 (рус.)