Изменения

Нормальная форма Хомского

6683 байта добавлено, 21:38, 21 декабря 2015

м

→‎Источники информации

{{Определение

|definition=Грамматикой в '''нормальной форме Хомского ''' (англ. ''Chomsky normal form'') называется [[Контекстно-свободные грамматики, вывод, лево- и правосторонний вывод, дерево разбора|контекстно-свободная грамматика]], в которой ~~содержатся~~ могут содержаться правила только следующего вида::<tex>A \rightarrow B C </tex>,

:<tex>A \rightarrow a </tex>,

:<tex>S \rightarrow \varepsilon </tex>,

(где <tex> a </tex> {{---}} терминал, <tex> A, B, C </tex> {{---}} нетерминалы, <tex> S </tex> {{---}} стартовая вершина, <tex> \varepsilon </tex> {{---}} пустая строка), стартовая вершина не содержится в правых частях правил.

}}

==Приведение грамматики к нормальной форме Хомского==

~~Рассмотрим [[Контекстно-свободные грамматики, вывод, лево- и правосторонний вывод, дерево разбора~~{{Теорема|statement=Любую контекстно-свободную грамматику]] <tex>\Gamma</tex>, из которой удалены [[Удаление бесполезных символов из грамматики|бесполезные символы]], [[Удаление eps-правил из грамматики|<tex>\varepsilon</tex>-правила]], [[Удаление длинных правил из грамматики|длинные правила]] и [[Удаление цепных правил из грамматики|цепные правила]]можно привести к нормальной форме Хомского. ~~Такая грамматика содержит только правила следующего вида:~~*<tex>A \rightarrow BC</tex>|proof=*Рассмотрим контекстно-свободную грамматику <tex>A \~~rightarrow Bc</tex>~~*<tex>A \rightarrow bC</tex>*<tex>A \rightarrow bc</tex>*<tex>A \rightarrow a</tex>*возможно, <tex>S \rightarrow \varepsilon</tex> (при условии, что <tex>S</tex> не содержится в правых частях правил)Избавимся от правил, в правых частях которых записаны два символа, один из которых является терминалом, то есть правил вида <tex>A \rightarrow Bc</tex>, <tex>A \rightarrow bC</tex> и <tex>A \rightarrow bcGamma </tex>. ~~Введем для каждого терминала <tex>a</tex> "персональный" нетерминал <tex>N_a</tex>~~Для приведения ее к нормальной форме Хомского необходимо выполнить пять шагов. Затем правила вида <tex>A \rightarrow Bc</tex> заменим парой правил <tex>A \rightarrow BN_c</tex> и <tex>N_c \rightarrow c</tex>, правила вида <tex>A \rightarrow bCНа каждом шаге мы строим новую </tex> ~~заменим парой правил <tex>A~~ \~~rightarrow N_bC</tex> и <tex>N_b \rightarrow b~~Gamma_i </tex>, ~~а правила вида <tex>A \rightarrow bc</tex> {{---}} тройкой правил <tex>A \rightarrow N_bN_c</tex>~~которая допускает тот же язык, ~~<tex>N_b \rightarrow b</tex>~~ что и <tex>~~N_c~~ \~~rightarrow c~~Gamma </tex>.

~~Теперь у нас остались только~~ # Уберём длинные правила ~~вида~~ .#: Воспользуемся [[Удаление длинных правил из грамматики|алгоритмом удаления длинных правил]] из грамматики. Получим грамматику <tex>A \~~rightarrow BC~~Gamma_1 </tex>, эквивалентную исходной, содержащую правила длины <tex>0, 1</tex> и <tex>2</tex>.# Удаление <tex> \varepsilon </tex>-правил.#:Воспользуемся [[Удаление eps-правил из грамматики|алгоритмом удаления <tex> \varepsilon </tex>-правил ]] из грамматики. Получим грамматику <tex>A \~~rightarrow a~~Gamma_2 </tex> и, ~~возможно~~эквивалентную исходной, но в которой нет <tex>S \~~rightarrow~~ varepsilon </tex>-правил.# Удаление цепных правил.#:Воспользуемся [[Удаление_цепных_правил_из_грамматики| алгоритмом удаления цепных правил]] из грамматики. Алгоритм работает таким образом, что новые <tex> \varepsilon</tex> ~~(при условии~~-правила не образуются. Получим грамматику <tex> \Gamma_3 </tex>, эквивалентную <tex> \Gamma </tex>.# Удалим бесполезные символы.#:Воспользуемся [[Удаление бесполезных символов из грамматики| алгоритмом удаления бесполезных символов]] из грамматики. Так как <tex> \Gamma_3 </tex> эквивалентна <tex> \Gamma </tex>, то бесполезные символы не могли перестать быть бесполезными. Более того, мы только удаляем правила, ~~что~~ новые <tex>S\varepsilon</tex> -правила и цепные правила не ~~содержится~~ могли появиться.# Уберём ситуации, когда в ~~правых частях~~ правиле встречаются несколько терминалов.#:Для всех правилвида <tex> A \rightarrow u_1 u_2</tex> (где <tex> u_i </tex> {{---}} терминал или нетерминал)заменим все терминалы <tex> u_i </tex> на новые нетерминалы <tex> U_i </tex> и добавим правила <tex> U_i \rightarrow u_i </tex>. ~~Грамматика~~Теперь правила содержат либо одиночный терминал, ~~содержащая правила только такого вида~~либо строку из двух нетерминалов. Таким образом, ~~называется грамматикой~~ мы получили грамматику в ~~'''~~нормальной форме Хомского~~'''~~, которая допускает тот же язык, что и <tex> \Gamma </tex>.

~~Заметим~~Стоит заметить, что ~~любую контекстно~~порядок выполнения операций важен. Первое правило должно быть выполнено перед вторым, иначе время нормализации ухудшится до <tex>O(2^{\left| \Gamma \right|})</tex>. Третье правило идет после второго, потому что после удаления <tex>\varepsilon</tex>-правил, могут образоваться новые цепные правила. Также четвертое правило должно быть выполнено позже третьего и второго, так как они могут порождать бесполезные символы. При таком порядке действий размеры грамматики возрастают полиномиально. После удалении длинных правил из каждого правила длины <tex> k \geqslant 3 </tex> могло появиться <tex> k-1 </tex> новых правил, причем их длина не превышает двух. На этом шаге размер грамматики возрастает не более, чем вдвое. При удалении <tex> \varepsilon </tex>-правил из грамматики, содержащей правила длины <tex>0, 1</tex> и <tex>2</tex>, размеры грамматики могли вырасти не больше, чем в <tex>3</tex> раза. Всего цепных правил в грамматике не больше, чем <tex> n^2 </tex>, где <tex> n </tex> {{---~~свободную грамматику можно привести к нормальной форме Хомского~~}} число нетерминалов. При удалении цепных правил мы берем каждую из цепных пар и производим добавление нецепных правил, выводимых из второго нетерминала в паре. Если максимальная суммарная длина всех правил, выводимых из какого-либо нетерминала, равна <tex> k </tex>, то размер грамматики возрастет не больше, чем на <tex> k \cdot n^2 </tex>. ~~Такая форма~~ Наконец, на последнем шаге может произойти добавление не более, чем <tex>|\Sigma|</tex> (<tex>\Sigma</tex> {{---}} алфавит грамматики ~~очень удобна для работы многих алгоритмов над грамматиками~~) новых правил, ~~например~~причем все они будут длины <tex>1</tex>.}} == Пример =={| border="1" class="wikitable" style="width: 500px; height: 500px; float: left;"!style="background:#41aef0"|Текущий шаг!style="background:#41aef0"|Грамматика после применения правила|-|''0. Исходная грамматика''|<tex>S\rightarrow aXbX|aZ</tex> <tex>X\rightarrow aY|bY|\varepsilon</tex> <tex>Y\rightarrow X|cc</tex> <tex>Z\rightarrow ZX</tex>|-|''1. Удаление длинных правил''|<tex>S\rightarrow aS_{1}|aZ</tex> <tex>X\rightarrow aY|bY|\varepsilon</tex> <tex>Y\rightarrow X|cc</tex> <tex>Z\rightarrow ZX</tex> <tex>S_{1}\rightarrow XS_{2}</tex> <tex>S_{2}\rightarrow yX</tex>|-|''2. Удаление <tex>\varepsilon</tex>-правил''|<tex>S\rightarrow aS_{1}|aZ</tex> <tex>X\rightarrow aY|bY</tex> <tex>Y\rightarrow aY|bY|cc</tex> <tex>Z\rightarrow ZX</tex> <tex>S_{1}\rightarrow XS_{2}|S_{2}</tex> <tex>S_{2}\rightarrow yX|y</tex> |-|''3. Удаление цепных правил''|<tex>S\rightarrow aS_{1}|aZ</tex> <tex>X\rightarrow aY|bY</tex> <tex>Y\rightarrow aY|bY|cc</tex> <tex>Z\rightarrow ZX</tex> <tex>S_{1}\rightarrow XS_{2}|yX|y</tex> <tex>S_{2}\rightarrow yX|y</tex> |-|''4. Удаление бесполезных символов''|<tex>S\rightarrow aS_{1}</tex> <tex>X\rightarrow aY|bY</tex> <tex>Y\rightarrow aY|bY|cc</tex> <tex>S_{1}\rightarrow XS_{2}|yX|y</tex> <tex>S_{2}\rightarrow yX|y</tex>|-|''5. Уберём ситуации, когда в правиле встречаются несколько терминалов.''|<tex>S\rightarrow S_{3}S_{1}</tex> <tex>X\rightarrow S_{3}Y|X_{1}Y</tex> <tex>Y\rightarrow S_{3}Y|X_{1}Y|Y_{1}Y_{1}</tex> <tex>S_{1}\rightarrow XS_{2}|S_{4}X|y</tex> <tex>S_{2}\rightarrow S_{4}X|y</tex> <tex>S_{3}\rightarrow a</tex> <tex>S_{4}\rightarrow y</tex> <tex>X_{1}\rightarrow b</tex> <tex>Y_{1}\rightarrow c</tex>|}<div style="clear:both;"></div> == См. также ==* [[~~Алгоритм Кока~~Контекстно-~~Янгера~~свободные_грамматики,_вывод,_лево-_и_правосторонний_вывод,_дерево_разбора|Контекстно-~~Касами разбора~~ свободные грамматики ]]* [[Нормальная_форма_Куроды | Нормальная форма Куроды]]* [[Приведение_грамматики_к_ослабленной_нормальной_форме_Грейбах | Приведение грамматики к ослабленной нормальной форме Грейбах]] ==Источники информации==* [[wikipedia:en:Chomsky normal form | Wikipedia {{---}} Chomsky normal form]]* ''Хопкрофт Д., Мотвани Р., Ульман Д.'' — '''Введение в ~~НФХ|алгоритм Кока~~теорию автоматов, языков и вычислений''', 2-е изд. : Пер. с англ. — Москва, Издательский дом «Вильямс», 2002. — 528с. : ISBN 5-8459-0261-4 (рус.) [[Категория: Теория формальных языков]][[Категория: Контекстно-~~Янгера~~свободные грамматики]][[Категория: Нормальные формы КС-~~Касами~~грамматик]]

KK

275

правок

Изменения

Нормальная форма Хомского

Навигация

Персональные инструменты

Пространства имён

Варианты

Просмотры

Ещё

Поиск

Навигация

Инструменты