Материал из Викиконспекты
								
												
				
| Определение: | 
| Пусть  [math]\Gamma[/math] — контекстно-свободная грамматика.
Правило [math]A \rightarrow \beta [/math] называется длинным (англ. long rule), если [math]|\beta| \gt  2[/math]. | 
| Задача: | 
Пусть [math]\Gamma[/math] — контекстно-свободная грамматика, содержащая длинные правила. Требуется построить эквивалентную грамматику [math]\Gamma'[/math], не содержащую длинных правил.  
Задача удаления длинных правил из грамматики возникает при попытке её приведения к нормальной форме Хомского. | 
 Алгоритм
С каждым длинным правилом [math]A \rightarrow a_1 a_2 \ldots a_k[/math], [math]k \gt  2[/math], [math]a_i \in \Sigma \cup N[/math] проделаем следующее: 
-  Добавим в грамматику [math]k-2[/math] новых нетерминала [math]B_1, B_2, \ldots B_{k-2}[/math]. 
 
-  Добавим в грамматику [math]k-1[/math] новое правило: 
- [math]A \rightarrow a_1B_1[/math]
 
- [math]B_1 \rightarrow a_2B_2[/math] 
 
- [math]B_2 \rightarrow a_3B_3[/math]
 
- [math]\ldots [/math]
 
- [math]B_{k-2} \rightarrow a_{k-1}a_{k}[/math]
 
 
-  Удалим из грамматики правило [math]A \rightarrow a_1 a_2 \ldots a_k[/math]. 
 
Корректность алгоритма
| Теорема: | 
Пусть  [math]\Gamma[/math] —  контекстно-свободная грамматика.  [math]\Gamma'[/math] — грамматика, полученная в результате применения алгоритма к  [math]\Gamma[/math]. Тогда  [math]L(\Gamma) = L(\Gamma').[/math] | 
| Доказательство: | 
| [math]\triangleright[/math] | 
| 
 [math]\Rightarrow [/math]  
Покажем, что [math]L(\Gamma) \subseteq L(\Gamma')[/math].  
Пусть [math]w \in L(\Gamma)[/math]. Рассмотрим вывод [math]w[/math]. Если в выводе используется длинное правило [math]A \rightarrow a_1 a_2 \ldots a_k[/math], то заменим его на последовательное применение правил [math]A \rightarrow a_1B_1[/math], [math]B_1 \rightarrow a_2B_2[/math], 
[math]B_2 \rightarrow a_3B_3[/math], [math]\ldots [/math], [math]B_{k-2} \rightarrow a_{k-1}a_{k}[/math]. Получим вывод [math]w[/math] в [math]\Gamma'[/math]. 
 [math]\Leftarrow [/math]  
Покажем, что [math]L(\Gamma') \subseteq L(\Gamma)[/math]. 
Допустим, что это не так, то есть [math]\exists w \in L(\Gamma'), w \notin L(\Gamma)[/math]. 
Рассмотрим вывод [math]w[/math] в [math]\Gamma' \cup \Gamma[/math], минимальный по количеству примененных правил, отсутствующих в [math]\Gamma[/math]. 
Найдем в этом выводе первое применение некоторого правила [math]A \rightarrow a_1A_1, a_1 \in \Sigma \cup N[/math], которого нет в [math]\Gamma[/math]. В ходе алгоритма оно было получено из некоторого длинного правила [math]A \rightarrow a_1 a_2 \ldots a_k[/math]. Применим [math]A \rightarrow a_1 a_2 \ldots a_k[/math] вместо [math]A \rightarrow a_1A_1[/math] и удалим в выводе все применения правил, полученных из [math]A \rightarrow a_1 a_2 \ldots a_k[/math].
 
Получим вывод [math]w[/math] в [math]\Gamma \cup \Gamma'[/math], в котором меньше применений правил, отсутствующих в [math]\Gamma[/math], чем в исходном. Противоречие.  | 
| [math]\triangleleft[/math] | 
 Время работы алгоритма
Здесь будем понимать под [math] | \Gamma | [/math] сумму длин правых частей правил. Данный алгоритм добавляет в грамматику [math]O(\left| \Gamma \right|)[/math] новых нетерминалов, [math]O(\left| \Gamma \right|)[/math] новых правил длины [math]O(1)[/math] и, следовательно, работает за [math]O(\left| \Gamma \right|)[/math].
 Пример работы
Покажем, как описанный алгоритм будет работать на следующей грамматике: 
-  [math]S \rightarrow AB[/math]       
 
-  [math]A \rightarrow aBcB[/math]    
 
-  [math]B \rightarrow def[/math]. 
 
Для правила [math]A \rightarrow aBcB[/math] вводим [math] 2 [/math] новых нетерминала [math]A_1, A_2[/math] и [math] 3 [/math] новых правила: 
-  [math]A \rightarrow aA_1[/math]
 
-  [math]A_1 \rightarrow BA_2[/math]
 
-  [math]A_2 \rightarrow cB[/math].
 
Для правила [math]B \rightarrow def[/math] вводим [math] 1 [/math] новый нетерминал [math]B_1[/math] и [math] 2 [/math] новых правила: 
-  [math]B \rightarrow dB_1[/math]
 
-  [math]B_1 \rightarrow ef[/math].
 
В итоге полученная грамматика [math]\Gamma'[/math] будет иметь вид: 
-  [math]S \rightarrow AB[/math] 
 
-  [math]A \rightarrow aA_1[/math] 
 
-  [math]A_1 \rightarrow BA_2[/math] 
 
-  [math]A_2 \rightarrow cB[/math] 
 
-  [math]B \rightarrow dB_1[/math] 
 
-  [math]B_1 \rightarrow ef[/math].
 
 См. такжеИсточники информации
-  Michael Sipser Introduction to the Theory of Computation. — PWS Publishing, 1997. — ISBN 0-534-94728-X. (с 107.)
 
-  Michael A. Harrison Introduction to Formal Language Theory. — Addison-Wesley, 1978. — ISBN 978-0201029550. (с 103.)
 
-   Wikipedia — Chomsky normal form