Нормальная форма Хомского — различия между версиями
Vincent (обсуждение | вклад) (→Преобразование грамматики в нормальную форму Хомского) |
Vincent (обсуждение | вклад) (→Преобразование грамматики в нормальную форму Хомского) |
||
Строка 46: | Строка 46: | ||
# Преобразование смешанных правил. | # Преобразование смешанных правил. | ||
#:Если <tex> A \rightarrow w </tex> {{---}} смешанное правило, то можно представить <tex> w </tex> в виде <tex> w=v_0 c_1 v_1 c_2 ... v_{n-1} c_n v_n </tex>, где <tex> v_i </tex> {{---}} строка нетерминалов, а <tex> c_i </tex> является терминалом. Тогда для каждого <tex> c_i </tex> добавим нетерминал <tex> C_i </tex> и правило <tex> C_i \rightarrow c_i </tex> в <tex> \Gamma_4 </tex>. Получим <tex> w'=v_0 C_1 v_1 C_2 ... v{n-1} C_n v_n </tex>. Добавим правило <tex> A \rightarrow w' </tex> в <tex> \Gamma_4 </tex>. | #:Если <tex> A \rightarrow w </tex> {{---}} смешанное правило, то можно представить <tex> w </tex> в виде <tex> w=v_0 c_1 v_1 c_2 ... v_{n-1} c_n v_n </tex>, где <tex> v_i </tex> {{---}} строка нетерминалов, а <tex> c_i </tex> является терминалом. Тогда для каждого <tex> c_i </tex> добавим нетерминал <tex> C_i </tex> и правило <tex> C_i \rightarrow c_i </tex> в <tex> \Gamma_4 </tex>. Получим <tex> w'=v_0 C_1 v_1 C_2 ... v{n-1} C_n v_n </tex>. Добавим правило <tex> A \rightarrow w' </tex> в <tex> \Gamma_4 </tex>. | ||
− | # | + | # Преобразование длинных правил. |
+ | #:Для каждого правила вида <tex> A \rightarrow B_0 B_1 ... B_n </tex>, где <tex> n \ge 2 </tex>, добавим новые нетерминалы <tex> A_1, A_2, ... , A_{n-2} </tex> и правила <tex> A \rightarrow B_1 A_1 </tex>, <tex> A_1 \rightarrow B_2 A_2 </tex>, <tex> A_2 \rightarrow B_3 A_3 </tex>, ... <tex> A_{n-2} \rightarrow B_{n-1} B_n </tex> в <tex> \Gamma_5 </tex>. | ||
Версия 07:43, 26 октября 2011
Несколько определений
Определение: |
Грамматикой в нормальной форме Хомского (Chomsky normal form) называется грамматика, в которой могут содержатся правила только следующего вида
. . (где . — терминал, — нетерминалы, — стартовая вершина, — пустая строка, стартовая вершина не содержится в правых частях правил). |
Определение: |
Нетерминал называется обнуляемым, если из него можно прямо или косвенно получить пустую строку.
Если Если , то — обнуляемый. , где все обнуляемые, то тоже обнуляемый. |
Определение: |
Пара нетерминалов Если выполняется — узловая пара. — узловая пара, а , то тоже узловая пара. | и называется узловой, если .
Определение: |
Правило | называется смешанным, если содержит хотя бы один терминал и хотя бы один нетерминал.
Преобразование грамматики в нормальную форму Хомского
Рассмотрим контекстно-свободную грамматику . Для преобразования ее в нормальную форму Хомского необходимо выполнить 5 шагов. Каждый шаг работает c преобразованной грамматикой.
- Создание новой стартовой вершины.
- Создадим новую стартовую вершину с новым правилом , где — старая стартовая вершина. Получим .
- Удаление
- Если , то выкинем такое правило.
- Если , где не содержит и обнуляемых нетерминалов, то добавим такое правило в .
- Если , причем содержит обнуляемые нетерминалы, то представим в следующем виде , где — вхождение обнуляемого нетерминала, не содержит обнуляемых нетерминалов. Добавим в все правила, которые можно получить удалением всевозможных комбинаций из . Таких вариантов будет .
- Если стартовая вершина является обнуляемой, то добавим в правило .
-правил.
- Преобразование узловых пар.
- Для каждой узловой пары , найдем все правила , где — произвольная строка терминалов и нетерминалов, и добавим в .
- Преобразование смешанных правил.
- Если — смешанное правило, то можно представить в виде , где — строка нетерминалов, а является терминалом. Тогда для каждого добавим нетерминал и правило в . Получим . Добавим правило в .
- Преобразование длинных правил.
- Для каждого правила вида , где , добавим новые нетерминалы и правила , , , ... в .
Рассмотрим контекстно-свободную грамматику , из которой удалены бесполезные символы, , -правиладлинные правила и цепные правила. Такая грамматика содержит только правила следующего вида:
- возможно, (при условии, что не содержится в правых частях правил)
Избавимся от правил, в правых частях которых записаны два символа, один из которых является терминалом, то есть правил вида
, и . Введем для каждого терминала "персональный" нетерминал . Затем правила вида заменим парой правил и , правила вида заменим парой правил и , а правила вида — тройкой правил , и .Теперь у нас остались только правила вида
, и, возможно, (при условии, что не содержится в правых частях правил). Грамматика, содержащая правила только такого вида, называется грамматикой в нормальной форме Хомского.Заметим, что любую контекстно-свободную грамматику можно привести к нормальной форме Хомского. Такая форма грамматики очень удобна для работы многих алгоритмов над грамматиками, например, алгоритм Кока-Янгера-Касами