Нормальная форма Хомского — различия между версиями
Vincent (обсуждение | вклад) (→Преобразование грамматики в нормальную форму Хомского) |
Vincent (обсуждение | вклад) (→Преобразование грамматики в нормальную форму Хомского) |
||
Строка 33: | Строка 33: | ||
# Создание новой стартовой вершины. | # Создание новой стартовой вершины. | ||
#: Создадим новую стартовую вершину <tex> S_0 </tex> с новым правилом <tex> S_0 \rightarrow S </tex>, где <tex> S </tex> {{---}} старая стартовая вершина. Получим <tex> \Gamma_1 </tex>. | #: Создадим новую стартовую вершину <tex> S_0 </tex> с новым правилом <tex> S_0 \rightarrow S </tex>, где <tex> S </tex> {{---}} старая стартовая вершина. Получим <tex> \Gamma_1 </tex>. | ||
− | # Удаление | + | # Удаление <tex> \varepsilon- </tex> правил. |
##Если <tex> A \rightarrow \varepsilon </tex>, то выкинем такое правило. | ##Если <tex> A \rightarrow \varepsilon </tex>, то выкинем такое правило. | ||
##Если <tex> A \rightarrow w </tex>, где <tex> w </tex> не содержит <tex> \varepsilon </tex> и обнуляемых переменных, то добавим такое правило в <tex> \Gamma_2 </tex>. | ##Если <tex> A \rightarrow w </tex>, где <tex> w </tex> не содержит <tex> \varepsilon </tex> и обнуляемых переменных, то добавим такое правило в <tex> \Gamma_2 </tex>. |
Версия 06:57, 26 октября 2011
Несколько определений
Определение: |
Грамматикой в нормальной форме Хомского (Chomsky normal form) называется грамматика, в которой могут содержатся правила только следующего вида
. . (где . — терминал, — нетерминалы, — стартовая вершина, — пустая строка, стартовая вершина не содержится в правых частях правил). |
Определение: |
Вершина называется обнуляемой, если из нее можно прямо или косвенно получить пустую строку.
Если Если , то — обнуляемая. , где все обнуляемые, то тоже обнуляемая. |
Определение: |
Пара вершин Если выполняется — узловая пара. — узловая пара, а , то тоже узловая пара. | и называется узловой, если .
Преобразование грамматики в нормальную форму Хомского
Рассмотрим контекстно-свободную грамматику . Для преобразования ее в нормальную форму Хомского необходимо избавиться от правил следующего типа.
- Создание новой стартовой вершины.
- Создадим новую стартовую вершину с новым правилом , где — старая стартовая вершина. Получим .
- Удаление
- Если , то выкинем такое правило.
- Если , где не содержит и обнуляемых переменных, то добавим такое правило в .
- Если , причем содержит обнуляемые переменные, то представим в виде , где — вхождение обнуляемой переменной, не содержит обнуляемых переменных. Добавим в все правила, которые можно получить удалением всевозможных комбинаций из . Таких вариантов будет .
- Если стартовая вершина является обнуляемой, то добавим в правило .
правил.
- Удаление вершин, которые могут породить друг друга.
- Преобразование правил с длинной правой частью.
Рассмотрим контекстно-свободную грамматику , из которой удалены бесполезные символы, , -правиладлинные правила и цепные правила. Такая грамматика содержит только правила следующего вида:
- возможно, (при условии, что не содержится в правых частях правил)
Избавимся от правил, в правых частях которых записаны два символа, один из которых является терминалом, то есть правил вида
, и . Введем для каждого терминала "персональный" нетерминал . Затем правила вида заменим парой правил и , правила вида заменим парой правил и , а правила вида — тройкой правил , и .Теперь у нас остались только правила вида
, и, возможно, (при условии, что не содержится в правых частях правил). Грамматика, содержащая правила только такого вида, называется грамматикой в нормальной форме Хомского.Заметим, что любую контекстно-свободную грамматику можно привести к нормальной форме Хомского. Такая форма грамматики очень удобна для работы многих алгоритмов над грамматиками, например, алгоритм Кока-Янгера-Касами