Нормальная форма Хомского

Несколько определений

Определение:

Грамматикой в нормальной форме Хомского (Chomsky normal form) называется грамматика, в которой могут содержатся правила только следующего вида

[math]A \rightarrow B C [/math],

[math]A \rightarrow a [/math],

[math]S \rightarrow \varepsilon [/math],

где — терминал, — нетерминалы, — стартовая вершина, — пустая строка, стартовая вершина не содержится в правых частях правил.

Определение:

Нетерминал называется обнуляемым, если из него можно прямо или косвенно получить пустую строку.

Если , то [math] A [/math] — обнуляемый.

Если , где все обнуляемые, то тоже обнуляемый.

Определение:

Пара нетерминалов и называется узловой, если .

[math] \forall A [/math] выполняется [math] (A, A) [/math] — узловая пара.

Если — узловая пара, а , то тоже узловая пара.

Определение:

Правило называется смешанным, если содержит хотя бы один терминал и хотя бы один нетерминал.

Преобразование грамматики в нормальную форму Хомского

Теорема:

Любую контекстно-свободную грамматику можно преобразовать в нормальную форму Хомского.

Доказательство:

Рассмотрим контекстно-свободную грамматику [math] \Gamma [/math]. Для преобразования ее в нормальную форму Хомского необходимо выполнить пять шагов. На каждом шаге мы строим новую [math] \Gamma_i [/math], которая допускает тот же язык, что и [math] \Gamma [/math].

Создание новой стартовой вершины.
Создадим новую стартовую вершину [math] S_0 [/math] с новым правилом [math] S_0 \rightarrow S [/math], где [math] S [/math] — старая стартовая вершина. Добавим в [math] \Gamma_1 [/math] новую вершину, правило и [math] \Gamma [/math].
Удаление [math] \varepsilon [/math]-правил.
1. Если , то выкинем такое правило.
2. Если [math] A \rightarrow w [/math], где [math] w [/math] не содержит [math] \varepsilon [/math] и обнуляемых нетерминалов, то добавим такое правило в [math] \Gamma_2 [/math].
3. Если [math] A \rightarrow w [/math], причем [math] w [/math] содержит обнуляемые нетерминалы, то представим [math] w [/math] в следующем виде , где [math] N_i [/math] — вхождение обнуляемого нетерминала, а [math] w_i [/math] не содержит обнуляемых нетерминалов. Добавим в [math] \Gamma_2 [/math] все правила, которые можно получить удалением всевозможных комбинаций [math] N_i [/math] из [math] w [/math]. Таких вариантов будет [math] 2^n [/math].
Если стартовая вершина [math] \Gamma_1 [/math] является обнуляемой, то добавим в [math] \Gamma_2 [/math] правило .
Преобразование узловых пар.
Для каждой узловой пары [math] (A, B) [/math], найдем все правила [math] B \rightarrow w [/math], где [math] w [/math] — произвольная строка терминалов и нетерминалов, и добавим [math] A \rightarrow w [/math] в [math] \Gamma_3 [/math].
Преобразование смешанных правил.
Если [math] A \rightarrow w [/math] — смешанное правило, то можно представить [math] w [/math] в виде , где [math] v_i [/math] — строка нетерминалов, а [math] c_i [/math] является терминалом. Тогда для каждого [math] c_i [/math] добавим нетерминал [math] C_i [/math] и правило [math] C_i \rightarrow c_i [/math] в [math] \Gamma_4 [/math]. Получим . Добавим правило [math] A \rightarrow w' [/math] в [math] \Gamma_4 [/math].
Преобразование длинных правил.
Для каждого правила вида , где [math] n \ge 2 [/math], добавим новые нетерминалы [math] A_1, A_2, ... , A_{n-2} [/math] и правила [math] A \rightarrow B_1 A_1 [/math], [math] A_1 \rightarrow B_2 A_2 [/math], [math] A_2 \rightarrow B_3 A_3 [/math], [math] ... [/math] , в [math] \Gamma_5 [/math].

Таким образом мы получили грамматику в нормальной форме Хомского, которая допускает тот же язык, что и .

Литература

http://www.enseignement.polytechnique.fr/informatique/profs/Luc.Maranget/IF/09/chomsky.pdf

Нормальная форма Хомского

Несколько определений

Преобразование грамматики в нормальную форму Хомского

Литература

Навигация

Персональные инструменты

Пространства имён

Варианты

Просмотры

Ещё

Поиск

Навигация

Инструменты