Удаление длинных правил из грамматики

Определение:

Пусть — контекстно-свободная грамматика. Правило называется длинным если

Постановка задачи

Пусть [math]\Gamma[/math] — контекстно-свободная грамматика, содержащая длинные правила. Требуется построить эквивалентную грамматику [math]\Gamma'[/math], не содержащую длинных правил.
Задача удаления длинных правил из грамматики возникает при попытке ее приведения к нормальной форме Хомского.

Алгоритм

С каждым длинным правилом , [math]k \gt 2[/math], [math]a_i \in \Sigma \cup N[/math] проделаем следующее:
Добавим в грамматику [math]k - 2[/math] новых нетерминалов [math]B_1, B_2, \ldots B_{k-2}[/math]
Добавим в грамматику [math]k-1[/math] новое правило:
[math]A \rightarrow a_1B_1[/math]
[math]B_1 \rightarrow a_2B_2[/math]
[math]B_2 \rightarrow a_3B_3[/math]
[math]\ldots [/math]

Удалим из грамматики правило .

Корректность алгоритма

Теорема:

Пусть — контекстно-свободная грамматика. — грамматика, полученная в результате применения алгоритма к . Тогда

Доказательство:

[math]\Rightarrow [/math]
Покажем, что
Пусть [math]w \in L(\Gamma)[/math]. Рассмотрим вывод [math]w[/math]. Если в выводе используется длинное правило , то заменим его на последовательное применение правил [math]A \rightarrow a_1B_1[/math], [math]B_1 \rightarrow a_2B_2[/math], [math]B_2 \rightarrow a_3B_3[/math], [math]\ldots [/math], . Получим вывод [math]w[/math] в [math]\Gamma'[/math]
[math]\Leftarrow [/math]
Покажем, что
Допустим, что это не так, и .
Рассмотрим вывод [math]w[/math] в [math]\Gamma' \cup \Gamma[/math], минимальный по количеству примененных правил, отсутствующих в [math]\Gamma[/math].
Найдем в этом выводе первое применение некоторого правила , которого нет в [math]\Gamma[/math]. В ходе алгоритма это правило было получено из некоторого длинного правила . Применим вместо [math]A \rightarrow a_1A_1[/math], и удалим в выводе все применения правил, полученных из .

Получим вывод в , в котором меньше применений правил, отсутствующих в , чем в исходном. Противоречие.

Пример работы

Покажем, как описанный алгоритм будет работать на следующей грамматике:
[math]S \rightarrow AB[/math]
[math]A \rightarrow aBcB[/math]
[math]B \rightarrow def[/math]

Для правила [math]A \rightarrow aBcB[/math] вводим 2 новых нетерминала [math]A_1, A_2[/math], и 3 новых правила:
[math]A \rightarrow aA_1[/math]
[math]A_1 \rightarrow BA_2[/math]
[math]A_2 \rightarrow bB[/math]

Для правила [math]B \rightarrow def[/math] вводим 1 новый нетерминал [math]B_1[/math], и 2 новых правила:
[math]B \rightarrow dB_1[/math]
[math]B_1 \rightarrow ef[/math]

В итоге, полученная грамматика [math]\Gamma'[/math] будет иметь вид:
[math]S \rightarrow AB[/math]
[math]A \rightarrow aA_1[/math]
[math]A_1 \rightarrow BA_2[/math]
[math]A_2 \rightarrow bB[/math]
[math]B \rightarrow dB_1[/math]
[math]B_1 \rightarrow ef[/math]

Удаление длинных правил из грамматики

Постановка задачи

Алгоритм

Корректность алгоритма

Пример работы

Навигация

Персональные инструменты

Пространства имён

Варианты

Просмотры

Ещё

Поиск

Навигация

Инструменты