Удаление длинных правил из грамматики

Определение:

Пусть — контекстно-свободная грамматика. Правило называется длинным (англ. long rule), если .

Задача:

Пусть — контекстно-свободная грамматика, содержащая длинные правила. Требуется построить эквивалентную грамматику , не содержащую длинных правил.
Задача удаления длинных правил из грамматики возникает при попытке её приведения к нормальной форме Хомского.

Алгоритм

С каждым длинным правилом , [math]k \gt 2[/math], [math]a_i \in \Sigma \cup N[/math] проделаем следующее:

Добавим в грамматику [math]k-2[/math] новых нетерминала [math]B_1, B_2, \ldots B_{k-2}[/math].
Добавим в грамматику [math]k-1[/math] новое правило:
[math]A \rightarrow a_1B_1[/math]

[math]B_1 \rightarrow a_2B_2[/math]

[math]B_2 \rightarrow a_3B_3[/math]

[math]\ldots [/math]
Удалим из грамматики правило .

Корректность алгоритма

Теорема:

Пусть — контекстно-свободная грамматика. — грамматика, полученная в результате применения алгоритма к . Тогда

Доказательство:

[math]\Rightarrow [/math]
Покажем, что .
Пусть [math]w \in L(\Gamma)[/math]. Рассмотрим вывод [math]w[/math]. Если в выводе используется длинное правило , то заменим его на последовательное применение правил [math]A \rightarrow a_1B_1[/math], [math]B_1 \rightarrow a_2B_2[/math], [math]B_2 \rightarrow a_3B_3[/math], [math]\ldots [/math], . Получим вывод [math]w[/math] в [math]\Gamma'[/math].

[math]\Leftarrow [/math]
Покажем, что . Допустим, что это не так, то есть . Рассмотрим вывод [math]w[/math] в [math]\Gamma' \cup \Gamma[/math], минимальный по количеству примененных правил, отсутствующих в [math]\Gamma[/math]. Найдем в этом выводе первое применение некоторого правила , которого нет в [math]\Gamma[/math]. В ходе алгоритма оно было получено из некоторого длинного правила . Применим вместо [math]A \rightarrow a_1A_1[/math] и удалим в выводе все применения правил, полученных из .

Получим вывод в , в котором меньше применений правил, отсутствующих в , чем в исходном. Противоречие.

Время работы алгоритма

Пример работы

Покажем, как описанный алгоритм будет работать на следующей грамматике:

.

Для правила [math]A \rightarrow aBcB[/math] вводим [math] 2 [/math] новых нетерминала [math]A_1, A_2[/math] и [math] 3 [/math] новых правила:

.

Для правила [math]B \rightarrow def[/math] вводим [math] 1 [/math] новый нетерминал [math]B_1[/math] и [math] 2 [/math] новых правила:

.

В итоге полученная грамматика [math]\Gamma'[/math] будет иметь вид:

.

См. также

Источники информации

Michael Sipser Introduction to the Theory of Computation. — PWS Publishing, 1997. — ISBN 0-534-94728-X. (с 107.)
Michael A. Harrison Introduction to Formal Language Theory. — Addison-Wesley, 1978. — ISBN 978-0201029550. (с 103.)
Wikipedia — Chomsky normal form

Удаление длинных правил из грамматики

Содержание

Алгоритм

Корректность алгоритма

Время работы алгоритма

Пример работы

См. также

Источники информации

Навигация

Персональные инструменты

Пространства имён

Варианты

Просмотры

Ещё

Поиск

Навигация

Инструменты