Удаление eps-правил из грамматики

Содержание

1 Основные определения
2 Алгоритм удаления ε-правил из грамматики
- 2.1 Поиск ε-порождающих нетерминалов
- 2.2 Бла-бла
3 Литература

Основные определения

Определение:

Правила вида называются -правилами.

Определение:

Назовем КС-грамматику грамматикой без -правил (или неукорачивающей), если либо

(1) не содержит -правил, либо

(2) есть точно одно -правило и не встречается в правых частях остальных правил из .

Определение:

Нетерминал называется -порождающим, если .

Алгоритм удаления ε-правил из грамматики

Поиск ε-порождающих нетерминалов

1) Если — правило грамматики , то —-порождающий нетерминал.

2) Если — правило грамматики , где каждый — -порождающий нетерминал, то — -порождающий нетерминал.

Бла-бла

Вход. КС-грамматика .

Выход. Эквивалентная КС-грамматика без -правил.

Метод.

   (1) Построить [math]N_e=\{A \mid A \in N[/math] и [math]A \Rightarrow_{G}^{*}\varepsilon\}[/math].
   (2) Построить [math]P'[/math] так:
           Если [math]A \rightarrow \alpha_0 B_1 \alpha_1 B_2 \alpha_2 ... B_k \alpha_k   \in P, k \geqslant 0[/math] и [math]B_i \in N_e[/math] для [math]1 \leqslant i \leqslant k[/math],
           но ни один символ в цепочках [math]a_j (0 \leqslant j \leqslant k) \notin N_e[/math], то включить в [math]P'[/math] все правила
           вида [math]A \rightarrow \alpha_0 X_1 \alpha_1 X_2 \alpha_2 ... X_k \alpha_k[/math]
           где [math]X_i-[/math] либо [math]B_i[/math], либо [math]\varepsilon[/math], но не включать правило [math]A \rightarrow \varepsilon[/math] (это могло бы произойти 
           в случае, если все [math]\alpha_i[/math] равны [math]\varepsilon[/math]).
    (3) Если [math]S \in N_e[/math], включить в [math]P'[/math] правила
                               [math]S' \rightarrow \varepsilon \mid S[/math]
        где [math]S'-[/math] новый символ, и положить [math]N'=N \cup \{ S' \}[/math]. В противном случае 
        положить [math]N'=N[/math] и [math]S'=S[/math].
    (4) Положить [math] G'=(N',\Sigma, P', S')[/math]. [math]\Box[/math]

Для доказательства корректности нам понадобиться следующее утверждение:

Утверждение:

тогда и только тогда, когда и

[math]\Rightarrow[/math]<br\> Пусть . Несомненно, [math]w \ne \varepsilon[/math], поскольку [math]G'[/math] - грамматика без [math]\varepsilon[/math]-правил и [math]A \ne S'[/math].
Докажем индукцией по длине порождения, что .
Обозначим длину порождения за [math]p[/math].

Базис.

В этом случае в [math]G'[/math] есть правило [math]A \rightarrow w[/math]. Согласно конструкции [math]G'[/math] в [math]G[/math] есть правило [math]A \rightarrow \alpha[/math], причем [math]\alpha-[/math] это [math]w[/math], символы которой, возможно, перемежаются [math]\varepsilon-[/math] порождающими переменными. Тогда в [math]G[/math] есть порождения , где на шагах после первого, из всех переменных в цепочке [math]\alpha[/math] выводиться [math]\varepsilon[/math].

Предположение. Пусть и верно для .

Переход.

Пусть в порождении [math]n[/math] шагов, [math]n \gt 1[/math]. Тогда оно имеет вид , где [math]X_i \in N \cup \Sigma [/math]. Первое использованное правило должно быть построено по правилу , где цепочка [math]Y_1 Y_2...Y_m[/math] совпадает с цепочкой [math]X_1 X_2...X_k[/math], цепочка [math]Y_1 Y_2...Y_m[/math], возможно, перемежаются [math]\varepsilon-[/math] порождающими переменными.
Цепочку [math]w[/math] можно разбить на [math]w_1 w_2...w_k[/math], где . Если [math]X_i[/math] есть терминал, то [math]w = X_i[/math], a если переменная, то порождение содержит менее [math]n[/math] шагов.
По предположению .
Теперь построим соответствующее порождение в [math]G[/math].

Ч.т.д.
[math]\Leftarrow[/math]
Пусть и [math]w \ne \varepsilon[/math].
Докажем индукцией по длине порождения, что .
Обозначим длину порождения за [math]p[/math].

Базис.

[math]A \rightarrow w[/math] является правилом в [math]G[/math]. Поскольку [math]w \ne \varepsilon[/math], эта же правило будет и в [math]G'[/math], поэтому .

Предположение. Пусть и верно для .

Переход.

Пусть в порождении [math]n[/math] шагов, [math]n \gt 1[/math]. Тогда оно имеет вид , где [math]Y_i \in N \cup \Sigma [/math]. Цепочку [math]w[/math] можно разбить на [math]w_1 w_2...w_m[/math], где .
Пусть [math]X_1, X_2, ... X_k[/math] будут теми из [math]Y_j[/math](в порядке записи), для которых [math]w_i \ne \varepsilon[/math]. [math]k \ge 1[/math], поскольку [math]w \ne \varepsilon[/math].
Таким образом является правилом в [math]G'[/math] по построению [math]G'[/math]. Утверждаем, что , поскольку только [math]Y_j[/math], которых нет среди [math]X_1, X_2, ... X_k[/math], использованы для порождения [math]\varepsilon[/math] и не вносят ничего в порождение [math]w[/math]. Так как каждое из порождений содержит менее [math]n[/math] шагов, к ним можно применить предположение индукции и заключить, что если [math]w_j \ne \varepsilon[/math], то .
Таким образом .

Ч.т.д.

Теперь можно доказать корректность:

Утверждение:

Алгоритм корректен:

Подставив вместо в утверждении выше, видим, что для тогда и только тогда, когда .
Очевидно, что тогда и только тогда, когда .
Таким образом, .

Литература

Ахо Альфред, Джеффри Ульман. Теория Синтаксического Анализа, Перевода и Компиляции. Том 1.
Джон Хопкрофт, Раджив Мотвани, Джеффри Ульман. Введение в теорию автоматов, языков и вычислений.

Удаление eps-правил из грамматики

Содержание

Основные определения

Алгоритм удаления ε-правил из грамматики

Поиск ε-порождающих нетерминалов

Бла-бла

Литература

Навигация

Персональные инструменты

Пространства имён

Варианты

Просмотры

Ещё

Поиск

Навигация

Инструменты