Удаление eps-правил из грамматики — различия между версиями
(→Поиск ε-порождающих нетерминалов) |
(→Доказательство корректности алгоритма) |
||
Строка 45: | Строка 45: | ||
== Доказательство корректности алгоритма == | == Доказательство корректности алгоритма == | ||
{{Теорема | {{Теорема | ||
− | |statement = Если грамматика <tex>G'</tex> была построена с помощью описанного выше алгоритма по грамматике <tex>G</tex>, то <tex>L(G') = L(G) | + | |statement = Если грамматика <tex>G'</tex> была построена с помощью описанного выше алгоритма по грамматике <tex>G</tex>, то <tex>L(G') = L(G) \setminus \mathcal {f}\varepsilon \mathcal {g}</tex>. |
|proof = | |proof = | ||
Для этого достаточно доказать, что | Для этого достаточно доказать, что | ||
− | <tex>A | + | <tex>A \underset{G'}{\Rightarrow}^*w</tex> тогда и только тогда, когда <tex>A \underset{G}{\Rightarrow}^*w</tex> и <tex>w \ne \varepsilon</tex> (*). |
<tex>\Rightarrow)</tex><br\> | <tex>\Rightarrow)</tex><br\> | ||
− | Пусть <tex>A | + | Пусть <tex>A \underset{G'}{\Rightarrow}^*w</tex>. Несомненно, <tex>w \ne \varepsilon</tex>, поскольку <tex>G'</tex> - грамматика без <tex>\varepsilon</tex>-правил.<br/>Докажем индукцией по длине порождения, что <tex>A \underset{G}{\Rightarrow}^*w</tex>.<br/> |
Обозначим длину порождения за <tex>p</tex>. | Обозначим длину порождения за <tex>p</tex>. | ||
:'''Базис'''. <tex>p = 1</tex><br/> | :'''Базис'''. <tex>p = 1</tex><br/> | ||
− | В этом случае в <tex>G'</tex> есть правило <tex>A \rightarrow w</tex>. Согласно конструкции <tex>G'</tex> в <tex>G</tex> есть правило <tex>A \rightarrow \alpha</tex>, причем <tex>\alpha-</tex> это <tex>w</tex>, символы которой, возможно, перемежаются <tex>\varepsilon-</tex> порождающими нетерминалами. Тогда в <tex>G</tex> есть порождения <tex>A \underset{G}{\Rightarrow} \alpha | + | В этом случае в <tex>G'</tex> есть правило <tex>A \rightarrow w</tex>. Согласно конструкции <tex>G'</tex> в <tex>G</tex> есть правило <tex>A \rightarrow \alpha</tex>, причем <tex>\alpha-</tex> это <tex>w</tex>, символы которой, возможно, перемежаются <tex>\varepsilon-</tex> порождающими нетерминалами. Тогда в <tex>G</tex> есть порождения <tex>A \underset{G}{\Rightarrow} \alpha \underset{G}{\Rightarrow}^*w</tex>, где на шагах после первого, из всех нетерминалов в цепочке <tex>\alpha</tex> выводиться <tex>\varepsilon</tex>.<br/> |
− | :'''Предположение'''. Пусть из <tex>A | + | :'''Предположение'''. Пусть из <tex>A \underset{G'}{\Rightarrow}^*w</tex> следует, что <tex>A \underset{G}{\Rightarrow}^*w</tex> и <tex>w \ne \varepsilon</tex> верно для <tex>p < n</tex>.<br/> |
:'''Переход'''. <tex>p = n</tex><br/> | :'''Переход'''. <tex>p = n</tex><br/> | ||
Пусть в порождении <tex>n</tex> шагов, <tex>n > 1</tex>. Тогда оно имеет вид <tex>A\underset{G'}{\Rightarrow}X_1 X_2...X_k | Пусть в порождении <tex>n</tex> шагов, <tex>n > 1</tex>. Тогда оно имеет вид <tex>A\underset{G'}{\Rightarrow}X_1 X_2...X_k | ||
− | + | \underset{G'}{\Rightarrow}w^*</tex>, где <tex>X_i \in N \cup \Sigma </tex>. Первое использованное правило должно быть построено по правилу <tex>A \rightarrow Y_1 Y_2...Y_m</tex>, где цепочка <tex>Y_1 Y_2...Y_m</tex> совпадает с цепочкой <tex>X_1 X_2...X_k</tex>, цепочка <tex>Y_1 Y_2...Y_m</tex>, возможно, перемежаются <tex>\varepsilon-</tex> порождающими нетерминалами.<br/> | |
− | Цепочку <tex>w</tex> можно разбить на <tex>w_1 w_2...w_k</tex>, где <tex>X_i | + | Цепочку <tex>w</tex> можно разбить на <tex>w_1 w_2...w_k</tex>, где <tex>X_i \underset{G'}{\Rightarrow}^*w_i</tex>. Если <tex>X_i</tex> есть терминал, то <tex>w_i = X_i</tex>, a если нетерминал, то порождение <tex>X_i \underset{G'}{\Rightarrow}^*w_i</tex> содержит менее <tex>n</tex> шагов.<br/> По предположению <tex>X_i \underset{G}{\Rightarrow}^*w_i</tex>.<br/> |
Теперь построим соответствующее порождение в <tex>G</tex>.<br/> | Теперь построим соответствующее порождение в <tex>G</tex>.<br/> | ||
− | :<tex>A \underset {G}{\Rightarrow} Y_1 Y_2...Y_m | + | :<tex>A \underset {G}{\Rightarrow} Y_1 Y_2...Y_m \underset{G}{\Rightarrow}^* X_1 X_2...X_k \underset{G}{\Rightarrow}^* w_1 w_2...w_k = w</tex><br/> |
Ч.т.д.<br/> | Ч.т.д.<br/> | ||
<tex>\Leftarrow)</tex><br/> | <tex>\Leftarrow)</tex><br/> | ||
− | Пусть <tex>A | + | Пусть <tex>A \underset{G}{\Rightarrow}^*w</tex> и <tex>w \ne \varepsilon</tex>.<br/> |
− | Докажем индукцией по длине порождения, что <tex>A | + | Докажем индукцией по длине порождения, что <tex>A \underset{G'}{\Rightarrow}^*w</tex>.<br/> |
Обозначим длину порождения за <tex>p</tex>.<br/> | Обозначим длину порождения за <tex>p</tex>.<br/> | ||
:'''Базис'''. <tex>p = 1</tex><br/> | :'''Базис'''. <tex>p = 1</tex><br/> | ||
− | <tex>A \rightarrow w</tex> является правилом в <tex>G</tex>. Поскольку <tex>w \ne \varepsilon</tex>, это же правило будет и в <tex>G'</tex>, поэтому <tex>A | + | <tex>A \rightarrow w</tex> является правилом в <tex>G</tex>. Поскольку <tex>w \ne \varepsilon</tex>, это же правило будет и в <tex>G'</tex>, поэтому <tex>A \underset{G'}{\Rightarrow}^*w</tex>. |
− | :'''Предположение'''. Пусть из <tex>A | + | :'''Предположение'''. Пусть из <tex>A \underset{G}{\Rightarrow}^*w</tex> и <tex>w \ne \varepsilon следует, что A \underset{G'}{\Rightarrow}^*w </tex> верно для <tex>p < n</tex>.<br/> |
:'''Переход'''. <tex>p = n</tex><br/> | :'''Переход'''. <tex>p = n</tex><br/> | ||
Пусть в порождении <tex>n</tex> шагов, <tex>n > 1</tex>. Тогда оно имеет вид <tex>A\underset{G}{\Rightarrow}Y_1 Y_2...Y_m | Пусть в порождении <tex>n</tex> шагов, <tex>n > 1</tex>. Тогда оно имеет вид <tex>A\underset{G}{\Rightarrow}Y_1 Y_2...Y_m | ||
− | + | \underset{G}{\Rightarrow}^*w</tex>, где <tex>Y_i \in N \cup \Sigma </tex>. Цепочку <tex>w</tex> можно разбить на <tex>w_1 w_2...w_m</tex>, где <tex>Y_i \underset{G'}{\Rightarrow}^*w_i</tex>.<br/> | |
Пусть <tex>X_1, X_2, ... X_k</tex> будут теми из <tex>Y_j</tex> (в порядке записи), для которых <tex>w_i \ne \varepsilon</tex>. <tex>k \ge 1</tex>, поскольку <tex>w \ne \varepsilon</tex>.<br/> Таким образом <tex>A \rightarrow X_1 X_2 ... X_k</tex> является правилом в <tex>G'</tex> по построению <tex>G'</tex>. | Пусть <tex>X_1, X_2, ... X_k</tex> будут теми из <tex>Y_j</tex> (в порядке записи), для которых <tex>w_i \ne \varepsilon</tex>. <tex>k \ge 1</tex>, поскольку <tex>w \ne \varepsilon</tex>.<br/> Таким образом <tex>A \rightarrow X_1 X_2 ... X_k</tex> является правилом в <tex>G'</tex> по построению <tex>G'</tex>. | ||
− | Утверждаем, что <tex> X_1 X_2...X_k | + | Утверждаем, что <tex> X_1 X_2...X_k \underset{G}{\Rightarrow}^*w</tex>, поскольку только <tex>Y_j</tex>, которых нет среди <tex>X_1, X_2, ... X_k</tex>, использованы для порождения <tex>\varepsilon</tex> и не вносят ничего в порождение <tex>w</tex>. |
− | Так как каждое из порождений <tex>Y_j | + | Так как каждое из порождений <tex>Y_j \underset{G}{\Rightarrow}^*w_j</tex> содержит менее <tex>n</tex> шагов, к ним можно применить предположение индукции и заключить, что если <tex>w_j \ne \varepsilon</tex>, то <tex>Y_j \underset{G'}{\Rightarrow}^*w_j</tex>.<br/> |
− | Таким образом <tex>A \underset{G'}{\rightarrow} X_1 X_2 ... X_k | + | Таким образом <tex>A \underset{G'}{\rightarrow} X_1 X_2 ... X_k \underset{G'}{\Rightarrow}^* w</tex>.<br/> |
Ч.т.д. | Ч.т.д. | ||
Версия 21:14, 18 ноября 2011
Содержание
Основные определения
Определение: |
Правила вида | называются -правилами.
Определение: |
Назовем КС грамматику грамматикой без -правил (или неукорачивающей), если не содержит -правил или есть точно одно -правило и не встречается в правых частях остальных правил из . |
Определение: |
Нетерминал | называется -порождающим, если .
Алгоритм удаления ε-правил из грамматики
Поиск ε-порождающих нетерминалов
Вход. КС грамматика
.Выход. Множество
-порождающих нетерминалов.Схема алгоритма:
- Если — правило грамматики , то — -порождающий нетерминал.
- Если — правило грамматики , где каждый — -порождающий нетерминал, то — -порождающий нетерминал.
Теорема: |
Нетерминал является -порождающим тогда и только тогда, когда вышеприведенный алгоритм идентифицирует как -порождающий. |
Доказательство: |
Индукция по длине кратчайшего порождения
|
Схема алгоритма удаления ε-правил из грамматики
Вход. КС грамматика
.Выход. КС грамматика
.Схема алгоритма:
- Найти все -порождаюшие нетерминалы.
- Удалить все -правила из .
- Рассмотрим правила вида (*) , где — последовательности из терминалов и нетерминалов, — -порождающие нетерминалы. Добавить все возможные правила вида (*), в которых либо присутствует, либо отсутствует , кроме правила . Такое правило может возникнуть, если все .
Замечание
Если в исходной грамматике
есть правило и встречается в правых частях, то для того, чтобы получить эквивалентную грамматику без -правил, необходимо после применения описанного выше алгоритма добавить новый нетерминал , сделать его стартовым, добавить правила .Доказательство корректности алгоритма
Теорема: |
Если грамматика была построена с помощью описанного выше алгоритма по грамматике , то . |
Доказательство: |
Для этого достаточно доказать, что тогда и только тогда, когда и (*).
В этом случае в
Пусть в порождении Ч.т.д.
является правилом в . Поскольку , это же правило будет и в , поэтому .
Пусть в порождении |
Литература
- Хопкрофт Д., Мотвани Р., Ульман Д. Введение в теорию автоматов, языков и вычислений, 2-е изд. : Пер. с англ. — Москва, Издательский дом «Вильямс», 2002. — С. 273: ISBN 5-8459-0261-4 (рус.)