Удаление eps-правил из грамматики — различия между версиями
(→Алгоритм поиска ε-порождающих нетерминалов) |
(→Доказательство корректности) |
||
Строка 28: | Строка 28: | ||
Пусть <tex>A \underset{G'}{\Rightarrow}^*w</tex> и <tex>w \ne \varepsilon</tex>.<br/> | Пусть <tex>A \underset{G'}{\Rightarrow}^*w</tex> и <tex>w \ne \varepsilon</tex>.<br/> | ||
Докажем индукцией по длине порождения, что <tex>A \underset{G}{\Rightarrow}^*w</tex>.<br/> | Докажем индукцией по длине порождения, что <tex>A \underset{G}{\Rightarrow}^*w</tex>.<br/> | ||
− | + | '''База'''. Пусть <tex>A \underset{G'}{\Rightarrow}^*w</tex>.<br/> | |
В этом случае в <tex>G'</tex> есть правило <tex>A \rightarrow w</tex>. Согласно конструкции <tex>G'</tex> в <tex>G</tex> есть правило <tex>A \rightarrow \alpha</tex>, причем <tex>\alpha</tex> — цепочка <tex>w</tex>, символы которой, возможно, перемежаются <tex>\varepsilon</tex>-порождающими нетерминалами. Тогда в <tex>G</tex> есть порождения <tex>A \underset{G}{\Rightarrow} \alpha \underset{G}{\Rightarrow}w</tex>.<br/> | В этом случае в <tex>G'</tex> есть правило <tex>A \rightarrow w</tex>. Согласно конструкции <tex>G'</tex> в <tex>G</tex> есть правило <tex>A \rightarrow \alpha</tex>, причем <tex>\alpha</tex> — цепочка <tex>w</tex>, символы которой, возможно, перемежаются <tex>\varepsilon</tex>-порождающими нетерминалами. Тогда в <tex>G</tex> есть порождения <tex>A \underset{G}{\Rightarrow} \alpha \underset{G}{\Rightarrow}w</tex>.<br/> | ||
− | + | '''Предположение'''. Пусть из <tex>A \underset{G'}{\Rightarrow}^*w</tex> следует, что <tex>A \underset{G}{\Rightarrow}^*w</tex> и <tex>w \ne \varepsilon</tex> менее, чем за <tex>n</tex> шагов.<br/> | |
− | + | '''Переход'''. | |
Пусть в порождении <tex>n</tex> шагов, <tex>n > 1</tex>. Тогда оно имеет вид <tex>A\underset{G'}{\Rightarrow}X_1 X_2...X_k | Пусть в порождении <tex>n</tex> шагов, <tex>n > 1</tex>. Тогда оно имеет вид <tex>A\underset{G'}{\Rightarrow}X_1 X_2...X_k | ||
\underset{G'}{\Rightarrow}^*w</tex>, где <tex>X_i \in N \cup \Sigma </tex>. Первое использованное правило должно быть построено по правилу <tex>A \rightarrow Y_1 Y_2...Y_m</tex>, где цепочка <tex>Y_1 Y_2...Y_m</tex> совпадает с цепочкой <tex>X_1 X_2...X_k</tex>, цепочка <tex>Y_1 Y_2...Y_m</tex>, возможно, перемежаются <tex>\varepsilon</tex>-порождающими нетерминалами.<br/> | \underset{G'}{\Rightarrow}^*w</tex>, где <tex>X_i \in N \cup \Sigma </tex>. Первое использованное правило должно быть построено по правилу <tex>A \rightarrow Y_1 Y_2...Y_m</tex>, где цепочка <tex>Y_1 Y_2...Y_m</tex> совпадает с цепочкой <tex>X_1 X_2...X_k</tex>, цепочка <tex>Y_1 Y_2...Y_m</tex>, возможно, перемежаются <tex>\varepsilon</tex>-порождающими нетерминалами.<br/> | ||
Строка 41: | Строка 41: | ||
Пусть <tex>A \underset{G}{\Rightarrow}^*w</tex> и <tex>w \ne \varepsilon</tex>.<br/> | Пусть <tex>A \underset{G}{\Rightarrow}^*w</tex> и <tex>w \ne \varepsilon</tex>.<br/> | ||
Докажем индукцией по длине порождения, что <tex>A \underset{G'}{\Rightarrow}^*w</tex>.<br/> | Докажем индукцией по длине порождения, что <tex>A \underset{G'}{\Rightarrow}^*w</tex>.<br/> | ||
− | + | '''База'''. Пусть <tex>A \underset{G}{\Rightarrow}^*w</tex>.<br/> | |
<tex>A \rightarrow w</tex> является правилом в <tex>G</tex>. Поскольку <tex>w \ne \varepsilon</tex>, это же правило будет и в <tex>G'</tex>, поэтому <tex>A \underset{G'}{\Rightarrow}^*w</tex>. | <tex>A \rightarrow w</tex> является правилом в <tex>G</tex>. Поскольку <tex>w \ne \varepsilon</tex>, это же правило будет и в <tex>G'</tex>, поэтому <tex>A \underset{G'}{\Rightarrow}^*w</tex>. | ||
− | + | '''Предположение'''. Пусть из <tex>A \underset{G}{\Rightarrow}^*w</tex> и <tex>w \ne \varepsilon</tex> следует, что <tex>A \underset{G'}{\Rightarrow}^*w </tex> менее, чем за <tex>n</tex> шагов.<br/> | |
− | + | '''Переход'''. Пусть в порождении <tex>n</tex> шагов, <tex>n > 1</tex>. Тогда оно имеет вид <tex>A\underset{G}{\Rightarrow}Y_1 Y_2...Y_m | |
− | Пусть в порождении <tex>n</tex> шагов, <tex>n > 1</tex>. Тогда оно имеет вид <tex>A\underset{G}{\Rightarrow}Y_1 Y_2...Y_m | ||
\underset{G}{\Rightarrow}^*w</tex>, где <tex>Y_i \in N \cup \Sigma </tex>. Цепочку <tex>w</tex> можно разбить на <tex>w_1 w_2...w_m</tex>, где <tex>Y_i \underset{G'}{\Rightarrow}^*w_i</tex>.<br/> | \underset{G}{\Rightarrow}^*w</tex>, где <tex>Y_i \in N \cup \Sigma </tex>. Цепочку <tex>w</tex> можно разбить на <tex>w_1 w_2...w_m</tex>, где <tex>Y_i \underset{G'}{\Rightarrow}^*w_i</tex>.<br/> | ||
Пусть <tex>X_1, X_2, ... X_k</tex> будут теми из <tex>Y_j</tex> (в порядке записи), для которых <tex>w_i \ne \varepsilon</tex>. <tex>k \ge 1</tex>, поскольку <tex>w \ne \varepsilon</tex>.<br/> Таким образом <tex>A \rightarrow X_1 X_2 ... X_k</tex> является правилом в <tex>G'</tex> по построению <tex>G'</tex>. | Пусть <tex>X_1, X_2, ... X_k</tex> будут теми из <tex>Y_j</tex> (в порядке записи), для которых <tex>w_i \ne \varepsilon</tex>. <tex>k \ge 1</tex>, поскольку <tex>w \ne \varepsilon</tex>.<br/> Таким образом <tex>A \rightarrow X_1 X_2 ... X_k</tex> является правилом в <tex>G'</tex> по построению <tex>G'</tex>. |
Версия 05:52, 6 декабря 2011
Содержание
Используемые определения
Определение: |
Правила вида | называются -правилами.
Определение: |
Нетерминал | называется -порождающим, если .
Алгоритм удаления ε-правил из грамматики
Вход: КС грамматика
Выход: КС грамматика без -правил (возможно правило , но в этом случае не встречается в правых частях правил). .
- Найти все . -порождаюшие нетерминалы
- Добавить все правила из в .
- Рассмотрим правила вида (*) , где — последовательности из терминалов и нетерминалов, — -порождающие нетерминалы. Добавить все возможные правила вида (*) в , в которых либо присутствует, либо отсутствует .
- Удалить все -правила из .
- Если в исходной грамматике выводилось пустое слово , то необходимо добавить новый нетерминал , сделать его стартовым, добавить правила .
Доказательство корректности
Теорема: |
Если грамматика была построена с помощью описанного выше алгоритма по грамматике , то . |
Доказательство: |
Сначала докажем, что если не выполнять шаг 5 алгоритма, то получится грамматика
Ч.т.д. |
Алгоритм поиска ε-порождающих нетерминалов
Вход: КС грамматика
Выход: множество -порождающих нетерминалов.
- Найти все -правила. Составить множество, состоящее из нетерминалов, входящих в левые части таких правил.
- Если существует правило , для которого верно, что каждый принадлежит множеству, то добавить в множество.
- Если на шаге 2 множество изменилось, то повторить шаг 2.
Теорема: |
Описанный выше алгоритм находит все -порождающие нетерминалы грамматики . |
Доказательство: |
Индукция по длине кратчайшего порождения .База. Переход. Пусть , то есть в грамматике имеется правило . Следовательно, — -порождающий нетерминал. за шагов. Тогда первый шаг порождения , где за менее, чем шагов. По индукционному предположению каждый нетерминал обнаруживается как -порождающий. Тогда нетерминал — -порождающий. |
Литература
- Хопкрофт Д., Мотвани Р., Ульман Д. Введение в теорию автоматов, языков и вычислений, 2-е изд. : Пер. с англ. — Москва, Издательский дом «Вильямс», 2002. — С. 273: ISBN 5-8459-0261-4 (рус.)