Удаление длинных правил из грамматики — различия между версиями
(длинны -> длины) |
Martoon (обсуждение | вклад) |
||
Строка 6: | Строка 6: | ||
== Постановка задачи == | == Постановка задачи == | ||
− | Пусть | + | Пусть <tex>\Gamma</tex> {{---}} [[Контекстно-свободные грамматики, вывод, лево- и правосторонний вывод, дерево разбора|контекстно-свободная грамматика]], содержащая длинные правила. Требуется построить эквивалентную грамматику <tex>\Gamma'</tex>, не содержащую длинных правил. <br> |
Задача удаления длинных правил из грамматики возникает при попытке её приведения к [[нормальная форма Хомского|нормальной форме Хомского]]. | Задача удаления длинных правил из грамматики возникает при попытке её приведения к [[нормальная форма Хомского|нормальной форме Хомского]]. | ||
== Алгоритм == | == Алгоритм == | ||
− | С каждым длинным правилом <tex>A \rightarrow a_1 a_2 \ldots a_k</tex>, <tex>k > 2</tex>, <tex>a_i \in \Sigma \cup N</tex> проделаем следующее: | + | С каждым длинным правилом <tex>A \rightarrow a_1 a_2 \ldots a_k</tex>, <tex>k > 2</tex>, <tex>a_i \in \Sigma \cup N</tex> проделаем следующее: |
− | #Добавим в грамматику <tex>k-2</tex> новых нетерминала <tex>B_1, B_2, \ldots B_{k-2}</tex>. | + | #Добавим в грамматику <tex>k-2</tex> новых нетерминала <tex>B_1, B_2, \ldots B_{k-2}</tex>. |
− | #Добавим в грамматику <tex>k-1</tex> новое правило: | + | #Добавим в грамматику <tex>k-1</tex> новое правило: |
− | #:<tex>A \rightarrow a_1B_1</tex>, | + | #:<tex>A \rightarrow a_1B_1</tex>, |
− | #:<tex>B_1 \rightarrow a_2B_2</tex>, | + | #:<tex>B_1 \rightarrow a_2B_2</tex>, |
− | #:<tex>B_2 \rightarrow a_3B_3</tex>, | + | #:<tex>B_2 \rightarrow a_3B_3</tex>, |
− | #:<tex>\ldots </tex | + | #:<tex>\ldots </tex> |
− | #:<tex>B_{k-2} \rightarrow a_{k-1}a_{k}</tex>. | + | #:<tex>B_{k-2} \rightarrow a_{k-1}a_{k}</tex>. |
#Удалим из грамматики правило <tex>A \rightarrow a_1 a_2 \ldots a_k</tex>. | #Удалим из грамматики правило <tex>A \rightarrow a_1 a_2 \ldots a_k</tex>. | ||
=== Корректность алгоритма === | === Корректность алгоритма === | ||
Строка 26: | Строка 26: | ||
Покажем, что <tex>L(\Gamma) \subseteq L(\Gamma')</tex>. <br> | Покажем, что <tex>L(\Gamma) \subseteq L(\Gamma')</tex>. <br> | ||
Пусть <tex>w \in L(\Gamma)</tex>. Рассмотрим вывод <tex>w</tex>. Если в выводе используется длинное правило <tex>A \rightarrow a_1 a_2 \ldots a_k</tex>, то заменим его на последовательное применение правил <tex>A \rightarrow a_1B_1</tex>, <tex>B_1 \rightarrow a_2B_2</tex>, | Пусть <tex>w \in L(\Gamma)</tex>. Рассмотрим вывод <tex>w</tex>. Если в выводе используется длинное правило <tex>A \rightarrow a_1 a_2 \ldots a_k</tex>, то заменим его на последовательное применение правил <tex>A \rightarrow a_1B_1</tex>, <tex>B_1 \rightarrow a_2B_2</tex>, | ||
− | <tex>B_2 \rightarrow a_3B_3</tex>, <tex>\ldots </tex>, <tex>B_{k-2} \rightarrow a_{k-1}a_{k}</tex>. Получим вывод <tex>w</tex> в <tex>\Gamma'</tex>. | + | <tex>B_2 \rightarrow a_3B_3</tex>, <tex>\ldots </tex>, <tex>B_{k-2} \rightarrow a_{k-1}a_{k}</tex>. Получим вывод <tex>w</tex> в <tex>\Gamma'</tex>. |
+ | |||
<tex>\Leftarrow </tex> <br> | <tex>\Leftarrow </tex> <br> | ||
− | Покажем, что <tex>L(\Gamma') \subseteq L(\Gamma)</tex>. | + | Покажем, что <tex>L(\Gamma') \subseteq L(\Gamma)</tex>. |
− | Допустим, что это не так, то есть <tex>\exists w \in L(\Gamma'), w \notin L(\Gamma)</tex>. | + | Допустим, что это не так, то есть <tex>\exists w \in L(\Gamma'), w \notin L(\Gamma)</tex>. |
− | Рассмотрим вывод <tex>w</tex> в <tex>\Gamma' \cup \Gamma</tex>, минимальный по количеству примененных правил, отсутствующих в <tex>\Gamma</tex>. | + | Рассмотрим вывод <tex>w</tex> в <tex>\Gamma' \cup \Gamma</tex>, минимальный по количеству примененных правил, отсутствующих в <tex>\Gamma</tex>. |
Найдем в этом выводе первое применение некоторого правила <tex>A \rightarrow a_1A_1, a_1 \in \Sigma \cup N</tex>, которого нет в <tex>\Gamma</tex>. В ходе алгоритма оно было получено из некоторого длинного правила <tex>A \rightarrow a_1 a_2 \ldots a_k</tex>. Применим <tex>A \rightarrow a_1 a_2 \ldots a_k</tex> вместо <tex>A \rightarrow a_1A_1</tex> и удалим в выводе все применения правил, полученных из <tex>A \rightarrow a_1 a_2 \ldots a_k</tex>. | Найдем в этом выводе первое применение некоторого правила <tex>A \rightarrow a_1A_1, a_1 \in \Sigma \cup N</tex>, которого нет в <tex>\Gamma</tex>. В ходе алгоритма оно было получено из некоторого длинного правила <tex>A \rightarrow a_1 a_2 \ldots a_k</tex>. Применим <tex>A \rightarrow a_1 a_2 \ldots a_k</tex> вместо <tex>A \rightarrow a_1A_1</tex> и удалим в выводе все применения правил, полученных из <tex>A \rightarrow a_1 a_2 \ldots a_k</tex>. | ||
Получим вывод <tex>w</tex> в <tex>\Gamma \cup \Gamma'</tex>, в котором меньше применений правил, отсутствующих в <tex>\Gamma</tex>, чем в исходном. Противоречие. | Получим вывод <tex>w</tex> в <tex>\Gamma \cup \Gamma'</tex>, в котором меньше применений правил, отсутствующих в <tex>\Gamma</tex>, чем в исходном. Противоречие. | ||
Строка 36: | Строка 37: | ||
== Время работы алгоритма == | == Время работы алгоритма == | ||
− | Данный алгоритм | + | Здесь будем понимать под <tex> | \Gamma | </tex> сумму длин правых частей правил. Данный алгоритм добавляет в грамматику <tex>O(\left| \Gamma \right|)</tex> новых нетерминалов, <tex>O(\left| \Gamma \right|)</tex> новых правил длины <tex>O(1)</tex> и, следовательно, работает за <tex>O(\left| \Gamma \right|)</tex>. |
== Пример работы == | == Пример работы == | ||
− | Покажем, как описанный алгоритм будет работать на следующей грамматике: | + | Покажем, как описанный алгоритм будет работать на следующей грамматике: |
− | <tex>S \rightarrow AB</tex>, | + | <tex>S \rightarrow AB</tex>, |
− | <tex>A \rightarrow aBcB</tex>, | + | <tex>A \rightarrow aBcB</tex>, |
− | <tex>B \rightarrow def</tex>. | + | <tex>B \rightarrow def</tex>. |
− | Для правила <tex>A \rightarrow aBcB</tex> вводим 2 новых нетерминала <tex>A_1, A_2</tex> и 3 новых правила: | + | Для правила <tex>A \rightarrow aBcB</tex> вводим 2 новых нетерминала <tex>A_1, A_2</tex> и 3 новых правила: |
− | <tex>A \rightarrow aA_1</tex>, | + | <tex>A \rightarrow aA_1</tex>, |
− | <tex>A_1 \rightarrow BA_2</tex>, | + | <tex>A_1 \rightarrow BA_2</tex>, |
− | <tex>A_2 \rightarrow cB</tex>. | + | <tex>A_2 \rightarrow cB</tex>. |
− | Для правила <tex>B \rightarrow def</tex> вводим 1 новый нетерминал <tex>B_1</tex> и 2 новых правила: | + | Для правила <tex>B \rightarrow def</tex> вводим 1 новый нетерминал <tex>B_1</tex> и 2 новых правила: |
− | <tex>B \rightarrow dB_1</tex>, | + | <tex>B \rightarrow dB_1</tex>, |
− | <tex>B_1 \rightarrow ef</tex>. | + | <tex>B_1 \rightarrow ef</tex>. |
− | В итоге полученная грамматика <tex>\Gamma'</tex> будет иметь вид: | + | В итоге полученная грамматика <tex>\Gamma'</tex> будет иметь вид: |
− | <tex>S \rightarrow AB</tex>, | + | <tex>S \rightarrow AB</tex>, |
− | <tex>A \rightarrow aA_1</tex>, | + | <tex>A \rightarrow aA_1</tex>, |
− | <tex>A_1 \rightarrow BA_2</tex>, | + | <tex>A_1 \rightarrow BA_2</tex>, |
− | <tex>A_2 \rightarrow cB</tex>, | + | <tex>A_2 \rightarrow cB</tex>, |
− | <tex>B \rightarrow dB_1</tex>, | + | <tex>B \rightarrow dB_1</tex>, |
− | <tex>B_1 \rightarrow ef</tex>. | + | <tex>B_1 \rightarrow ef</tex>. |
== См. также == | == См. также == | ||
Строка 66: | Строка 67: | ||
* [http://en.wikipedia.org/wiki/Chomsky_normal_form Chomsky normal form] | * [http://en.wikipedia.org/wiki/Chomsky_normal_form Chomsky normal form] | ||
+ | == Источники информации == | ||
+ | * ''Michael Sipser'' Introduction to the Theory of Computation. — PWS Publishing, 1997. — ISBN 0-534-94728-X. (с 107.) | ||
+ | * ''Michael A. Harrison'' Introduction to Formal Language Theory. — Addison-Wesley, 1978. — ISBN 978-0201029550. (с 103.) | ||
[[Категория: Теория формальных языков]] | [[Категория: Теория формальных языков]] | ||
[[Категория: Контекстно-свободные грамматики]] | [[Категория: Контекстно-свободные грамматики]] |
Версия 22:44, 15 ноября 2014
Определение: |
Пусть контекстно-свободная грамматика. Правило называется длинным, если . | —
Содержание
Постановка задачи
Пусть контекстно-свободная грамматика, содержащая длинные правила. Требуется построить эквивалентную грамматику , не содержащую длинных правил.
Задача удаления длинных правил из грамматики возникает при попытке её приведения к нормальной форме Хомского.
Алгоритм
С каждым длинным правилом
, , проделаем следующее:- Добавим в грамматику новых нетерминала .
- Добавим в грамматику
- ,
- ,
- ,
- .
новое правило:
- Удалим из грамматики правило .
Корректность алгоритма
Теорема: |
Пусть контекстно-свободная грамматика. — грамматика, полученная в результате применения алгоритма к . Тогда — |
Доказательство: |
|
Время работы алгоритма
Здесь будем понимать под
сумму длин правых частей правил. Данный алгоритм добавляет в грамматику новых нетерминалов, новых правил длины и, следовательно, работает за .Пример работы
Покажем, как описанный алгоритм будет работать на следующей грамматике:
, , .Для правила
вводим 2 новых нетерминала и 3 новых правила: , , .Для правила
вводим 1 новый нетерминал и 2 новых правила: , .В итоге полученная грамматика
будет иметь вид: , , , , , .См. также
Источники информации
- Michael Sipser Introduction to the Theory of Computation. — PWS Publishing, 1997. — ISBN 0-534-94728-X. (с 107.)
- Michael A. Harrison Introduction to Formal Language Theory. — Addison-Wesley, 1978. — ISBN 978-0201029550. (с 103.)