|
|
Строка 10: |
Строка 10: |
| Пусть <tex>\Gamma</tex> {{---}} [[Контекстно-свободные грамматики, вывод, лево- и правосторонний вывод, дерево разбора|контекстно-свободная грамматика]], содержащая длинные правила. Требуется построить эквивалентную грамматику <tex>\Gamma'</tex>, не содержащую длинных правил. | | Пусть <tex>\Gamma</tex> {{---}} [[Контекстно-свободные грамматики, вывод, лево- и правосторонний вывод, дерево разбора|контекстно-свободная грамматика]], содержащая длинные правила. Требуется построить эквивалентную грамматику <tex>\Gamma'</tex>, не содержащую длинных правил. |
| == Алгоритм == | | == Алгоритм == |
− | Расмотрим длинное правило <tex>A \rightarrow a_1 a_2 \ldots a_k</tex>, <tex>k > 2</tex>, <tex>a_i \in \Sigma \cup N</tex> <br>
| + | С каждым длинным правилом <tex>A \rightarrow a_1 a_2 \ldots a_k</tex>, <tex>k > 2</tex>, <tex>a_i \in \Sigma \cup N</tex> проделаем следующее: <br> |
| Добавим в грамматику <tex>k - 2</tex> новых нетерминалов <tex>B_1, B_2, \ldots B_{k-2}</tex> <br> | | Добавим в грамматику <tex>k - 2</tex> новых нетерминалов <tex>B_1, B_2, \ldots B_{k-2}</tex> <br> |
| Добавим в грамматику <tex>k-1</tex> новое правило: <br> | | Добавим в грамматику <tex>k-1</tex> новое правило: <br> |
Строка 18: |
Строка 18: |
| <tex>\ldots </tex> <br> | | <tex>\ldots </tex> <br> |
| <tex>B_{k-2} \rightarrow a_{k-1}a_{k}</tex> <br> | | <tex>B_{k-2} \rightarrow a_{k-1}a_{k}</tex> <br> |
− | Удалим из грамматики правило <tex>A \rightarrow a_1 a_2 \ldots a_k</tex>. Проделаем описанную операцию с каждым длинным правилом в <tex>\Gamma</tex>. | + | Удалим из грамматики правило <tex>A \rightarrow a_1 a_2 \ldots a_k</tex>. |
| === Корректность алгоритма === | | === Корректность алгоритма === |
| {{Теорема | | {{Теорема |
Версия 05:26, 28 октября 2011
Задача удаления длинных правил из грамматики возникает при попытке ее приведения к нормальной форме Хомского.
Определение: |
Пусть [math]\Gamma[/math] — контекстно-свободная грамматика.
Правило [math]A \rightarrow \beta [/math] называется длинным если [math]|\beta| \gt 2[/math] |
Постановка задачи
Пусть [math]\Gamma[/math] — контекстно-свободная грамматика, содержащая длинные правила. Требуется построить эквивалентную грамматику [math]\Gamma'[/math], не содержащую длинных правил.
Алгоритм
С каждым длинным правилом [math]A \rightarrow a_1 a_2 \ldots a_k[/math], [math]k \gt 2[/math], [math]a_i \in \Sigma \cup N[/math] проделаем следующее:
Добавим в грамматику [math]k - 2[/math] новых нетерминалов [math]B_1, B_2, \ldots B_{k-2}[/math]
Добавим в грамматику [math]k-1[/math] новое правило:
[math]A \rightarrow a_1B_1[/math]
[math]B_1 \rightarrow a_2B_2[/math]
[math]B_2 \rightarrow a_3B_3[/math]
[math]\ldots [/math]
[math]B_{k-2} \rightarrow a_{k-1}a_{k}[/math]
Удалим из грамматики правило [math]A \rightarrow a_1 a_2 \ldots a_k[/math].
Корректность алгоритма
Теорема: |
Пусть [math]\Gamma[/math] — контекстно-свободная грамматика. [math]\Gamma'[/math] — грамматика, полученная в результате применения алгоритма к [math]\Gamma[/math]. Тогда [math]L(\Gamma) = L(\Gamma')[/math] |
Доказательство: |
[math]\triangleright[/math] |
[math]\Rightarrow [/math]
Покажем, что [math]L(\Gamma) \subset L(\Gamma')[/math]
Пусть [math]w \in L(\Gamma)[/math]. Рассмотрим вывод [math]w[/math]. Если в выводе используется длинное правило [math]A \rightarrow a_1 a_2 \ldots a_k[/math], то заменим его на последовательное применение правил [math]A \rightarrow a_1B_1[/math], [math]B_1 \rightarrow a_2B_2[/math],
[math]B_2 \rightarrow a_3B_3[/math], [math]\ldots [/math], [math]B_{k-2} \rightarrow a_{k-1}a_{k}[/math]. Получим вывод [math]w[/math] в [math]\Gamma'[/math]
[math]\Leftarrow [/math]
Покажем, что [math]L(\Gamma') \subset L(\Gamma)[/math]
Допустим, что это не так, и [math]\exists w \in L(\Gamma'), w \notin L(\Gamma)[/math].
Рассмотрим вывод [math]w[/math] в [math]\Gamma' \cup \Gamma[/math], минимальный по количеству примененных правил, отсутствующих в [math]\Gamma[/math].
Найдем в этом выводе первое применение некоторого правила [math]A \rightarrow a_1A_1, a_1 \in \Sigma \cup N[/math], которого нет в [math]\Gamma[/math]. В ходе алгоритма это правило было получено из некоторого длинного правила [math]A \rightarrow a_1 a_2 \ldots a_k[/math]. Применим правило [math]A \rightarrow a_1 a_2 \ldots a_k[/math] вместо [math]A \rightarrow a_1A_1[/math], и удалим в выводе все применения правил, полученных из [math]A \rightarrow a_1 a_2 \ldots a_k[/math].
Получим вывод [math]w[/math] в [math]\Gamma \cup \Gamma'[/math], в котором меньше применений правил, отсутствующих в [math]\Gamma[/math], чем в исходном. Противоречие. |
[math]\triangleleft[/math] |
Пример работы
Покажем, как описанный алгоритм будет работать на следующей грамматике:
[math]S \rightarrow AB[/math]
[math]A \rightarrow aBcB[/math]
[math]B \rightarrow def[/math]
Для правила [math]A \rightarrow aBcB[/math] вводим 2 новых нетерминала [math]A_1, A_2[/math], и 3 новых правила:
[math]A \rightarrow aA_1[/math]
[math]A_1 \rightarrow BA_2[/math]
[math]A_2 \rightarrow bB[/math]
Для правила [math]B \rightarrow def[/math] вводим 1 новый нетерминал [math]B_1[/math], и 2 новых правила:
[math]B \rightarrow dB_1[/math]
[math]B_1 \rightarrow ef[/math]
В итоге, полученная грамматика [math]\Gamma'[/math] будет иметь вид:
[math]S \rightarrow AB[/math]
[math]A \rightarrow aA_1[/math]
[math]A_1 \rightarrow BA_2[/math]
[math]A_2 \rightarrow bB[/math]
[math]B \rightarrow dB_1[/math]
[math]B_1 \rightarrow ef[/math]