Устранение левой рекурсии — различия между версиями

Версия 10:00, 8 января 2013

Определение:

Говорят, что контекстно-свободная (КС) грамматика содержит непосредственную левую рекурсию (direct left recursion), если она содержит правило вида .

Определение:

Говорят, что КС-грамматика содержит левую рекурсию (left recursion), если в ней существует вывод вида .

Методы нисходящего разбора (top-down parsers) не в состоянии работать с леворекурсивными грамматиками. Проблема в том, что продукция вида [math]A \Rightarrow^* A\alpha[/math] может применяться бесконечно долго, так и не выработав некий терминальный символ, который можно было бы сравнить со строкой. Поэтому требуется преобразование грамматики, которое бы устранило левую рекурсию.

Содержание

1 Устранение непосредственной левой рекурсии
2 Алгоритм устранения произвольной левой рекурсии
- 2.1 Пример
3 Пример
4 Литература

Устранение непосредственной левой рекурсии

Опишем процедуру, устраняющую все правила вида [math]A \to A\alpha[/math], для фиксированного нетерминала [math]A[/math].

Запишем все правила вывода из [math]A[/math] в виде: [math]A \to A\alpha_1\,|\,\ldots\,|\,A\alpha_n\,|\,\beta_1\,|\,\ldots\,|\,\beta_m [/math], где
- [math]\alpha[/math] — непустая последовательность терминалов и нетерминалов ();
- [math]\beta[/math] — непустая последовательность терминалов и нетерминалов, не начинающаяся с [math]A[/math].
Заменим правила вывода из [math]A[/math] на .
Создадим новый нетерминал .

Изначально нетерминал [math]A[/math] порождает сроки вида . В новой грамматике нетерминал [math]A[/math] порождает [math]\beta{A^\prime}[/math], а [math]A^\prime[/math] порождает строки вида . Из этого очевидно, что изначальная грамматика эквивалентна новой.

Алгоритм устранения произвольной левой рекурсии

Пусть — упорядоченное множество всех нетерминалов.

for все нетерминалы [math]A_i[/math] 
  for все нетерминалы [math]A_j[/math], такие, что [math] 1 \leq j \lt  i [/math] и 
    рассмотреть все правила вывода из [math]A_j[/math]: [math]A_j \to \delta_1 | \ldots | \delta_k[/math].
    заменить каждое правило [math]A_i \to A_j \gamma[/math] на [math]A_i \to \delta_1\gamma | \ldots | \delta_k\gamma[/math].
  устранить непосредственную левую рекурсию для [math]A_i[/math].

На [math]i[/math] итерации внешнего цикла все правила вида [math]A_i \to A_j \gamma[/math] где [math] j \lt i [/math] заменяются на где . Таким образом остается только избавиться от непосредственной рекурсии для [math]A_i[/math]. Очевидно, что одна итерация алгоритма не меняет язык, а значит язык получившийся в итоге грамматики совпадает с исходным.

Алгоритм не работает для грамматик с [math]\varepsilon[/math] переходами и с грамматиками имеющими [math]A \Rightarrow^+ A[/math]. Поэтому для произвольной грамматики необходимо сначала воспользоваться алгоритмом алгоритмом удаления [math] \varepsilon [/math]-правил.

Проблема этого алгоритма в том, что в зависимости от порядка нетерминалов в множестве размер грамматки может получиться экспоненциальным.

Пример

[math]A_1 \to 0 | 1[/math]

[math]A_{i+1} \to {A_i}0[/math] для [math]1 \leq i \lt n[/math]

Упорядочим множество нетерминалов по возрастанию индексов. Легко заметить, что правила для [math]A_i[/math] будут представлять из себя все двоичные вектора длины [math]i[/math]. Если упорядочить нетерминалы по убыванию в грамматике изменений не будет.

Пример

Дана грамматика

[math]A \to S\alpha [/math]

[math]S \to S\beta | A\gamma | b[/math]

Среди правил [math]A[/math] непосредственной рекурсии нет, поэтому во время первой итерации внешнего цикла ничего не происходит. Во время второй итерации внешнего цикла правило [math] S \to A\gamma [/math] переходит в [math] S \to S\alpha\gamma [/math].

Грамматика имеет вид

[math]A \to S\alpha [/math]

Устраняем левую рекурсию для [math]S[/math]

[math] S \to\beta{S_1}[/math]

Литература

Хопкрофт Д., Мотвани Р., Ульман Д. — Введение в теорию автоматов, языков и вычислений, 2-е изд. : Пер. с англ. — Москва, Издательский дом «Вильямс», 2002. — 528 с. : ISBN 5-8459-0261-4 (рус.)
Robert C. Moore — Removing Left Recursion from Context-Free Grammars

@@ Строка 28: / Строка 28: @@
 ==Алгоритм  устранения произвольной левой рекурсии==
-Пусть <tex>N = \lbrace A_1, A_2, \ldots , A_n \rbrace</tex> {{---}} множество всех нетерминалов.
+Пусть <tex>N = \lbrace A_1, A_2, \ldots , A_n \rbrace</tex> {{---}} упорядоченное множество всех нетерминалов.
 <div>
   for все нетерминалы <tex>A_i</tex>
@@ Строка 40: / Строка 40: @@
 Очевидно, что одна итерация алгоритма не меняет язык, а значит язык получившийся в итоге грамматики совпадает с исходным.
+Алгоритм не работает для грамматик с <tex>\varepsilon</tex> переходами и с грамматиками имеющими <tex>A \Rightarrow^+ A</tex>. Поэтому для произвольной грамматики необходимо сначала воспользоваться алгоритмом [[Удаление_eps-правил_из_грамматики | алгоритмом удаления <tex> \varepsilon </tex>-правил]].
+Проблема этого алгоритма в том, что в зависимости от порядка нетерминалов в множестве размер грамматки может получиться экспоненциальным.
+===Пример===
+<tex>A_1 \to 0 | 1</tex>
+<tex>A_{i+1} \to {A_i}0</tex>  для <tex>1 \leq i < n</tex>
-Алгоритм не работает для грамматик с <tex>\varepsilon</tex> переходами и с грамматиками имеющими <tex>A \Rightarrow^+ A</tex>. Поэтому для произвольной грамматики необходимо сначала воспользоваться алгоритмом [[Удаление_eps-правил_из_грамматики | алгоритмом удаления <tex> \varepsilon </tex>-правил]].
+Упорядочим множество нетерминалов по возрастанию индексов. Легко заметить, что правила для <tex>A_i</tex> будут представлять из себя все двоичные вектора длины <tex>i</tex>. Если упорядочить нетерминалы по убыванию в грамматике изменений не будет.
 ==Пример==

Устранение левой рекурсии — различия между версиями

Версия 10:00, 8 января 2013

Содержание

Устранение непосредственной левой рекурсии

Алгоритм устранения произвольной левой рекурсии

Пример

Пример

Литература

Навигация

Персональные инструменты

Пространства имён

Варианты

Просмотры

Ещё

Поиск

Навигация

Инструменты