LR(0)-разбор — различия между версиями
Margarita (обсуждение | вклад) (→Иллюстрация алгоритма) |
Margarita (обсуждение | вклад) |
||
Строка 1: | Строка 1: | ||
− | LR(0)-разборщик это частный случай [[LR(k)-грамматики#LR-разборщик|LR(k)-разборщикa]] | + | LR(0)-разборщик это частный случай [[LR(k)-грамматики#LR-разборщик|LR(k)-разборщикa]]. Заметим, что в данном случае <tex>k=0</tex>, то есть решение о своих действиях принимается только на основании содержимого стека, не учитывая символы входной цепочки. |
== Построение автомата и управляющей таблицы == | == Построение автомата и управляющей таблицы == | ||
− | Как было сказано в статье про LR(k)-разборщик, управляющая программа одинакова для всех LR-анализаторов, а таблица и автомат изменяются от одного анализатора к другому. | + | Как было сказано в статье про LR(k)-разборщик, управляющая программа одинакова для всех LR-анализаторов, а таблица и автомат изменяются от одного анализатора к другому. |
+ | Надо заметить, что алгоритм LR-разбора похож на [[Алгоритм Эрли]]. | ||
=== Автомат === | === Автомат === | ||
Строка 11: | Строка 12: | ||
Пусть <tex>\Gamma =\langle \Sigma, N, S, P \rangle</tex> {{---}} КС-грамматика и <tex>A \to w_1 w_2 \in P</tex>. Композицию <tex>[A \to w_1 \cdot w_2] </tex> назовем '''LR(0)-ситуацией''' (англ. ''LR(0)-item'') | Пусть <tex>\Gamma =\langle \Sigma, N, S, P \rangle</tex> {{---}} КС-грамматика и <tex>A \to w_1 w_2 \in P</tex>. Композицию <tex>[A \to w_1 \cdot w_2] </tex> назовем '''LR(0)-ситуацией''' (англ. ''LR(0)-item'') | ||
}} | }} | ||
− | В начале работы стек пуст, и указатель входной цепочки находится перед ее первым символом. Этому состоянию соответствует ситуация <tex>[E_0 \to \cdot E]</tex>, где <tex>E_0</tex> {{---}} нетерминал, добавленный при пополнении грамматики, <tex>E</tex> {{---}} стартовый нетерминал. | + | В начале работы стек пуст, и указатель входной цепочки находится перед ее первым символом. Этому состоянию соответствует ситуация <tex>[E_0 \to \cdot E]</tex>, где <tex>E_0</tex> {{---}} нетерминал, добавленный при пополнении грамматики, <tex>E</tex> {{---}} стартовый нетерминал. Назовем это состояние <tex>0</tex>. Входная цепочка может начинаться с любого терминального символа, с которого начинается правая часть любого правила с левой частью <tex>E</tex>. Построим соответствующий переход по следующей схеме: |
<tex>{[} A \to \alpha \cdot B \beta] \xrightarrow{\varepsilon} {[} B \to \cdot \gamma] </tex> | <tex>{[} A \to \alpha \cdot B \beta] \xrightarrow{\varepsilon} {[} B \to \cdot \gamma] </tex> | ||
Строка 23: | Строка 24: | ||
Таким образом, мы определяем новые состояния, в которое автомат перейдет после переноса того или иного терминала или нетерминала. | Таким образом, мы определяем новые состояния, в которое автомат перейдет после переноса того или иного терминала или нетерминала. | ||
− | Заметим, что хранить в каждом состоянии только по одной ситуации не имеет смысла, поэтому пусть в каждое стостояние будет представлять множество ситуаций. Для этого определим базовые операции <tex>closure (I)</tex> и <tex>goto (I, X)</tex>, где <tex>I</tex> – множество ситуаций, <tex>X</tex> – символ грамматики (терминал или нетерминал). Операция <tex>closure</tex> добавляет ситуации к множеству ситуаций, у которых точка стоит слева от нетерминала. Добавляются те ситуации, которые получаются из правил, в левой части которого находится этот нетерминал. | + | Заметим, что хранить в каждом состоянии только по одной ситуации не имеет смысла, поэтому пусть в каждое стостояние будет представлять множество ситуаций, а переходы {{---}} термилалы и нетермилалы. Для этого определим базовые операции <tex>closure (I)</tex> и <tex>goto (I, X)</tex>, где <tex>I</tex> – множество ситуаций, <tex>X</tex> – символ грамматики (терминал или нетерминал). Операция <tex>closure</tex> добавляет ситуации к множеству ситуаций, у которых точка стоит слева от нетерминала. Добавляются те ситуации, которые получаются из правил, в левой части которого находится этот нетерминал. |
{| border="0" | {| border="0" | ||
Строка 69: | Строка 70: | ||
</font> | </font> | ||
|} | |} | ||
− | |||
− | |||
− | |||
− | |||
=== Управляющая таблица === | === Управляющая таблица === | ||
После того, как автомат построен, можно построить управляющую таблицу. | После того, как автомат построен, можно построить управляющую таблицу. | ||
− | Обращение к таблице происходит | + | Обращение к таблице происходит следующим образом <tex>\mathtt{T[state, token]}</tex>, где |
*<tex>\mathtt{state}</tex> {{---}} состояние автомата, | *<tex>\mathtt{state}</tex> {{---}} состояние автомата, | ||
*<tex>\mathtt{token}</tex> {{---}} входной символ; | *<tex>\mathtt{token}</tex> {{---}} входной символ; | ||
Строка 83: | Строка 80: | ||
В соответствии со [[LR(k)-грамматики#Управляющая программа анализатора |структурой]] управляющей таблицы будем действовать следующим образом: | В соответствии со [[LR(k)-грамматики#Управляющая программа анализатора |структурой]] управляющей таблицы будем действовать следующим образом: | ||
− | 1. для каждого ребра <tex>I \xrightarrow{\text{X}} J </tex> мы поместим в позицию <tex>[I,X]</tex> таблицы | + | 1. для каждого ребра <tex>I \xrightarrow{\text{X}} J </tex> (из состояния <tex>I</tex> в состояние <tex>J</tex> по терминалу <tex>X</tex>) мы поместим в позицию <tex>[I,X]</tex> таблицы |
* <tex>s\ J</tex> (сокр. от ''shift'') , если <tex>X</tex> {{---}} терминал, | * <tex>s\ J</tex> (сокр. от ''shift'') , если <tex>X</tex> {{---}} терминал, | ||
*<tex>J</tex>, если <tex>X</tex> {{---}} нетерминал. | *<tex>J</tex>, если <tex>X</tex> {{---}} нетерминал. | ||
Строка 91: | Строка 88: | ||
3. пустая ячейка означает ошибочную ситуацию. | 3. пустая ячейка означает ошибочную ситуацию. | ||
− | == | + | == Пример == |
Для иллюстрации алгоритма LR(0)-разборщика мы будем использовать грамматику: | Для иллюстрации алгоритма LR(0)-разборщика мы будем использовать грамматику: | ||
Строка 121: | Строка 118: | ||
[[Файл:LRk_dfa.png|600px]] | [[Файл:LRk_dfa.png|600px]] | ||
− | === | + | === Заполнение управляющей таблицы === |
Пронумеруем правила для выполнения свертки: | Пронумеруем правила для выполнения свертки: | ||
Строка 227: | Строка 224: | ||
|} | |} | ||
− | == | + | === LR(0)-разбора конкретной строки=== |
Пример будет для строки <tex>(n_1+n_2)+n_3</tex> | Пример будет для строки <tex>(n_1+n_2)+n_3</tex> |
Версия 17:12, 30 августа 2015
LR(0)-разборщик это частный случай LR(k)-разборщикa. Заметим, что в данном случае , то есть решение о своих действиях принимается только на основании содержимого стека, не учитывая символы входной цепочки.
Содержание
Построение автомата и управляющей таблицы
Как было сказано в статье про LR(k)-разборщик, управляющая программа одинакова для всех LR-анализаторов, а таблица и автомат изменяются от одного анализатора к другому. Надо заметить, что алгоритм LR-разбора похож на Алгоритм Эрли.
Автомат
Каждое состояние автомата будет состоять из LR(0)-ситуации.
Определение: |
Пусть | — КС-грамматика и . Композицию назовем LR(0)-ситуацией (англ. LR(0)-item)
В начале работы стек пуст, и указатель входной цепочки находится перед ее первым символом. Этому состоянию соответствует ситуация
, где — нетерминал, добавленный при пополнении грамматики, — стартовый нетерминал. Назовем это состояние . Входная цепочка может начинаться с любого терминального символа, с которого начинается правая часть любого правила с левой частью . Построим соответствующий переход по следующей схеме:
Теперь мы должны выяснить, что произойдет, если анализатор выполнит перенос. Предположим, что мы выполним перенос
или перенос :
Таким образом, мы определяем новые состояния, в которое автомат перейдет после переноса того или иного терминала или нетерминала.
Заметим, что хранить в каждом состоянии только по одной ситуации не имеет смысла, поэтому пусть в каждое стостояние будет представлять множество ситуаций, а переходы — термилалы и нетермилалы. Для этого определим базовые операции
и , где – множество ситуаций, – символ грамматики (терминал или нетерминал). Операция добавляет ситуации к множеству ситуаций, у которых точка стоит слева от нетерминала. Добавляются те ситуации, которые получаются из правил, в левой части которого находится этот нетерминал.
[] closure (I) do for каждой ситуации [Aw.Xv] из I for каждого правила грамматики X u I += [X .u] // Операция += добавляет элемент к множеству while I изменилось return I
|
Операция
"переносит" точку после символа . Это означает переход из одного состояния в другое под воздействием символа .
[] goto (I, X) J={} // {} обозначает пустое множество for каждой ситуации [Aw.Xv] из I J += [A wX.v] return closure (J)
|
Теперь обсудим алгоритм построения конечного автомата. Обозначим
множество состояний, – множество переходов.
E, T build() E = {} T = {closure ([S'.S])} do for каждого состояния I из T for каждой ситуации [A w.Xv] из I J = goto(I, X) T += {J} // ко множеству состояний добавляется новое состояние E += (I J) // ко множеству ребер добавляется ребро, идущее из состояния I в состояние J. Этот переход осуществляется по символу X while E или T изменились return E, T
|
Управляющая таблица
После того, как автомат построен, можно построить управляющую таблицу.
Обращение к таблице происходит следующим образом
, где- — состояние автомата,
- — входной символ;
В соответствии со структурой управляющей таблицы будем действовать следующим образом:
1. для каждого ребра
(из состояния в состояние по терминалу ) мы поместим в позицию таблицы- (сокр. от shift) , если — терминал,
- , если — нетерминал.
2. для состояния, содержащего ситуацию
, поместим (сокр. от reduce) в позицию для каждого терминала , где — это номер правила в изначальной грамматике.3. пустая ячейка означает ошибочную ситуацию.
Пример
Для иллюстрации алгоритма LR(0)-разборщика мы будем использовать грамматику:
Пополнение грамматики
Для начала переходим к Пополненной грамматике:
Построение автомата
НКА:
состоянию будет соответствует ситуация . Добавляем остальные состояния и получаем следующийИзбавимся от ДКА:
-переходов, то есть помещаем в одно состояние несколько ситуаций, и получимЗаполнение управляющей таблицы
Пронумеруем правила для выполнения свертки:
Управляющая таблица будет выглядеть так:
LR(0)-разбора конкретной строки
Пример будет для строки
Строка | Стек | Комментарий | |||
---|---|---|---|---|---|
Перенос | |||||
Перенос | |||||
Свертка: | |||||
Свертка: | |||||
Перенос | |||||
Перенос | |||||
Свертка: | |||||
Свертка: | |||||
Перенос | |||||
Свертка: | |||||
Свертка: | |||||
Перенос | |||||
Перенос | |||||
Свертка: | |||||
Свертка: | |||||
Допуск |
См. также
Источники информации
- Альфред Ахо, Рави Сети, Джеффри Ульман. Компиляторы. Принципы, технологии, инструменты. Издательство Вильямс, 2003. Стр. 301 - 326.
- Терехов Ан.А., Вояковская Н., Булычев Д., Москаль А. - Разработка компиляторов на платформе .NET - Восходящие анализаторы
- Б.К.Мартыненко. Языки и трансляции. Стр. 198 - 223
- Лекции по теории формальных языков, LR(0)-, SLR(1)-, LR(1)- и LALR(1)-анализ