Изменения

LR(0)-разбор

3798 байт добавлено, 14:49, 14 апреля 2021

Исправление очепятки

LR(0)-~~разбор означает~~разборщик {{---}} это частный случай [[LR(k)-грамматики#LR-разборщик|LR(k)-разборщикa]]. Заметим, что ~~разборщик для принятия решения не смотрит на символы строки~~в данном случае <tex>k=0</tex>, ~~а смотрит~~ то есть решение о своих действиях принимается только на ~~состояние~~ основании содержимого стека ~~и определяет переходы по нему~~, символы входной цепочки не учитываются.

== Построение автомата и управляющей таблицы == === Автомат ===Каждое состояние автомата будет состоять из LR(0)-~~Разбор~~ ситуации.{{Определение|id=def_LR0_item) |definition=Пусть <tex>\Gamma =\langle \Sigma, N, S, P \rangle</tex> {{---}} КС-грамматика и <tex>A \to w_1 w_2 \in P</tex>. Композицию <tex>[A \to w_1 \cdot w_2] </tex> назовем '''LR(0)-ситуацией''' (англ. ''LR(0)-item'').}}В начале работы стек пуст, и указатель входной цепочки находится перед ее первым символом. Этому состоянию соответствует ситуация <tex>[E_0 \to \cdot E]</tex>, где <tex>E_0</tex> {{---}} нетерминал, добавленный при пополнении грамматики, <tex>E</tex> {{---}} стартовый нетерминал. Назовем это состояние <tex>0</tex>. Входная цепочка может начинаться с любого терминального символа, с которого начинается правая часть любого правила с левой частью <tex>E</tex>. Построим соответствующий переход по следующей схеме: <tex>{[} A \to \alpha \cdot B \beta] \xrightarrow{\varepsilon} {[} B \to \cdot \gamma] </tex> Теперь мы должны выяснить, что произойдет, если анализатор выполнит перенос. Предположим, что мы выполним перенос <tex>c</tex> или перенос <tex>B</tex>: <tex>{[} A \to \alpha \cdot c \beta] \xrightarrow{\text{c}} {[} A \to \alpha c \cdot \beta] </tex> <tex>{[} A \to \alpha \cdot B \beta] \xrightarrow{\text{B}} {[} A \to \alpha B \cdot \beta] </tex> Таким образом, мы определяем новые состояния, в которые автомат перейдет после переноса того или иного терминала или нетерминала. Можно заметить, что алгоритм LR-разбора похож на [[Алгоритм Эрли|алгоритм Эрли]]. ==== Базовые операции ==== Заметим, что хранить в каждом состоянии только по одной ситуации не имеет смысла, поэтому пусть каждое состояние будет представлять множество ситуаций, а переходы {{---}} терминалы и нетерминалы. Для этого определим базовые операции <tex>closure (I)</tex> и <tex>goto (I, X)</tex>, где <tex>I</tex> {{---}} множество ситуаций, <tex>X</tex> {{---}} символ грамматики (терминал или нетерминал). * Операция <tex>closure</tex> добавляет ситуации к множеству ситуаций, у которых точка стоит слева от нетерминала. Добавляются те ситуации, которые получаются из правил, в левой части которых находится этот нетерминал.

* Операция <tex>goto</tex> "переносит" точку после символа <tex>X</tex>. Это означает переход из одного состояния в другое под воздействием символа <tex>X</tex>. ==== Построение автомата ==== ~~Иллюстрация алгоритма~~ Теперь обсудим алгоритм построения конечного автомата. Обозначим <tex>T</tex> множество состояний, <tex>E</tex> {{---}} множество переходов.# Изначальное состояние содержит одно правило: <tex>E_0 \to E</tex>.# Для текущего состояния делаем операцию <tex>closure</tex>.# По всем возможный символам для каждой ситуации добавляем переходы, используя операцию <tex>goto</tex>.# Если множество <tex>T</tex> или <tex>E</tex> во втором или третьем пункте изменилось, возвращаемся ко второму шагу. === Управляющая таблица ===~~Заметим~~После построения автомата можно перейти к построению управляющей таблицы. Обращение к таблице происходит следующим образом <tex>\mathtt{T[state, ~~что~~ token]}</tex>, где *<tex>\mathtt{state}</tex> {{---}} состояние автомата, *<tex>\mathtt{token}</tex> {{---}} входной символ; В соответствии со [[LR(0k)-грамматики#Управляющая программа анализатора |структурой]] управляющей таблицы будем действовать следующим образом: <ol> <li>Для каждого ребра <tex>I \xrightarrow{\text{X}} J </tex> (из состояния <tex>I</tex> в состояние <tex>J</tex> по <tex>X</tex>) мы поместим в позицию <tex>T[I,X]</tex>*<tex>s(J)</tex> (сокр. от ''shift''), если <tex>X</tex> {{-~~анализатор принимает решение о своих действиях только на основании содержимого магазина~~--}} терминал,*<tex>J</tex>, если <tex>X</tex> {{---}} нетерминал.</li> <li>Для состояния <tex>I</tex>, содержащего ситуацию <tex>[A\to w \cdot]</tex> в позицию <tex>T[I, Y]</tex> для каждого терминала <tex>Y</tex>* Поместим <tex>r(n)</tex> (сокр. от ''reduce''), ~~не учитывая символы входной цепочки~~где <tex>n</tex> {{---}} это номер правила в изначальной грамматике.</li>* Запись <tex>r(0)</tex> означает допуск. <li>Пустая ячейка означает ошибочную ситуацию. </li></ol> == Пример ==Для иллюстрации ~~построения таблиц~~ алгоритма LR(0)-~~анализатора~~ разборщика мы будем использовать грамматику:

<tex>

</tex>

Обратим внимание, что данная грамматика является [[Устранение левой рекурсии|леворекурсивной]], поэтому нисходящий разборщик не сможет осуществить разбор слова из этой грамматики.=== Пополнение грамматики=== Для начала переходим к ''~~Пополненной~~ пополненной грамматике'':

<tex>

T \to (E) \\

</tex>

~~{{Определение~~

~~|id=def_LRk_item)~~

~~|definition=~~

Пусть <tex>\Gamma =\langle \Sigma, N, S, P \rangle</tex> {{---}} КС-грамматика и <tex>A \to w_1 w_2 \in P</tex>. Композицию <tex>[A \to w_1 \cdot w_2, u] </tex>, где <tex>u \in \Sigma^{k}</tex>, назовем '''LR(k)-ситуацией''' (англ. ''LR(k)-item'')

}}

LR(0)-ситуации не должны содержать терминальной цепочки, так как <tex>k=0</tex>, то есть мы можем записывать их следующим образом: <tex>[A \to w_1 \cdot w_2]</tex>

==== Построение автомата ====~~В начале работы магазин пуст, и указатель входной цепочки находится перед ее первым символом. Этому~~ <tex>0</tex> состоянию будет соответствует ситуация <tex>[E_0 \to \cdot E]</tex>. ~~Для терминалов или нетерминалой, мы строим переходы к другим ситуациям по следующей схеме~~Добавляем остальные состояния и получаем следующий [[Недетерминированные конечные автоматы|НКА]]:

~~<tex>{~~[~~} A \to \alpha \cdot c \beta~~[Файл:eps-dfa.png|600px] ~~\xrightarrow{\text{c}} {[} A \to \alpha c \cdot \beta~~] ~~</tex>~~

~~<tex>~~На картинке в двойной рамке обозначены терминальные состояния {~~[} A \to \alpha \cdot B \beta] \xrightarrow{\text~~{B}---} {[} ~~A \to \alpha B \cdot \beta] </tex>~~это такие состояния, из которых можно производить свертку по правилу грамматики, а из остальных возможен только перенос. Этот термин не используется в алгоритме, а нужен только для лучшего визуального восприятия.

Теперь в одно состояние перемещаем все ситуации, в которые идут <tex>~~{[} A \to \alpha \cdot B \beta] \xrightarrow{~~\varepsilon~~} {[} B \to \cdot \gamma]~~ </tex> ~~Получаем следующий [[Недетерминированные конечные автоматы|НКА]]:~~ ~~[[Файл:eps~~-~~dfa~~переходы.~~png|600px]]~~ ~~Избавимся от <tex>\varepsilon</tex>-переходов и получим~~ Получаем [[Детерминированные конечные автоматы|ДКА]]:

[[Файл:LRk_dfa.png|600px]]

===~~= Управляющая таблица =~~Заполнение управляющей таблицы === ~~Теперь можно построить управляющую таблицу.~~ ~~Поступим следующим образом:~~ ~~1. для каждого ребра <tex>I \xrightarrow{\text{X}} J </tex> мы поместим в позицию <tex>[I,X]</tex> таблицы~~ * <tex>s\ J</tex> (сокр. от ''shift'') , если <tex>X</tex> {{---}} терминал,*<tex>J</tex>, если <tex>X</tex> {{---}} нетерминал. 2. для состояния, содержащего ситуацию <tex>[A\to w \cdot]</tex>, поместим <tex>r(n)</tex> (сокр. от ''reduce'') в позицию <tex>[I, Y]</tex> для каждого терминала <tex>Y</tex>, где <tex>n</tex> {{---}} это номер правила в изначальной грамматике. ~~3. пустая ячейка означает ошибочную ситуацию.~~

~~Вспомним грамматику и пронумеруем~~ Пронумеруем правила для ~~2 пункта~~выполнения ''свертки'':

<tex>

|style="background-color:#FFF;padding:2px 20px"| <tex>1</tex>

|style="background-color:#FFF;padding:2px 20px"| <tex>2</tex>

|style="background-color:#FFF;padding:2px 20px"| <tex>s3s(3)</tex>