Изменения

← Предыдущая правка

LR(0)-разбор

2277 байт убрано, 19:33, 4 сентября 2022

м

rollbackEdits.php mass rollback

LR(0)-разборщик {{---}} это частный случай [[LR(k)-грамматики#LR-разборщик|LR(k)-разборщикa]]~~, заметим~~. Заметим, что в данном случае <tex>k=0</tex>, то есть решение о своих действиях принимается только на основании содержимого стека, ~~не учитывая~~ символы входной цепочкине учитываются.

== Построение автомата и управляющей таблицы ==

Как было сказано в статье про LR(k)-разборщик, управляющая программа одинакова для всех LR-анализаторов, а таблица и автомат изменяются от одного анализатора к другому.

=== Автомат ===

Каждое состояние автомата будет состоять из LR(0)-ситуации.

|id=def_LR0_item)

|definition=

Пусть <tex>\Gamma =\langle \Sigma, N, S, P \rangle</tex> {{---}} КС-грамматика и <tex>A \to w_1 w_2 \in P</tex>. Композицию <tex>[A \to w_1 \cdot w_2] </tex> назовем '''LR(0)-ситуацией''' (англ. ''LR(0)-item'').

}}

В начале работы стек пуст, и указатель входной цепочки находится перед ее первым символом. Этому состоянию соответствует ситуация <tex>[E_0 \to \cdot E]</tex>, где <tex>E_0</tex> {{---}} нетерминал, добавленный при пополнении грамматики, <tex>E</tex> {{---}} стартовый нетерминал. ~~Наховем~~ Назовем это состояние <tex>0</tex>. Входная цепочка может начинаться с любого терминального символа, с которого начинается правая часть любого правила с левой частью <tex>E</tex>. Построим соответствующий переходпо следующей схеме:

<tex>{[} A \to \alpha \cdot B \beta] \xrightarrow{\varepsilon} {[} B \to \cdot \gamma] </tex>

<tex>{[} A \to \alpha \cdot B \beta] \xrightarrow{\text{B}} {[} A \to \alpha B \cdot \beta] </tex>

Таким образом, мы определяем новые состояния, в ~~которое~~ которые автомат перейдет после переноса того или иного терминала или нетерминала.

~~Заметим~~Можно заметить, что хранить в каждом состоянии только по одной ситуации не имеет смысла, поэтому пусть в каждое стостояние будет представлять множество ситуаций. Для этого определим базовые операции <tex>closure (I)</tex> и <tex>goto (I, X)</tex>, где <tex>I</tex> – множество ситуаций, <tex>X</tex> – символ грамматики (терминал или нетерминал). Операция <tex>closure</tex> добавляет ситуации к множеству ситуаций, у которых точка стоит слева от нетерминала. Добавляются те ситуации, которые получаются из правил, в левой части которого находится этот нетерминалалгоритм LR-разбора похож на [[Алгоритм Эрли|алгоритм Эрли]].

~~{| border~~=~~"0"~~ ~~|align~~=~~"left" colspan~~=~~"4"| ~~[] '''closure''' (I)~~ ~~'''do'''~~ ~~'''for''' каждой ситуации [A <tex>\to</tex> w.Xv] из I~~ ~~'''for''' каждого правила грамматики X <tex>\to</tex> u~~ ~~I +~~Базовые операции == ~~[X <tex>\to</tex> .u] // Операция +~~= ~~добавляет элемент к множеству ~~ ~~'''while''' I изменилось~~ ~~'''return''' I~~ ~~|}

Заметим, что хранить в каждом состоянии только по одной ситуации не имеет смысла, поэтому пусть каждое состояние будет представлять множество ситуаций, а переходы {{---}} терминалы и нетерминалы. Для этого определим базовые операции <tex>closure (I)</tex> и <tex>goto (I, X)</tex>, где <tex>I</tex> {{---}} множество ситуаций, <tex>X</tex> {{---}} символ грамматики (терминал или нетерминал).

* Операция <tex>~~goto</tex> "переносит" точку после символа <tex>X~~closure</tex>добавляет ситуации к множеству ситуаций, у которых точка стоит слева от нетерминала. ~~Это означает переход~~ Добавляются те ситуации, которые получаются из ~~одного состояния~~ правил, в ~~другое под воздействием символа <tex>X</tex>~~левой части которых находится этот нетерминал.

~~{| border="0"~~ ~~|align="left" colspan="4"|~~* Операция <~~font size=2~~tex> ~~[] '''~~goto~~''' (I, X)~~ ~~J={}~~ <~~font color=green>~~ /~~/ {} обозначает пустое множество </font~~tex> ~~'''for''' каждой ситуации [A~~ "переносит" точку после символа <tex>~~\to~~X</tex> w.~~Xv]~~ Это означает переход из I ~~J += [A~~ одного состояния в другое под воздействием символа <tex> ~~\to~~ X</tex>wX.v] ~~'''return''' closure (J)~~|}

==== Построение автомата ==== Теперь обсудим алгоритм построения конечного автомата. Обозначим <tex>T</tex> множество состояний, <tex>E</tex> – {{---}} множество переходов.# Изначальное состояние содержит одно правило: <tex>E_0 \to E</tex>.# Для текущего состояния делаем операцию <tex>closure</tex>.# По всем возможный символам для каждой ситуации добавляем переходы, используя операцию <tex>goto</tex>.# Если множество <tex>T</tex> или <tex>E</tex> во втором или третьем пункте изменилось, возвращаемся ко второму шагу.

~~{| border~~=~~"0"~~ ~~|align~~=~~"left" colspan~~=~~"4"| ~~E, T '''build'''()~~ E = {} T = ~~{closure ([S' <tex>\to</tex> .S])}~~ ~~'''do'''~~ ~~'''for''' каждого состояния I из T~~ ~~'''for''' каждой ситуации [A <tex>\to</tex> w~~После построения автомата можно перейти к построению управляющей таблицы.~~Xv] из I~~ ~~J = goto(I, X)~~ ~~T += {J} // ко множеству состояний добавляется новое состояние ~~ E += (I <tex>\to</tex> J) // ко множеству ребер добавляется ребро, идущее из состояния I в состояние J. Этот переход осуществляется по символу X ~~'''while''' E или T изменились~~ ~~'''return''' E, T|}

~~Поскольку для символа~~ Обращение к таблице происходит следующим образом <tex>\$mathtt{T[state, token]}</tex> ~~операция~~ , где *<tex>~~goto(I ,~~ \$)mathtt{state}</tex> ~~не определена~~ {{---}} состояние автомата, ~~мы выполняем действие~~ *<tex>~~accept~~\mathtt{token}</tex>. ~~В итоге получился автомат.~~{{---}} входной символ;

~~=== Построение~~ В соответствии со [[LR(k)-грамматики#Управляющая программа анализатора |структурой]] управляющей таблицы ~~===После того, как автомат построен, перейдем к построению управляющей таблицы.~~ будем действовать следующим образом:

~~Обращение к таблице происходит слудующим образом~~ <ol> <li>Для каждого ребра <tex>I \xrightarrow{\~~mathtt~~text{X}} J </tex> (из состояния <tex>I</tex> в состояние <tex>J</tex> по <tex>X</tex>) мы поместим в позицию <tex>T[~~state~~I, ~~token~~X]}</tex>~~, где~~ *<tex>~~\mathtt{state}~~s(J)</tex> (сокр. от ''shift'') , если <tex>X</tex> {{---}} ~~состояние автомата~~терминал, *<tex>~~\mathtt{token}~~J</tex>, если <tex>X</tex> {{---}} ~~входной символ;~~ ~~В таблице информация имеет следующий вид:~~нетерминал.</li> ~~'''struct''' Cell~~ ~~enum:~~ ~~Shift~~ ~~Reduce~~ ~~Accept~~ <~~font color="green"~~li>Для состояния <tex>I</tex>, содержащего ситуацию <tex>[A\to w \cdot]</tex> в позицию <tex>T[I, Y]</ ~~допуск~~ tex> для каждого терминала <tex>Y</~~font~~tex> ~~Error~~ * Поместим <~~font color="green"~~tex>~~// ошибка~~r(n)</~~font~~tex> (сокр. от ''reduce'~~struct~~'~~'' Shift~~ ~~state: '''int'''~~ ), где <~~font color="green"~~tex>n</tex> {{---}} это номер правила в изначальной грамматике.</ ~~переход в стостояние state~~li>* Запись <tex>r(0)</~~font~~tex>означает допуск. ~~'''struct''' Reduce~~ ~~rule: '''int'''~~ <~~font color="green"~~li>Пустая ячейка означает ошибочную ситуацию.</~~/ свертка по правилу rule~~li></~~font~~ol>

== ~~Иллюстрация алгоритма~~ Пример ==

Для иллюстрации алгоритма LR(0)-разборщика мы будем использовать грамматику:

T \to (E) \\

</tex>

Обратим внимание, что данная грамматика является [[Устранение левой рекурсии|леворекурсивной]], поэтому нисходящий разборщик не сможет осуществить разбор слова из этой грамматики.

=== Пополнение грамматики===

Для начала переходим к ''~~Пополненной~~ пополненной грамматике'':

<tex>

=== Построение автомата ===

~~В начале работы стек пуст, и указатель входной цепочки находится перед ее первым символом. Этому~~ <tex>0</tex> состоянию будет соответствует ситуация <tex>[E_0 \to \cdot E]</tex>. ~~Для терминалов или нетерминалой, мы строим переходы к другим ситуациям по следующей схеме~~Добавляем остальные состояния и получаем следующий [[Недетерминированные конечные автоматы|НКА]]:

~~<tex>{~~[~~} A \to \alpha \cdot c \beta] \xrightarrow{\text{c}} {~~[~~} A \to \alpha c \cdot \beta] </tex>~~ ~~<tex>{[} A \to \alpha \cdot B \beta] \xrightarrow{\text{B}} {[} A \to \alpha B \cdot \beta] </tex>~~ ~~<tex>{[} A \to \alpha \cdot B \beta] \xrightarrow{\varepsilon} {[} B \to \cdot \gamma] </tex>~~ ~~Получаем следующий [[Недетерминированные конечные автоматы~~Файл:eps-dfa.png|~~НКА~~600px]]:

~~[[Файл:eps~~На картинке в двойной рамке обозначены терминальные состояния {{-~~dfa~~--}} это такие состояния, из которых можно производить свертку по правилу грамматики, а из остальных возможен только перенос. Этот термин не используется в алгоритме, а нужен только для лучшего визуального восприятия.~~png|600px]]~~

~~Избавимся от~~ Теперь в одно состояние перемещаем все ситуации, в которые идут <tex>\varepsilon</tex>-~~переходов и получим~~ переходы. Получаем [[Детерминированные конечные автоматы|ДКА]]:

[[Файл:LRk_dfa.png|600px]]

=== ~~Управляющая таблица~~ Заполнение управляющей таблицы === ~~Теперь можно построить управляющую таблицу.~~ ~~Поступим следующим образом:~~ ~~1. для каждого ребра <tex>I \xrightarrow{\text{X}} J </tex> мы поместим в позицию <tex>[I,X]</tex> таблицы~~ * <tex>s\ J</tex> (сокр. от ''shift'') , если <tex>X</tex> {{---}} терминал,*<tex>J</tex>, если <tex>X</tex> {{---}} нетерминал. 2. для состояния, содержащего ситуацию <tex>[A\to w \cdot]</tex>, поместим <tex>r(n)</tex> (сокр. от ''reduce'') в позицию <tex>[I, Y]</tex> для каждого терминала <tex>Y</tex>, где <tex>n</tex> {{---}} это номер правила в изначальной грамматике. ~~3. пустая ячейка означает ошибочную ситуацию.~~

~~Вспомним грамматику и пронумеруем~~ Пронумеруем правила для ~~2 пункта~~выполнения ''свертки'':

<tex>

|style="background-color:#FFF;padding:2px 20px"| <tex>1</tex>

|style="background-color:#FFF;padding:2px 20px"| <tex>2</tex>

|style="background-color:#FFF;padding:2px 20px"| <tex>s3s(3)</tex>