Изменения

← Предыдущая правка

Алгоритм Эрли

9233 байта добавлено, 19:27, 4 сентября 2022

м

rollbackEdits.php mass rollback

__TOC__

'''Алгоритм Эрли''' позволяет определить, выводится ли данное слово <tex>w</tex> в данной [[Контекстно-свободные грамматики, вывод, лево- и правосторонний вывод, дерево разбора|контекстно-свободной]] грамматике <tex>G</tex>.

'''Вход:''' КС грамматика <tex> G=\langle N,\Sigma, P, S \rangle</tex> и слово <tex>w</tex>.

'''Выход:''' <tex>true</tex>, если <tex>w</tex> выводится в <tex>G</tex>; <tex>false</tex> — иначе.

{{Определение

|definition =

Пусть <tex>G = (\langle N, \Sigma, P, S)\rangle</tex> {{---}} [[Контекстно-свободные грамматики, вывод, лево- и правосторонний вывод, дерево разбора|контекстно -свободная ]] грамматика и <tex>w = w_0 w_1 \~~omega = a_1 a_2 ... a_n~~ldots w_{n-1}</tex> {{---}} входная цепочка из <tex>\Sigma^*</tex>.Объект вида <tex>[A \rightarrow ~~X_1 X_2 ... X_k~~ \alpha \cdot ~~X_{k+1} ... X_m~~\beta, i]~~</tex> назовем ситуацией, относящейся к цепочке <tex>\omega~~</tex>, ~~если~~ где <tex>A \rightarrow ~~X_1 ... X_m~~ \alpha \beta </tex> ~~{{---}}~~ — правило из <tex>P</tex> и <tex>0 \leqslant i \leqslant n</tex> — позиция в <tex>~~\omega~~w</tex>. , называется '''ситуацией''', относящейся к цепочке <tex>~~\cdot~~w</tex> ~~является метасимволом~~, ~~не принадлежащим ни~~ где '''<tex>N\cdot </tex>''' {{---}} вспомогательный символ, ни который не явлется терминалом или нетерминалом ( <tex>\cdot \notin \Sigma\cup N</tex>).

}}

{{Определение

|definition =

~~Для каждого~~ Ситуации хранятся в множествах <tex>0 D_0, \~~leqslant j \leqslant~~ ldots ,D_{n-1}</tex> ~~построим список~~ , называемых '''списками ситуаций~~ <tex>I_j</tex> такой, что~~ '''. Причем наличие ситуации <tex>[A \rightarrow \alpha \cdot \beta , i] ~~\in I_j~~</tex> ~~для~~ в <tex>~~0 \leqslant~~ j ~~\leqslant n~~</tex> ~~тогда и только тогда, когда для некоторых~~ -м списке ситуаций <tex>~~\gamma~~D_j</tex> и равносильно тому, что <tex>\exists \delta~~</tex> существуют выводы <tex>~~\in \Sigma \cup N : ((S ' \Rightarrow^* w_0 \~~gamma~~ ldots w_{i-1} A \delta, ) \~~gamma~~ wedge A \Rightarrow^* ~~a_1...a_i</tex> и <tex>\alpha~~ w_i \~~Rightarrow^* a_~~ldots w_{i+j-1} ~~... a_j~~)</tex>.

}}

{{Определение

|definition =

Последовательность списков ситуаций <tex>~~I_0~~D_0, ~~I_1~~D_1, ~~...~~\ldots, ~~I_n~~D_{n-1} \ </tex> называется списком разбора для входной цепочки <tex>~~\omega~~w</tex>.

}}

==Алгоритм Эрли==~~Построим список разбора для~~ Чтобы воспользоваться леммой, необходимо найти <tex>~~\omega~~D_n</tex>~~Строим~~ для <tex>~~I_0~~w</tex>. Алгоритм Эрли является [[Динамическое программирование|динамическим алгоритмом]]: он последовательно строит список разбора, причём при построении <brtex>~~Шаг 1.~~D_j</itex> ~~Если~~ используются <tex>S D_0, \~~rightarrow \alpha \in P~~ldots, D_{j}</tex>(то есть элементы списков с меньшими номерами и ситуации, ~~включить~~ содержащиеся в текущем списке на данный момент). Алгоритм основывается на следующих трёх правилах:# Если <tex>[S A \rightarrow \alpha \cdot w_{j} \~~alpha~~beta, 0i]\in D_{j-1}</tex> в (где <tex>~~I_0~~w_j</tex>~~. Пока можно включить новые ситуации в~~ — <tex>~~I_0~~j</tex> ~~повторяем шаги 2 и 3.~~-ый символ строки), то <brtex><[A \rightarrow \alpha w_{j} \cdot \beta, i~~>Шаг 2.~~] \in D_j</itex> .# Если <tex>[B \rightarrow \~~gamma~~ eta \ \cdot, 0i] \in ~~I_0~~D_j</tex>~~, включить в~~ и <tex>~~I_0~~[A \rightarrow \alpha \cdot B \beta, k] \in D_i</tex> ~~ситуацию~~ , то <tex>[A \rightarrow \alpha B \cdot \beta, 0k]\in D_j</tex> ~~для всех~~ .# Если <tex>[A \rightarrow \alpha \ \cdot B \beta, 0i]\in D_{j} </tex> из и <tex>~~I_0~~(B \rightarrow \eta) \in P </tex>~~. Шаг 3. Для всех~~ , то <tex>[A B \rightarrow \~~alpha~~ cdot \~~cdot B~~ \~~beta~~eta, 0j] \in ~~I_0~~D_{j}</tex>~~, для всех~~ . === Псевдокод ===Для простоты добавим новый стартовый вспомогательный нетерминал <tex>~~\gamma~~S'</tex> ~~таких, что~~ и правило <tex>B (S' \rightarrow S)</tex>. '''function''' <tex>\~~gamma \in P~~mathtt{earley}(G, w)</tex> ~~включить~~ : // Инициализация <tex>D_{0} = \lbrace [B S' \rightarrow \cdot \~~gamma~~S, 0]\rbrace </tex> в '''for''' <tex>i = 1</tex> '''to''' <tex>len(w)</tex> <tex>D_i</tex> = <tex>~~I_0~~\varnothing </tex>. // Вычисление ситуаций <br/font>~~Построение~~ '''for''' <tex>j = 0</tex>~~I_j~~'''to''' <tex>len(w)</tex> по <tex>~~I_0~~\mathtt{scan}(D, ~~I_1~~j, ~~...~~G, I_w)</tex> '''while''' <tex>D_j</tex> изменяется <tex>\mathtt{complete}(D, j~~-1}~~, G, w)</tex>. <tex>\mathtt{predict}(D, j, G, w)<br/tex> <ifont color=green>~~Шаг 4.~~// Результат </ifont> ~~Для каждой ситуации~~ '''if''' <tex>[B S' \rightarrow S \~~alpha~~ \cdot ~~a_{j} \beta~~, i0] \in I_D_{~~j-1~~len(w)}</tex> '''return''' ''true'' '''else''' '''return''' ''false'' '''function''' <tex>\mathtt{scan}(D, j, G, w)</tex>~~a_j~~: '''if''' <tex>j</tex>~~— j-й символ в~~ == <tex>~~\omega~~0</tex> ~~включить~~ '''return''' '''for''' <tex>[B A \rightarrow \alpha a \cdot a \beta, i] \in D_{j - 1} </tex> в '''if''' <tex>~~I_j~~a</tex>.== <tex>w_{j - 1}<br/tex>~~Пока можно включить новые ситуации в~~ <tex>~~I_j~~D_{j}</tex> ~~повторяем шаги 5 и 6.~~<brtex>~~Шаг 5.~~\cup</itex> ~~Если~~ = <tex>[A \rightarrow \alpha a \cdot \beta, i] </tex> '''function''' <tex>\~~in I_j~~mathtt{complete}(D, j, G, w)</tex>~~, то для каждой ситуации~~ : '''for''' <tex>[B \rightarrow \~~gamma~~ eta \ \cdot ~~A \beta~~, ki] \in I_D_{ij}</tex> ~~включить~~ '''for''' <tex>[B A \rightarrow \~~gamma A~~ alpha \cdot B \beta, kj]\in D_{i} </tex> в <tex>~~I_j~~D_{j}</tex>.<brtex>~~Шаг 6.~~\cup</itex> ~~Для всех~~ = <tex>[A \rightarrow \alpha B \cdot B \beta, ij] ~~\in I_j~~</tex>~~, для всех~~ '''function''' <tex>\~~gamma~~mathtt{predict}(D, j, G, w)</tex> ~~таких, что~~ : '''for''' <tex>B [A \rightarrow \~~gamma~~ alpha \cdot B \beta, i] \in PD_{j} </tex> ~~включить~~ '''for''' <tex>[(B \rightarrow \~~cdot~~ eta) \~~gamma, j]~~in P </tex> в <tex>~~I_j~~D_{j}</tex>~~. Если~~ <tex>~~[S \rightarrow~~ \~~alpha \cdot, 0] \in I_n~~cup</tex>~~, то~~ = <tex>[B \~~omega~~ rightarrow \~~in L(G)~~ cdot \ \eta, j]</tex~~>.<br~~>

==Корректность алгоритма==

{{Теорема

|statement = Приведенный алгоритм правильно строит все списки ситуаций. То есть алгоритм поддерживает инвариант <tex>[A \rightarrow \alpha \cdot \beta, i] \in I_D_{j} \~~Leftrightarrow~~ Longleftrightarrow \~~alpha~~ exists \~~Rightarrow^* a_{i+1}...a_{j}</tex> и <tex>~~ delta \~~mathcal {9}~~ in \~~gamma </tex> и <tex>~~ Sigma \~~delta</tex> такие, что <tex>~~cup N : ((S ' \Rightarrow^* w_0 \~~gamma~~ ldots w_{i-1} A \delta~~</tex> и <tex>~~ ) \~~gamma~~ wedge A \Rightarrow^* ~~a_1...a_~~w_i \ldots w_{ij-1})</tex>

|proof =

*Необходимость <tex>\Longrightarrow</tex> Докажем индукцией по ~~индукции~~исполнению алгоритма. ''База индукции: ~~для любой ситуации из~~ '' <~~tex~~/u>~~I_0~~<br/~~tex~~> <tex>[S' \~~alpha~~ rightarrow \cdot S, 0] \Rightarrow^* in D_0 \~~varepsilon~~ </tex> ~~и <tex>S \Rightarrow^* \gamma A \delta~~ .<br/~~tex~~> ~~при~~ <~~tex~~u>~~\gamma = \varepsilon~~ ''Индукционный переход:'' </~~tex~~u>. ~~Индукционный переход (и.п.): пусть~~ Пусть предположение верно для всех списков ситуаций ~~из списков~~ с номерами меньше <tex> ~~I_{i}, i \leqslant~~ j </tex>. ~~Пусть включаем~~ Разберемся, в результате применения какого правила ситуация <tex>[A \rightarrow \alpha \cdot \beta, i] </tex> попала в <tex>I_D_{j}</tex>~~. Рассмотрим три случая:~~ *Пусть включаем 1. Включаем по правилу 4<tex> \mathtt{scan} \ </tex>. ~~Тогда~~ Это произошло, если <tex>\alpha = \alpha' a_a</tex>, <tex>a = w_{j-1} , </tex> и <tex> [A \rightarrow \alpha' \cdot ~~a_{j}~~ a \beta, i] \in I_D_{j-1}</tex>. По предположению индукции <tex>S' \Rightarrow^* w_0 \ldots w_{i-1} A \delta</tex> и~~.п.~~ <tex>\alpha' \Rightarrow^* a_w_i \ldots w_{j-2}</tex>, тогда в силу <tex>a = w_{j-1}</tex> получаем <tex>\alpha = \alpha ' a \Rightarrow^* w_i \ldots w_{j-2}w_{j-1} = w_i \ldots w_{j-1} \ </tex>. Таким образом условия: <tex>S' \Rightarrow^* w_0 \ldots w_{i+-1}~~...a_~~A \delta</tex> и <tex>\alpha \Rightarrow^* w_i \ldots w_{j-1} </tex> выполняются. 2. Включаем по правилу <tex> \mathtt{predict} \ </tex>. По построению: <tex> \alpha = \varepsilon </tex>и ~~существуют~~ <tex>i=j</tex>, что автоматически влечет второй пункт утверждения. Кроме того <tex>\~~gamma~~exists i'\le i</tex> и ситуация <tex>[A' \rightarrow \alpha ' \cdot A \delta' , i'] \in D_i</tex> ~~такие~~, ~~что~~ из чего по предположению индукции следует <tex>S ' \Rightarrow^* w_0 \~~gamma~~ldots w_{i' -1} A ' \delta', '</tex> и <tex> \alpha ' \~~gamma~~Rightarrow^* w_{i' ~~= a_1...a_~~} \ldots w_{i-1} </tex>. ~~Значит~~ Получаем, что <tex> S' \~~alpha =~~ Rightarrow^* w_0 \~~alpha~~ldots w_{i' ~~a_{j~~-1} A' \delta ''</tex>, значит <tex>S \Rightarrow^* a_w_0 \ldots w_{i+'-1}~~...a_{j}~~\alpha' A \delta' \delta '' </tex> ~~и при~~ , следовательно <tex>S' \~~gamma =~~ Rightarrow^* w_0 \~~gamma~~ldots w_{i'-1} w_{i', } \ldots w_{i-1} A \delta = ' \delta' '</tex> ~~для~~ , в итоге <tex>[A S' \~~rightarrow~~ Rightarrow^* w_0 \~~alpha~~ ldots w_{i-1} A \~~cdot \beta, i]~~delta</tex> ~~утверждение верно~~, что нам и требовалось.*Пусть включаем 3. Включаем по правилу 5<tex> \mathtt{complete} \ </tex>. ~~Тогда~~ По построению: <tex>\alpha = \alpha' B A' </tex> и <tex>\exists i', \delta : [A \rightarrow \alpha' \cdot B A' \beta, ki] \in I_D_{i'}~~</tex> и <tex>~~ \wedge [B A' \rightarrow \eta \cdot, i'] \in ~~I_{j}~~ D_j</tex>. ~~По и.п.~~ Cледовательно <tex>\alpha= \alpha ' A' \Rightarrow^* a_w_i \ldots w_{k+i'-1}~~...a_~~w_{i'} \ldots w_{j} = w_i \ldots w_{j-1}</tex>, что дает нам второй пункт утверждения, а так как первый пункт следует из индукционного предположения, все хорошо. <tex>\~~eta~~ Longleftarrow</tex> В обратную сторону будем доказывать индукцией по суммарной длине вывода <tex>w_0 \~~Rightarrow^* a_~~ldots w_{i+-1}A \delta \ </tex> из <tex>S'</tex> и <tex>w_i \ldots w_{j-1}</tex> из <tex>\alpha</tex>.~~..a_~~После чего примениминдукцию по длине вывода <tex>w_i \ldots w_{j-1} </tex>~~, откуда~~ из <tex>\alpha</tex>. Рассмотрим три случая последнего символа <tex>\alpha</tex>: 1. <tex>\alpha = \alpha' B a</tex>, тогда <tex>a = w_{j-1}</tex> и <tex>\alpha ' \Rightarrow^*a_w_i \ldots w_{~~k+1~~j-2}</tex>.~~..a_~~ По предположению индукции: <tex>[A \rightarrow \alpha ' \cdot a \beta, i] \in D_{j-1} </tex>~~. Также~~ , а отсюда по ~~и.п. существуют~~ правилу <tex> \mathtt{scan}</tex> получаем <tex>[A \~~gamma~~rightarrow \alpha 'a \cdot \beta, i] \in D_{j}</tex> и . 2. <tex>\~~delta~~alpha = \alpha ' B</tex> ~~такие~~, ~~что~~ тогда <tex>S \exists i' : \alpha ' \Rightarrow^* w_i \~~gamma~~ldots w_{i' A -1} \~~delta~~wedge B ', \~~gamma~~Rightarrow^* w_{i' ~~= a_1...a_~~} \ldots w_{kj-1} </tex>. ~~Значит при~~ Тогда имеем <tex>[A \~~gamma =~~ rightarrow \~~gamma~~alpha 'a \cdot \beta, i] \in D_{j}</tex>. Также можно записать <tex>S' \Rightarrow^* w_0 \ldots w_{i-1} A \delta = </tex>, как <tex>S' \Rightarrow^* w_0 \ldots w_{i-1} w_i \ldots w_{i'-1}B \beta \delta' </tex> ~~для~~ ,а также <tex>[A B \rightarrow \~~alpha~~ eta \wedge \~~cdot~~ eta \~~beta,~~ rightarrow w_{i]'} \ldots w_{j-1}</tex> ~~утверждение верно~~.*Пусть включаем по правилу 6 ~~Тогда~~ Применяя индукцию по второму параметру получим <tex>[B \~~alpha =~~ rightarrow \eta \~~varepsilon~~cdot, i ~~= j~~'] \in D_j \ </tex>, откуда по правилу <tex> \mathtt{complete}</tex> получаем <tex>[B A \rightarrow \alpha' B \cdot A \beta, ki] \in I_D_{j}</tex>. ~~По и.п~~ 3. <tex>\alpha' = \~~Rightarrow^* a_{k+1}...a_{i}~~varepsilon </tex> ~~и существуют~~ , тогда <tex>~~\gamma'~~i=j</tex> и . Тогда либо <tex>i = 0 \wedge A = S \wedge \delta' = \varepsilon</tex> ~~такие~~, что доказывает базу индукции, либо вывод можно записать в виде <tex>S ' \Rightarrow^* w_0 \~~gamma~~ldots w{i' B -1}w_{i'} \ldots w{i-1} A \delta', \~~gamma~~delta '' = ~~a_1...a_~~w_0 \ldots w_{i-1} A \delta \ </tex> для некоторого правила <tex>(A' \rightarrow w_{i'} \ldots w_{ki-1} A \delta ') \in P</tex>. ~~Значит при~~ Отсюда по предположению индукции <tex>[A' \~~gamma =~~ rightarrow \~~gamma~~cdot w_{i' } \ldots w_{i-1} A \~~alpha~~delta ', i'] \~~delta =~~ in D_{i'} \~~beta~~ </tex>, что после нескольких применений правила <tex> \~~delta'~~ mathtt{scan}</tex> ~~выполнено~~ приводит к <tex> S [A' \rightarrow w_{i'} \Rightarrow^* ldots w_{i-1} \~~gamma~~ cdot A \delta', i'] \in D_{i} \ </tex>, ~~значит для~~ после чего по правилу <tex> \mathtt{predict} \ </tex> получим <tex>[A \rightarrow ~~\alpha~~ \cdot \beta, i]\in D_{j} \ </tex> ~~утверждение верно~~, что и требовалось.

}}

==~~Литература~~Пример==Построим список разбора для строки <tex>w = (a + a)</tex> в грамматике со следующими правилами:* <tex>S \rightarrow T + S</tex>* <tex>S \rightarrow T </tex>* <tex>T \rightarrow F * T</tex>* <tex>T \rightarrow F</tex>* <tex>F \rightarrow ( S )</tex>* <tex>F \rightarrow a</tex> {||-| {| class="wikitable"|-!<tex>D_0</tex>|-|{||-!Ситуация !! Из правила|-|<tex>[S' \rightarrow \cdot S, 0]</tex> || 0|-|<tex>[S \rightarrow \cdot T + S, 0]</tex> || 3|-|<tex>[S \rightarrow \cdot T, 0]</tex> || 3|-|<tex>[T \rightarrow \cdot F *T, 0]</tex> || 3|-|<tex>[T \rightarrow \cdot F, 0]</tex> || 3|-|<tex>[F \rightarrow \cdot ( S ), 0]</tex> || 3|-|<tex>[F \rightarrow \cdot a, 0]</tex> || 3|}|} || {| class="wikitable"|-!<tex>D_1</tex>|-|{||-!Ситуация !! Из правила|-|<tex>[F \rightarrow ( \cdot S ), 0]</tex> || 1|-|<tex>[S \rightarrow \cdot T + S, 1]</tex> || 3|-|<tex>[S \rightarrow \cdot T, 1]</tex> || 3|-|<tex>[T \rightarrow \cdot F * T, 1]</tex> || 3|-|<tex>[T \rightarrow \cdot F, 1]</tex> || 3|-|<tex>[F \rightarrow \cdot ( S ), 1]</tex> || 3|-|<tex>[F \rightarrow \cdot a, 1]</tex> || 3|}|} || {| class="wikitable"|-!<tex>D_2</tex>|-|{||-!Ситуация !! Из правила|-|<tex>[F \rightarrow a \cdot, 1]</tex> || 1|-|<tex>[T \rightarrow F \cdot * T, 1]</tex> || 2|-|<tex>[T \rightarrow F \cdot , 1]</tex> || 2|-|<tex>[S \rightarrow T \cdot , 1]</tex> || 2|-|<tex>[S \rightarrow T \cdot + S, 1]</tex> || 2|-|<tex>[F \rightarrow ( S \cdot ), 0]</tex> || 2|}|} |-| {| class="wikitable"|-!<tex>D_3</tex>|-|{||-!Ситуация !! Из правила|-|<tex>[S \rightarrow T + \cdot S, 1]</tex> || 1|-|<tex>[S \rightarrow \cdot T + S, 3]</tex> || 3|-|<tex>[S \rightarrow \cdot T, 3]</tex> || 3|-|<tex>[T \rightarrow \cdot F * T, 3]</tex> || 3|-|<tex>[T \rightarrow \cdot F, 3]</tex> || 3|-|<tex>[F \rightarrow \cdot ( S ), 3]</tex> || 3|-|<tex>[F \rightarrow \cdot a, 3]</tex> || 3|}|} || {| class="wikitable"|-!<tex>D_4</tex>|-|{||-!Ситуация !! Из правила|-|<tex>[F \rightarrow a \cdot , 3]</tex> || 1|-|<tex>[T \rightarrow F \cdot * T, 3]</tex> || 2|-|<tex>[T \rightarrow F \cdot , 3]</tex> || 2|-|<tex>[S \rightarrow T \cdot + S, 3]</tex> || 2|-|<tex>[S \rightarrow T \cdot , 3]</tex> || 2|-|<tex>[S \rightarrow T + S \cdot , 1]</tex> || 2|-|<tex>[F \rightarrow ( S \cdot ), 0]</tex> || 2|}|} || {| class="wikitable"|-!<tex>D_5</tex>|-|{||-!Ситуация !! Из правила|-|<tex>[F \rightarrow ( S )\cdot , 0]</tex> || 1|-|<tex>[T \rightarrow F \cdot * T, 0]</tex> || 2|-|<tex>[T \rightarrow F \cdot , 0]</tex> || 2|-|<tex>[S \rightarrow T \cdot + S, 0]</tex> || 2|-|<tex>[S \rightarrow T \cdot , 0]</tex> || 2|-|<tex>[S' \rightarrow S \cdot , 0]</tex> || 2|}|} |} Так как <tex>[S' \rightarrow S \cdot , 0] \in D_5</tex>, то <tex>w \in L(G) </tex>. ==См. также==* [[Алгоритм Кока-Янгера-Касами разбора грамматики в НФХ]]* [[Алгоритм Кока-Янгера-Касами, модификация для произвольной грамматики]] ==Источники информации==*[http://lpcs.math.msu.su/~sk/lehre/fivt2013/Earley.pdf Алексей Сорокин {{---}} Алгоритм Эрли]* Ахо А.~~Ахо~~, ~~Дж.~~ УльманД. {{---}} Теория синтакcического анализа, перевода и компиляции. Том 1. ~~Синтакcический~~ Синтаксический анализ.Пер. с англ. {{---}} М.:«Мир», 1978. С. 358 — 364. [[Категория: Теория формальных языков]][[Категория: Контекстно-свободные грамматики]][[Категория: Алгоритмы разбора]]

Maintenance script

1632

правки

Изменения

Алгоритм Эрли

Навигация

Персональные инструменты

Пространства имён

Варианты

Просмотры

Ещё

Поиск

Навигация

Инструменты