Изменения

Перейти к: навигация, поиск

Алгоритм Эрли

9233 байта добавлено, 19:27, 4 сентября 2022
м
rollbackEdits.php mass rollback
__TOC__
'''Алгоритм Эрли''' позволяет определить, выводится ли данное слово <tex>w</tex> в данной [[Контекстно-свободные грамматики, вывод, лево- и правосторонний вывод, дерево разбора|контекстно-свободной]] грамматике <tex>G</tex>.
 
'''Вход:''' КС грамматика <tex> G=\langle N,\Sigma, P, S \rangle</tex> и слово <tex>w</tex>.<br/>
'''Выход:''' <tex>true</tex>, если <tex>w</tex> выводится в <tex>G</tex>; <tex>false</tex> — иначе.
 
{{Определение
|definition =
Пусть <tex>G = (\langle N, \Sigma, P, S)\rangle</tex> {{---}} [[Контекстно-свободные грамматики, вывод, лево- и правосторонний вывод, дерево разбора|контекстно -свободная ]] грамматика и <tex>w = w_0 w_1 \omega = a_1 a_2 ... a_nldots w_{n-1}</tex> {{---}} входная цепочка из <tex>\Sigma^*</tex>.Объект вида <tex>[A \rightarrow X_1 X_2 ... X_k \alpha \cdot X_{k+1} ... X_m\beta, i]</tex> назовем <b>ситуацией</b>, относящейся к цепочке <tex>\omega</tex>, если где <tex>A \rightarrow X_1 ... X_m \alpha \beta </tex> {{---}} правило из <tex>P</tex> и <tex>0 \leqslant i \leqslant n</tex> — позиция в <tex>\omegaw</tex>. , называется '''ситуацией''', относящейся к цепочке <tex>\cdotw</tex> является метасимволом, не принадлежащим ни где '''<tex>N\cdot </tex>''' {{---}} вспомогательный символ, ни который не явлется терминалом или нетерминалом ( <tex>\cdot \notin \Sigma\cup N</tex>).
}}
{{Определение
|definition =
Для каждого Ситуации хранятся в множествах <tex>0 D_0, \leqslant j \leqslant ldots ,D_{n-1}</tex> построим <b>список , называемых '''списками ситуаций</b> <tex>I_j</tex> такой, что '''. Причем наличие ситуации <tex>[A \rightarrow \alpha \cdot \beta , i] \in I_j</tex> для в <tex>0 \leqslant j \leqslant n</tex> тогда и только тогда, когда для некоторых -м списке ситуаций <tex>\gammaD_j</tex> и равносильно тому, что <tex>\exists \delta</tex> существуют выводы <tex>\in \Sigma \cup N : ((S ' \Rightarrow^* w_0 \gamma ldots w_{i-1} A \delta, ) \gamma wedge A \Rightarrow^* a_1...a_i</tex> и <tex>\alpha w_i \Rightarrow^* a_ldots w_{i+j-1} ... a_j)</tex>.
}}
{{Определение
|definition =
Последовательность списков ситуаций <tex>I_0D_0, I_1D_1, ...\ldots, I_nD_{n-1} \ </tex> называется <b>списком разбора</b> для входной цепочки <tex>\omegaw</tex>.
}}
==Алгоритм Эрли==Построим список разбора для Чтобы воспользоваться леммой, необходимо найти <tex>\omegaD_n</tex>Строим для <tex>I_0w</tex>. Алгоритм Эрли является [[Динамическое программирование|динамическим алгоритмом]]: он последовательно строит список разбора, причём при построении <brtex><i>Шаг 1.D_j</itex> Если используются <tex>S D_0, \rightarrow \alpha \in Pldots, D_{j}</tex>(то есть элементы списков с меньшими номерами и ситуации, включить содержащиеся в текущем списке на данный момент). Алгоритм основывается на следующих трёх правилах:# Если <tex>[S A \rightarrow \alpha \cdot w_{j} \alphabeta, 0i]\in D_{j-1}</tex> в (где <tex>I_0w_j</tex>.<br>Пока можно включить новые ситуации в <tex>I_0j</tex> повторяем шаги 2 и 3.-ый символ строки), то <brtex><[A \rightarrow \alpha w_{j} \cdot \beta, i>Шаг 2.] \in D_j</itex> .# Если <tex>[B \rightarrow \gamma eta \ \cdot, 0i] \in I_0D_j</tex>, включить в и <tex>I_0[A \rightarrow \alpha \cdot B \beta, k] \in D_i</tex> ситуацию , то <tex>[A \rightarrow \alpha B \cdot \beta, 0k]\in D_j</tex> для всех .# Если <tex>[A \rightarrow \alpha \ \cdot B \beta, 0i]\in D_{j} </tex> из и <tex>I_0(B \rightarrow \eta) \in P </tex>.<br><i>Шаг 3.</i> Для всех , то <tex>[A B \rightarrow \alpha cdot \cdot B \betaeta, 0j] \in I_0D_{j}</tex>, для всех . === Псевдокод ===Для простоты добавим новый стартовый вспомогательный нетерминал <tex>\gammaS'</tex> таких, что и правило <tex>B (S' \rightarrow S)</tex>. '''function''' <tex>\gamma \in Pmathtt{earley}(G, w)</tex> включить : <font color=green>// Инициализация </font> <tex>D_{0} = \lbrace [B S' \rightarrow \cdot \gammaS, 0]\rbrace </tex> в '''for''' <tex>i = 1</tex> '''to''' <tex>len(w)</tex> <tex>D_i</tex> = <tex>I_0\varnothing </tex>. <font color=green>// Вычисление ситуаций <br/font>Построение '''for''' <tex>j = 0</tex>I_j'''to''' <tex>len(w)</tex> по <tex>I_0\mathtt{scan}(D, I_1j, ...G, I_w)</tex> '''while''' <tex>D_j</tex> изменяется <tex>\mathtt{complete}(D, j-1}, G, w)</tex>. <tex>\mathtt{predict}(D, j, G, w)<br/tex> <ifont color=green>Шаг 4.// Результат </ifont> Для каждой ситуации '''if''' <tex>[B S' \rightarrow S \alpha \cdot a_{j} \beta, i0] \in I_D_{j-1len(w)}</tex> '''return''' ''true'' '''else''' '''return''' ''false''    '''function''' <tex>\mathtt{scan}(D, j, G, w)</tex>a_j: '''if''' <tex>j</tex>— j-й символ в == <tex>\omega0</tex> включить '''return''' '''for''' <tex>[B A \rightarrow \alpha a \cdot a \beta, i] \in D_{j - 1} </tex> в '''if''' <tex>I_ja</tex>.== <tex>w_{j - 1}<br/tex>Пока можно включить новые ситуации в <tex>I_jD_{j}</tex> повторяем шаги 5 и 6.<brtex><i>Шаг 5.\cup</itex> Если = <tex>[A \rightarrow \alpha a \cdot \beta, i] </tex>  '''function''' <tex>\in I_jmathtt{complete}(D, j, G, w)</tex>, то для каждой ситуации : '''for''' <tex>[B \rightarrow \gamma eta \ \cdot A \beta, ki] \in I_D_{ij}</tex> включить '''for''' <tex>[B A \rightarrow \gamma A alpha \cdot B \beta, kj]\in D_{i} </tex> в <tex>I_jD_{j}</tex>.<brtex><i>Шаг 6.\cup</itex> Для всех = <tex>[A \rightarrow \alpha B \cdot B \beta, ij] \in I_j</tex>, для всех   '''function''' <tex>\gammamathtt{predict}(D, j, G, w)</tex> таких, что : '''for''' <tex>B [A \rightarrow \gamma alpha \cdot B \beta, i] \in PD_{j} </tex> включить '''for''' <tex>[(B \rightarrow \cdot eta) \gamma, j]in P </tex> в <tex>I_jD_{j}</tex>.<br>Если <tex>[S \rightarrow \alpha \cdot, 0] \in I_ncup</tex>, то = <tex>[B \omega rightarrow \in L(G) cdot \ \eta, j]</tex>.<br>
==Корректность алгоритма==
{{Теорема
|statement = Приведенный алгоритм правильно строит все списки ситуаций. То есть алгоритм поддерживает инвариант <tex>[A \rightarrow \alpha \cdot \beta, i] \in I_D_{j} \Leftrightarrow Longleftrightarrow \alpha exists \Rightarrow^* a_{i+1}...a_{j}</tex> и <tex> delta \mathcal {9} in \gamma </tex> и <tex> Sigma \delta</tex> такие, что <tex>cup N : ((S ' \Rightarrow^* w_0 \gamma ldots w_{i-1} A \delta</tex> и <tex> ) \gamma wedge A \Rightarrow^* a_1...a_w_i \ldots w_{ij-1})</tex>
|proof =
*Необходимость  <b><tex>\Longrightarrow</tex></b><br/>Докажем индукцией по индукцииисполнению алгоритма.<br/><u> ''База индукции: для любой ситуации из '' <tex/u>I_0<br/tex> <tex>[S' \alpha rightarrow \cdot S, 0] \Rightarrow^* in D_0 \varepsilon </tex> и <tex>S \Rightarrow^* \gamma A \delta .<br/tex> при <texu>\gamma = \varepsilon ''Индукционный переход:'' </texu>.<br/>Индукционный переход (и.п.): пусть Пусть предположение верно для всех списков ситуаций из списков с номерами меньше <tex> I_{i}, i \leqslant j </tex>. Пусть включаем Разберемся, в результате применения какого правила ситуация <tex>[A \rightarrow \alpha \cdot \beta, i] </tex> попала в <tex>I_D_{j}</tex>. Рассмотрим три случая:<br/>*Пусть включаем 1. Включаем по правилу 4<tex> \mathtt{scan} \ </tex>.<br/>Тогда Это произошло, если <tex>\alpha = \alpha' a_a</tex>, <tex>a = w_{j-1} , </tex> и <tex> [A \rightarrow \alpha' \cdot a_{j} a \beta, i] \in I_D_{j-1}</tex>. <br/>По предположению индукции <tex>S' \Rightarrow^* w_0 \ldots w_{i-1} A \delta</tex> и.п. <tex>\alpha' \Rightarrow^* a_w_i \ldots w_{j-2}</tex>,<br/> тогда в силу <tex>a = w_{j-1}</tex> получаем <tex>\alpha = \alpha ' a \Rightarrow^* w_i \ldots w_{j-2}w_{j-1} = w_i \ldots w_{j-1} \ </tex>.<br/>Таким образом условия: <tex>S' \Rightarrow^* w_0 \ldots w_{i+-1}...a_A \delta</tex> и <tex>\alpha \Rightarrow^* w_i \ldots w_{j-1} </tex> выполняются. 2. Включаем по правилу <tex> \mathtt{predict} \ </tex>.<br/>По построению: <tex> \alpha = \varepsilon </tex>и существуют <tex>i=j</tex>, что автоматически влечет второй пункт утверждения.<br/>Кроме того <tex>\gammaexists i'\le i</tex> и ситуация <tex>[A' \rightarrow \alpha ' \cdot A \delta' , i'] \in D_i</tex> такие, что из чего по предположению индукции следует <tex>S ' \Rightarrow^* w_0 \gammaldots w_{i' -1} A ' \delta', '</tex> и <tex> \alpha ' \gammaRightarrow^* w_{i' = a_1...a_} \ldots w_{i-1} </tex>. Значит <br/>Получаем, что <tex> S' \alpha = Rightarrow^* w_0 \alphaldots w_{i' a_{j-1} A' \delta ''</tex>, значит <tex>S \Rightarrow^* a_w_0 \ldots w_{i+'-1}...a_{j}\alpha' A \delta' \delta '' </tex> и при , следовательно <tex>S' \gamma = Rightarrow^* w_0 \gammaldots w_{i'-1} w_{i', } \ldots w_{i-1} A \delta ' \delta' '</tex> для , в итоге <tex>[A S' \rightarrow Rightarrow^* w_0 \alpha ldots w_{i-1} A \cdot \beta, i]delta</tex> утверждение верно, что нам и требовалось.*Пусть включаем 3. Включаем по правилу 5<tex> \mathtt{complete} \ </tex>.<br/>Тогда По построению: <tex>\alpha = \alpha' B A' </tex> и <tex>\exists i', \delta : [A \rightarrow \alpha' \cdot B A' \beta, ki] \in I_D_{i'}</tex> и <tex> \wedge [B A' \rightarrow \eta \cdot, i'] \in I_{j} D_j</tex>. По и.п. <br/>Cледовательно <tex>\alpha= \alpha ' A' \Rightarrow^* a_w_i \ldots w_{k+i'-1}...a_w_{i'} \ldots w_{j} = w_i \ldots w_{j-1}</tex>, что дает нам второй пункт утверждения, а так как первый пункт следует из индукционного предположения, все хорошо. <b><tex>\eta Longleftarrow</tex></b><br/>В обратную сторону будем доказывать индукцией по суммарной длине вывода <tex>w_0 \Rightarrow^* a_ldots w_{i+-1}A \delta \ </tex> из <tex>S'</tex> и <tex>w_i \ldots w_{j-1}</tex> из <tex>\alpha</tex>...a_После чего примениминдукцию по длине вывода <tex>w_i \ldots w_{j-1} </tex>, откуда из <tex>\alpha</tex>.<br/>Рассмотрим три случая последнего символа <tex>\alpha</tex>: 1. <tex>\alpha = \alpha' B a</tex>, тогда <tex>a = w_{j-1}</tex> и <tex>\alpha ' \Rightarrow^*a_w_i \ldots w_{k+1j-2}</tex>...a_<br/>По предположению индукции: <tex>[A \rightarrow \alpha ' \cdot a \beta, i] \in D_{j-1} </tex>. Также , а отсюда по и.п. существуют правилу <tex> \mathtt{scan}</tex> получаем <tex>[A \gammarightarrow \alpha 'a \cdot \beta, i] \in D_{j}</tex> и . 2. <tex>\deltaalpha = \alpha ' B</tex> такие, что тогда <tex>S \exists i' : \alpha ' \Rightarrow^* w_i \gammaldots w_{i' A -1} \deltawedge B ', \gammaRightarrow^* w_{i' = a_1...a_} \ldots w_{kj-1} </tex>. Значит при <br/>Тогда имеем <tex>[A \gamma = rightarrow \gammaalpha 'a \cdot \beta, i] \in D_{j}</tex>. Также можно записать <tex>S' \Rightarrow^* w_0 \ldots w_{i-1} A \delta </tex>, как <tex>S' \Rightarrow^* w_0 \ldots w_{i-1} w_i \ldots w_{i'-1}B \beta \delta' </tex> для ,а также <tex>[A B \rightarrow \alpha eta \wedge \cdot eta \beta, rightarrow w_{i]'} \ldots w_{j-1}</tex> утверждение верно.*Пусть включаем по правилу 6<br/>Тогда Применяя индукцию по второму параметру получим <tex>[B \alpha = rightarrow \eta \varepsiloncdot, i = j'] \in D_j \ </tex>, откуда по правилу <tex> \mathtt{complete}</tex> получаем <tex>[B A \rightarrow \alpha' B \cdot A \beta, ki] \in I_D_{j}</tex>. По и.п 3. <tex>\alpha' = \Rightarrow^* a_{k+1}...a_{i}varepsilon </tex> и существуют , тогда <tex>\gamma'i=j</tex> и .<br/> Тогда либо <tex>i = 0 \wedge A = S \wedge \delta' = \varepsilon</tex> такие, что доказывает базу индукции,<br/>либо вывод можно записать в виде <tex>S ' \Rightarrow^* w_0 \gammaldots w{i' B -1}w_{i'} \ldots w{i-1} A \delta', \gammadelta '' = a_1...a_w_0 \ldots w_{i-1} A \delta \ </tex> для некоторого правила <tex>(A' \rightarrow w_{i'} \ldots w_{ki-1} A \delta ') \in P</tex>. Значит при <br/>Отсюда по предположению индукции <tex>[A' \gamma = rightarrow \gammacdot w_{i' } \ldots w_{i-1} A \alphadelta ', i'] \delta = in D_{i'} \beta </tex>, что после нескольких применений правила <tex> \delta' mathtt{scan}</tex> выполнено приводит к <tex> S [A' \rightarrow w_{i'} \Rightarrow^* ldots w_{i-1} \gamma cdot A \delta', i'] \in D_{i} \ </tex>, значит для после чего по правилу <tex> \mathtt{predict} \ </tex> получим <tex>[A \rightarrow \alpha \cdot \beta, i]\in D_{j} \ </tex> утверждение верно, что и требовалось
}}
 ==ЛитератураПример==Построим список разбора для строки <tex>w = (a + a)</tex> в грамматике со следующими правилами:* <tex>S \rightarrow T + S</tex>* <tex>S \rightarrow T </tex>* <tex>T \rightarrow F * T</tex>* <tex>T \rightarrow F</tex>* <tex>F \rightarrow ( S )</tex>* <tex>F \rightarrow a</tex> {||-| {| class="wikitable"|-!<tex>D_0</tex>|-|{||-!Ситуация !! Из правила|-|<tex>[S' \rightarrow \cdot S, 0]</tex> || 0|-|<tex>[S \rightarrow \cdot T + S, 0]</tex> || 3|-|<tex>[S \rightarrow \cdot T, 0]</tex> || 3|-|<tex>[T \rightarrow \cdot F *T, 0]</tex> || 3|-|<tex>[T \rightarrow \cdot F, 0]</tex> || 3|-|<tex>[F \rightarrow \cdot ( S ), 0]</tex> || 3|-|<tex>[F \rightarrow \cdot a, 0]</tex> || 3|}|} || {| class="wikitable"|-!<tex>D_1</tex>|-|{||-!Ситуация !! Из правила|-|<tex>[F \rightarrow ( \cdot S ), 0]</tex> || 1|-|<tex>[S \rightarrow \cdot T + S, 1]</tex> || 3|-|<tex>[S \rightarrow \cdot T, 1]</tex> || 3|-|<tex>[T \rightarrow \cdot F * T, 1]</tex> || 3|-|<tex>[T \rightarrow \cdot F, 1]</tex> || 3|-|<tex>[F \rightarrow \cdot ( S ), 1]</tex> || 3|-|<tex>[F \rightarrow \cdot a, 1]</tex> || 3|}|} || {| class="wikitable"|-!<tex>D_2</tex>|-|{||-!Ситуация !! Из правила|-|<tex>[F \rightarrow a \cdot, 1]</tex> || 1|-|<tex>[T \rightarrow F \cdot * T, 1]</tex> || 2|-|<tex>[T \rightarrow F \cdot , 1]</tex> || 2|-|<tex>[S \rightarrow T \cdot , 1]</tex> || 2|-|<tex>[S \rightarrow T \cdot + S, 1]</tex> || 2|-|<tex>[F \rightarrow ( S \cdot ), 0]</tex> || 2|}|} |-| {| class="wikitable"|-!<tex>D_3</tex>|-|{||-!Ситуация !! Из правила|-|<tex>[S \rightarrow T + \cdot S, 1]</tex> || 1|-|<tex>[S \rightarrow \cdot T + S, 3]</tex> || 3|-|<tex>[S \rightarrow \cdot T, 3]</tex> || 3|-|<tex>[T \rightarrow \cdot F * T, 3]</tex> || 3|-|<tex>[T \rightarrow \cdot F, 3]</tex> || 3|-|<tex>[F \rightarrow \cdot ( S ), 3]</tex> || 3|-|<tex>[F \rightarrow \cdot a, 3]</tex> || 3|}|} || {| class="wikitable"|-!<tex>D_4</tex>|-|{||-!Ситуация !! Из правила|-|<tex>[F \rightarrow a \cdot , 3]</tex> || 1|-|<tex>[T \rightarrow F \cdot * T, 3]</tex> || 2|-|<tex>[T \rightarrow F \cdot , 3]</tex> || 2|-|<tex>[S \rightarrow T \cdot + S, 3]</tex> || 2|-|<tex>[S \rightarrow T \cdot , 3]</tex> || 2|-|<tex>[S \rightarrow T + S \cdot , 1]</tex> || 2|-|<tex>[F \rightarrow ( S \cdot ), 0]</tex> || 2|}|} || {| class="wikitable"|-!<tex>D_5</tex>|-|{||-!Ситуация !! Из правила|-|<tex>[F \rightarrow ( S )\cdot , 0]</tex> || 1|-|<tex>[T \rightarrow F \cdot * T, 0]</tex> || 2|-|<tex>[T \rightarrow F \cdot , 0]</tex> || 2|-|<tex>[S \rightarrow T \cdot + S, 0]</tex> || 2|-|<tex>[S \rightarrow T \cdot , 0]</tex> || 2|-|<tex>[S' \rightarrow S \cdot , 0]</tex> || 2|}|} |} Так как <tex>[S' \rightarrow S \cdot , 0] \in D_5</tex>, то <tex>w \in L(G) </tex>.<br> ==См. также==* [[Алгоритм Кока-Янгера-Касами разбора грамматики в НФХ]]* [[Алгоритм Кока-Янгера-Касами, модификация для произвольной грамматики]] ==Источники информации==*[http://lpcs.math.msu.su/~sk/lehre/fivt2013/Earley.pdf Алексей Сорокин {{---}} Алгоритм Эрли]* Ахо А.Ахо, Дж. УльманД. {{---}} Теория синтакcического анализа, перевода и компиляции. Том 1. Синтакcический Синтаксический анализ.Пер. с англ. {{---}} М.:«Мир», 1978. С. 358 — 364. [[Категория: Теория формальных языков]][[Категория: Контекстно-свободные грамматики]][[Категория: Алгоритмы разбора]]
1632
правки

Навигация