Изменения

Перейти к: навигация, поиск

Алгоритм Эрли

44 байта добавлено, 19:27, 4 сентября 2022
м
rollbackEdits.php mass rollback
__TOC__
'''Алгоритм Эрли''' позволяет определить, выводится ли данное слово <tex>w</tex> в данной [[Контекстно-свободные грамматики, вывод, лево- и правосторонний вывод, дерево разбора|контекстно-свободной]] грамматике <tex>G</tex>.
'''Выход:''' <tex>true</tex>, если <tex>w</tex> выводится в <tex>G</tex>; <tex>false</tex> — иначе.
==Определения==
{{Определение
|definition =
Пусть <tex>G = \langle N, \Sigma, P, S \rangle</tex> {{---}} [[Контекстно-свободные грамматики, вывод, лево- и правосторонний вывод, дерево разбора|контекстно-свободная]] грамматика и <tex>w = w_0 w_1 ... \ldots w_{n-1}</tex> {{---}} входная цепочка из <tex>\Sigma^*</tex>.
Объект вида <tex>[A \rightarrow \alpha \cdot \beta, i]</tex>, где <tex>A \rightarrow \alpha \beta </tex> — правило из <tex>P</tex> и <tex>0 \leqslant i \leqslant n</tex> — позиция в <tex>w</tex>, называется '''ситуацией''', относящейся к цепочке <tex>w</tex>, где '''<tex> \cdot </tex>''' {{---}} вспомогательный символ, который не явлется терминалом или нетерминалом ( <tex> \cdot \notin \Sigma \cup N</tex>).
}}
{{Определение
|definition =
Ситуации хранятся в множествах <tex>D_0,...\ldots ,D_{n-1}</tex>, называемых '''списками ситуаций'''. Причем наличие ситуации <tex>[A \rightarrow \alpha \cdot \beta , i]</tex> в <tex>j</tex>-м списке ситуаций <tex>D_j</tex> равносильно тому, что <tex>\exists \delta \in \Sigma \cup N : ((S' \Rightarrow^* w_0...\ldots w_{i-1} A \delta) \wedge A \Rightarrow^* w_i...\ldots w_{j-1})</tex>.
}}
{{Определение
|definition =
Последовательность списков ситуаций <tex>D_0, D_1, ..\ldots, D_{n-1}\ </tex> называется <b>списком разбора</b> для входной цепочки <tex>w</tex>.
}}
Алгоритм основывается на следующих трёх правилах:
# Если <tex>[A \rightarrow \alpha \cdot w_{j} \beta, i] \in D_{j-1}</tex> (где <tex>w_j</tex> — <tex>j</tex>-ый символ строки), то <tex>[A \rightarrow \alpha w_{j} \cdot \beta, i] \in D_j</tex>.
# Если <tex>[B \rightarrow \eta \ \cdot, i] \in D_j</tex> и <tex>[A \rightarrow \alpha \cdot B \beta, k] \in D_i</tex>, то <tex>[A \rightarrow \alpha B \cdot \beta, k] \in D_j</tex>.# Если <tex>[A \rightarrow \alpha \ \cdot B \beta, i] \in D_{j} </tex> и <tex>(B \rightarrow \eta) \in P </tex>, то <tex>[B \rightarrow \cdot \ \eta, j] \in D_{j}</tex>.
=== Псевдокод ===
'''function''' <tex>\mathtt{earley}(G, w)</tex>:
<font color=green>// Инициализация </font>
<tex> D_{0} = \lbrace [S' \rightarrow \cdot \ S, 0] \rbrace </tex> '''for''' <tex>i = 1</tex> '''to''' <tex>len(w) - 1</tex>
<tex>D_i</tex> = <tex>\varnothing </tex>
<font color=green>// Вычисление ситуаций </font>
'''for''' <tex>j = 0</tex> '''to''' <tex>len(w) - 1</tex>
<tex>\mathtt{scan}(D, j, G, w)</tex>
'''while''' <tex>D_j</tex> изменяется
<tex>\mathtt{predict}(D, j, G, w)</tex>
<font color=green>// Результат </font>
'''if''' <tex>[S' \rightarrow S \ \cdot, 0] \in D_{len(w)} </tex>
'''return''' ''true''
'''else'''
'''return''' ''false''
<font color=green>// Первое правило </font>
'''function''' <tex>\mathtt{scan}(D, j, G, w)</tex>:
'''if''' <tex>j</tex> == <tex>0</tex>
'''for''' <tex>[A \rightarrow \alpha \cdot a \beta, i] \in D_{j - 1} </tex>
'''if''' <tex>a</tex> == <tex>w_{j - 1}</tex>
<tex>D_{j}</tex> <tex> \cup</tex>= <tex>[A \rightarrow \alpha a \cdot a \beta, i]</tex> <font color=green>// Второе правило </font>
'''function''' <tex>\mathtt{complete}(D, j, G, w)</tex>:
'''for''' <tex>[B \rightarrow \eta \ \cdot, i] \in D_{j} </tex> '''for''' <tex>[A \rightarrow \alpha \cdot B \beta, kj] \in D_{i} </tex> <tex>D_{j}</tex> <tex> \cup</tex>= <tex>[A \rightarrow \alpha B \cdot \beta, kj]</tex>
<font color=green>// Третье правило </font>
'''function''' <tex>\mathtt{predict}(D, j, G, w)</tex>:
'''for''' <tex>[A \rightarrow \alpha \cdot B \beta, i] \in D_{j} </tex>
'''for''' <tex>(B \rightarrow \eta) \in P </tex>
<tex>D_{j}</tex> <tex>\cup</tex>= <tex>[B \rightarrow \cdot \ \eta, j]</tex>
==Корректность алгоритма==
{{Теорема
|statement = Приведенный алгоритм правильно строит все списки ситуаций.
То есть алгоритм поддерживает инвариант <tex> [A \rightarrow \alpha \cdot \beta, i] \in D_{j} \Longleftrightarrow \exists \delta \in \Sigma \cup N : ((S' \Rightarrow^* w_0...\ldots w_{i-1} A \delta) \wedge A \Rightarrow^* w_i...\ldots w_{j-1})</tex>
|proof =
Докажем индукцией по исполнению алгоритма.<br/>
<u> ''База индукции:'' </u><br/>
<tex>[S' \rightarrow \cdot S, 0] \in D_0\ </tex>.<br/>
<u> ''Индукционный переход:'' </u> <br/>
Пусть предположение верно для всех списков ситуаций с номерами меньше <tex> j </tex>. Разберемся, в результате применения какого правила ситуация <tex> [A \rightarrow \alpha \cdot \beta, i] </tex> попала в <tex>D_{j}</tex><br/>
1. Включаем по правилу <tex> \mathtt{scan}\ </tex>.<br/>
Это произошло, если <tex> \alpha = \alpha ' a</tex>, <tex>a = w_{j-1}</tex> и <tex> [A \rightarrow \alpha ' \cdot a \beta, i] \in D_{j-1}</tex>.<br/>
По предположению индукции <tex>S' \Rightarrow^* w_0...\ldots w_{i-1} A \delta</tex> и <tex>\alpha' \Rightarrow^* w_i...\ldots w_{j-2}</tex>,<br/> тогда в силу <tex>a = w_{j-1}</tex> получаем <tex>\alpha = \alpha ' a \Rightarrow^* w_i...\ldots w_{j-2}w_{j-1} = w_i...\ldots w_{j-1}\ </tex>.<br/>Таким образом условия: <tex>S' \Rightarrow^* w_0...\ldots w_{i-1} A \delta</tex> и <tex>\alpha \Rightarrow^* w_i...\ldots w_{j-1}</tex> выполняются.
2. Включаем по правилу <tex> \mathtt{predict}\ </tex>.<br/>
По построению: <tex> \alpha = \varepsilon </tex> и <tex>i=j</tex>, что автоматически влечет второй пункт утверждения.<br/>
Кроме того <tex>\exists i' \le i</tex> и ситуация <tex>[A' \rightarrow \alpha ' \cdot A \delta ', i'] \in D_i</tex>, из чего по предположению индукции следует <tex>S' \Rightarrow^* w_0...\ldots w_{i'-1} A' \delta ''</tex> и <tex> \alpha ' \Rightarrow^* w_{i'}...\ldots w_{i-1}</tex>.<br/>Получаем, что <tex>S' \Rightarrow^* w_0...\ldots w_{i'-1} A' \delta ''</tex>, значит <tex>S \Rightarrow^* w_0...\ldots w_{i'-1} \alpha' A \delta' \delta '' </tex>, следовательно <tex> S' \Rightarrow^* w_0...\ldots w_{i'-1} w_{i'}...\ldots w_{i-1} A \delta' \delta ''</tex>, в итоге <tex> S' \Rightarrow^* w_0...\ldots w_{i-1} A \delta</tex>, что нам и требовалось.
3. Включаем по правилу <tex> \mathtt{complete}\ </tex>.<br/>
По построению: <tex> \alpha = \alpha ' A' </tex> и <tex>\exists i', \delta : [A \rightarrow \alpha ' \cdot A' \beta, i] \in D_{i'} \wedge [A' \rightarrow \eta \cdot, i'] \in D_j</tex>.<br/>
Cледовательно <tex>\alpha = \alpha ' A' \Rightarrow^* w_i...\ldots w_{i'-1} w_{i'}...\ldots w_{j} = w_i...\ldots w_{j-1}</tex>, что дает нам второй пункт утверждения, а так как первый пункт следует из индукционного предположения, все хорошо.
<b><tex>\Longleftarrow</tex></b><br/>
В обратную сторону будем доказывать индукцией по суммарной длине вывода <tex>w_0...\ldots w_{i-1} A \delta\ </tex> из <tex>S'</tex> и <tex>w_i...\ldots w_{j-1}</tex> из <tex>\alpha</tex>. После чего примениминдукцию по длине вывода <tex>w_i...\ldots w_{j-1}</tex> из <tex>\alpha</tex>.<br/>
Рассмотрим три случая последнего символа <tex>\alpha</tex>:
1. <tex>\alpha = \alpha ' a</tex>, тогда <tex>a = w_{j-1}</tex> и <tex>\alpha ' \Rightarrow^* w_i...\ldots w_{j-2}</tex>.<br/>
По предположению индукции: <tex>[A \rightarrow \alpha ' \cdot a \beta, i] \in D_{j-1}</tex>, а отсюда по правилу <tex> \mathtt{scan}</tex> получаем <tex>[A \rightarrow \alpha ' a \cdot \beta, i] \in D_{j}</tex>.
2. <tex>\alpha = \alpha ' B</tex>, тогда <tex>\exists i' : \alpha ' \Rightarrow^* w_i...\ldots w_{i'-1} \wedge B ' \Rightarrow^* w_{i'}...\ldots w_{j-1}</tex>.<br/>Тогда имеем <tex>[A \rightarrow \alpha ' a \cdot \beta, i] \in D_{j}</tex>. Также можно записать <tex>S' \Rightarrow^* w_0...\ldots w_{i-1} A \delta</tex>, как <tex>S' \Rightarrow^* w_0...\ldots w_{i-1} w_i...\ldots w_{i'-1}B \beta \delta</tex>,а также <tex>B \rightarrow \eta \wedge \eta \rightarrow w_{i'}...\ldots w_{j-1}</tex>.<br/>Применяя индукцию по второму параметру получим <tex>[B \rightarrow \eta \cdot, i'] \in D_j\ </tex>, откуда по правилу <tex> \mathtt{complete}</tex> получаем <tex>[A \rightarrow \alpha ' B \cdot \beta, i] \in D_{j}</tex>.
3. <tex>\alpha = \varepsilon </tex>, тогда <tex>i=j</tex>.<br/>
Тогда либо <tex>i = 0 \wedge A = S \wedge \delta = \varepsilon</tex>, что доказывает базу индукции,<br/>
либо вывод можно записать в виде <tex>S' \Rightarrow^* w_0...\ldots w{i'-1}w_{i'}...\ldots w{i-1} A \delta ' \delta '' = w_0...\ldots w_{i-1} A \delta\ </tex> для некоторого правила <tex>(A' \rightarrow w_{i'}...\ldots w_{i-1} A \delta ') \in P</tex>. <br/>Отсюда по предположению индукции <tex>[A' \rightarrow \cdot w_{i'}...\ldots w_{i-1} A \delta ', i'] \in D_{i'}\ </tex>, что после нескольких применений правила <tex> \mathtt{scan}</tex> приводит к <tex>[A' \rightarrow w_{i'}...\ldots w_{i-1} \cdot A \delta ', i'] \in D_{i}\ </tex>,после чего по правилу <tex> \mathtt{predict}\ </tex> получим <tex>[A \rightarrow \cdot \beta, i] \in D_{j}\ </tex>, что и требовалось.
}}
1632
правки

Навигация