Алгоритм Эрли — различия между версиями
Gaporf (обсуждение | вклад)  (→Алгоритм Эрли)  | 
				м (rollbackEdits.php mass rollback)  | 
				||
| (не показано 6 промежуточных версий 2 участников) | |||
| Строка 7: | Строка 7: | ||
{{Определение  | {{Определение  | ||
|definition =  | |definition =  | ||
| − | Пусть <tex>G = \langle N, \Sigma, P, S \rangle</tex> {{---}} [[Контекстно-свободные грамматики, вывод, лево- и правосторонний вывод, дерево разбора|контекстно-свободная]] грамматика и <tex>w = w_0 w_1   | + | Пусть <tex>G = \langle N, \Sigma, P, S \rangle</tex> {{---}} [[Контекстно-свободные грамматики, вывод, лево- и правосторонний вывод, дерево разбора|контекстно-свободная]] грамматика и <tex>w = w_0 w_1 \ldots w_{n-1}</tex> {{---}} входная цепочка из <tex>\Sigma^*</tex>.  | 
Объект вида <tex>[A \rightarrow \alpha \cdot \beta, i]</tex>, где <tex>A \rightarrow \alpha \beta </tex> — правило из <tex>P</tex> и <tex>0 \leqslant i \leqslant n</tex> — позиция в <tex>w</tex>, называется '''ситуацией''', относящейся к цепочке <tex>w</tex>, где '''<tex> \cdot </tex>''' {{---}} вспомогательный символ, который не явлется терминалом или нетерминалом ( <tex> \cdot \notin \Sigma \cup N</tex>).  | Объект вида <tex>[A \rightarrow \alpha \cdot \beta, i]</tex>, где <tex>A \rightarrow \alpha \beta </tex> — правило из <tex>P</tex> и <tex>0 \leqslant i \leqslant n</tex> — позиция в <tex>w</tex>, называется '''ситуацией''', относящейся к цепочке <tex>w</tex>, где '''<tex> \cdot </tex>''' {{---}} вспомогательный символ, который не явлется терминалом или нетерминалом ( <tex> \cdot \notin \Sigma \cup N</tex>).  | ||
}}  | }}  | ||
| Строка 13: | Строка 13: | ||
{{Определение  | {{Определение  | ||
|definition =  | |definition =  | ||
| − | Ситуации хранятся в множествах <tex>D_0,  | + | Ситуации хранятся в множествах <tex>D_0, \ldots ,D_{n-1}</tex>, называемых '''списками ситуаций'''. Причем наличие ситуации <tex>[A \rightarrow \alpha \cdot \beta , i]</tex> в <tex>j</tex>-м списке ситуаций <tex>D_j</tex> равносильно тому, что    | 
| − | <tex>\exists \delta \in \Sigma \cup N : ((S' \Rightarrow^* w_0  | + | <tex>\exists \delta \in \Sigma \cup N : ((S' \Rightarrow^* w_0 \ldots w_{i-1} A \delta) \wedge A \Rightarrow^* w_i \ldots w_{j-1})</tex>.  | 
}}  | }}  | ||
{{Определение  | {{Определение  | ||
|definition =  | |definition =  | ||
| − | Последовательность списков ситуаций <tex>D_0, D_1,   | + | Последовательность списков ситуаций <tex>D_0, D_1, \ldots, D_{n-1} \ </tex> называется <b>списком разбора</b> для входной цепочки <tex>w</tex>.  | 
}}  | }}  | ||
| Строка 36: | Строка 36: | ||
    <font color=green>// Инициализация </font>  |     <font color=green>// Инициализация </font>  | ||
    <tex> D_{0} = \lbrace [S' \rightarrow \cdot \ S, 0] \rbrace </tex>  |     <tex> D_{0} = \lbrace [S' \rightarrow \cdot \ S, 0] \rbrace </tex>  | ||
| − |     '''for''' <tex>i = 1</tex> '''to''' <tex>len(w)   | + |     '''for''' <tex>i = 1</tex> '''to''' <tex>len(w)</tex>  | 
      <tex>D_i</tex> = <tex>\varnothing </tex>  |       <tex>D_i</tex> = <tex>\varnothing </tex>  | ||
    <font color=green>// Вычисление ситуаций </font>  |     <font color=green>// Вычисление ситуаций </font>  | ||
| − |     '''for''' <tex>j = 0</tex> '''to''' <tex>len(w)   | + |     '''for''' <tex>j = 0</tex> '''to''' <tex>len(w)</tex>  | 
      <tex>\mathtt{scan}(D, j, G, w)</tex>  |       <tex>\mathtt{scan}(D, j, G, w)</tex>  | ||
      '''while''' <tex>D_j</tex> изменяется  |       '''while''' <tex>D_j</tex> изменяется  | ||
| Строка 50: | Строка 50: | ||
      '''return''' ''false''       |       '''return''' ''false''       | ||
| − | + | ||
  '''function''' <tex>\mathtt{scan}(D, j, G, w)</tex>:  |   '''function''' <tex>\mathtt{scan}(D, j, G, w)</tex>:  | ||
    '''if''' <tex>j</tex> == <tex>0</tex>  |     '''if''' <tex>j</tex> == <tex>0</tex>  | ||
| Строка 56: | Строка 56: | ||
    '''for''' <tex>[A \rightarrow \alpha \cdot a \beta, i] \in D_{j - 1} </tex>  |     '''for''' <tex>[A \rightarrow \alpha \cdot a \beta, i] \in D_{j - 1} </tex>  | ||
      '''if''' <tex>a</tex> == <tex>w_{j - 1}</tex>  |       '''if''' <tex>a</tex> == <tex>w_{j - 1}</tex>  | ||
| − |         <tex>D_{j}</tex> <tex> \cup</tex>= <tex>[A \rightarrow \alpha \cdot   | + |         <tex>D_{j}</tex> <tex> \cup</tex>= <tex>[A \rightarrow \alpha a \cdot \beta, i]</tex>  | 
| − | + | ||
| − | |||
  '''function''' <tex>\mathtt{complete}(D, j, G, w)</tex>:  |   '''function''' <tex>\mathtt{complete}(D, j, G, w)</tex>:  | ||
    '''for''' <tex>[B \rightarrow \eta \ \cdot, i] \in D_{j} </tex>  |     '''for''' <tex>[B \rightarrow \eta \ \cdot, i] \in D_{j} </tex>  | ||
| − |       '''for''' <tex>[A \rightarrow \alpha \cdot B \beta,   | + |       '''for''' <tex>[A \rightarrow \alpha \cdot B \beta, j] \in D_{i} </tex>  | 
| − |         <tex>D_{j}</tex> <tex> \cup</tex>= <tex>[A \rightarrow \alpha B \cdot \beta,   | + |         <tex>D_{j}</tex> <tex> \cup</tex>= <tex>[A \rightarrow \alpha B \cdot \beta, j]</tex>  | 
| − | |||
  '''function''' <tex>\mathtt{predict}(D, j, G, w)</tex>:  |   '''function''' <tex>\mathtt{predict}(D, j, G, w)</tex>:  | ||
    '''for''' <tex>[A \rightarrow \alpha \cdot B \beta, i] \in D_{j} </tex>  |     '''for''' <tex>[A \rightarrow \alpha \cdot B \beta, i] \in D_{j} </tex>  | ||
| Строка 73: | Строка 71: | ||
{{Теорема  | {{Теорема  | ||
|statement = Приведенный алгоритм правильно строит все списки ситуаций.    | |statement = Приведенный алгоритм правильно строит все списки ситуаций.    | ||
| − | То есть алгоритм поддерживает инвариант <tex> [A \rightarrow \alpha \cdot \beta, i] \in D_{j} \Longleftrightarrow \exists \delta \in \Sigma \cup N : ((S' \Rightarrow^* w_0  | + | То есть алгоритм поддерживает инвариант <tex> [A \rightarrow \alpha \cdot \beta, i] \in D_{j} \Longleftrightarrow \exists \delta \in \Sigma \cup N : ((S' \Rightarrow^* w_0 \ldots w_{i-1} A \delta) \wedge A \Rightarrow^* w_i \ldots w_{j-1})</tex>  | 
|proof =  | |proof =  | ||
| Строка 80: | Строка 78: | ||
Докажем индукцией по исполнению алгоритма.<br/>  | Докажем индукцией по исполнению алгоритма.<br/>  | ||
<u> ''База  индукции:'' </u><br/>  | <u> ''База  индукции:'' </u><br/>  | ||
| − | <tex>[S' \rightarrow \cdot S, 0] \in D_0</tex>.<br/>  | + | <tex>[S' \rightarrow \cdot S, 0] \in D_0 \ </tex>.<br/>  | 
<u> ''Индукционный переход:'' </u> <br/>  | <u> ''Индукционный переход:'' </u> <br/>  | ||
Пусть предположение верно для всех списков ситуаций с номерами меньше <tex> j </tex>. Разберемся, в результате применения какого правила ситуация <tex> [A \rightarrow \alpha \cdot \beta, i] </tex> попала в <tex>D_{j}</tex><br/>  | Пусть предположение верно для всех списков ситуаций с номерами меньше <tex> j </tex>. Разберемся, в результате применения какого правила ситуация <tex> [A \rightarrow \alpha \cdot \beta, i] </tex> попала в <tex>D_{j}</tex><br/>  | ||
| − | 1. Включаем по правилу <tex> \mathtt{scan}</tex>.<br/>  | + | 1. Включаем по правилу <tex> \mathtt{scan} \ </tex>.<br/>  | 
Это произошло, если <tex> \alpha = \alpha ' a</tex>, <tex>a = w_{j-1}</tex> и <tex> [A \rightarrow \alpha ' \cdot a \beta, i] \in D_{j-1}</tex>.<br/>  | Это произошло, если <tex> \alpha = \alpha ' a</tex>, <tex>a = w_{j-1}</tex> и <tex> [A \rightarrow \alpha ' \cdot a \beta, i] \in D_{j-1}</tex>.<br/>  | ||
| − | По предположению индукции <tex>S' \Rightarrow^* w_0  | + | По предположению индукции <tex>S' \Rightarrow^* w_0 \ldots w_{i-1} A \delta</tex> и <tex>\alpha' \Rightarrow^* w_i \ldots w_{j-2}</tex>,<br/>    | 
| − | тогда в силу <tex>a = w_{j-1}</tex> получаем <tex>\alpha = \alpha ' a \Rightarrow^* w_i  | + | тогда в силу <tex>a = w_{j-1}</tex> получаем <tex>\alpha = \alpha ' a \Rightarrow^* w_i \ldots w_{j-2}w_{j-1} = w_i \ldots w_{j-1} \ </tex>.<br/>  | 
| − | Таким образом условия: <tex>S' \Rightarrow^* w_0  | + | Таким образом условия: <tex>S' \Rightarrow^* w_0 \ldots w_{i-1} A \delta</tex> и <tex>\alpha \Rightarrow^* w_i \ldots w_{j-1}</tex> выполняются.  | 
| − | 2. Включаем по правилу <tex> \mathtt{predict}</tex>.<br/>  | + | 2. Включаем по правилу <tex> \mathtt{predict} \ </tex>.<br/>  | 
По построению: <tex> \alpha = \varepsilon </tex> и <tex>i=j</tex>, что автоматически влечет второй пункт утверждения.<br/>  | По построению: <tex> \alpha = \varepsilon </tex> и <tex>i=j</tex>, что автоматически влечет второй пункт утверждения.<br/>  | ||
| − | Кроме того <tex>\exists  i' \le i</tex> и ситуация <tex>[A' \rightarrow \alpha ' \cdot A \delta ', i'] \in D_i</tex>, из чего по предположению индукции следует <tex>S' \Rightarrow^* w_0  | + | Кроме того <tex>\exists  i' \le i</tex> и ситуация <tex>[A' \rightarrow \alpha ' \cdot A \delta ', i'] \in D_i</tex>, из чего по предположению индукции следует <tex>S' \Rightarrow^* w_0 \ldots w_{i'-1} A' \delta ''</tex>    | 
| − | и <tex> \alpha ' \Rightarrow^* w_{i'}  | + | и <tex> \alpha ' \Rightarrow^* w_{i'} \ldots w_{i-1}</tex>.<br/>  | 
| − | Получаем, что <tex>S' \Rightarrow^* w_0  | + | Получаем, что <tex>S' \Rightarrow^* w_0 \ldots w_{i'-1} A' \delta ''</tex>, значит <tex>S \Rightarrow^* w_0 \ldots w_{i'-1} \alpha' A \delta' \delta '' </tex>, следовательно <tex> S' \Rightarrow^* w_0 \ldots w_{i'-1} w_{i'} \ldots w_{i-1} A \delta' \delta ''  | 
| − | </tex>, в итоге <tex> S' \Rightarrow^* w_0  | + | </tex>, в итоге <tex> S' \Rightarrow^* w_0 \ldots w_{i-1} A \delta</tex>, что нам и требовалось.  | 
| − | 3. Включаем по правилу <tex> \mathtt{complete}</tex>.<br/>  | + | 3. Включаем по правилу <tex> \mathtt{complete} \ </tex>.<br/>  | 
По построению: <tex> \alpha = \alpha ' A' </tex> и <tex>\exists i', \delta : [A \rightarrow \alpha ' \cdot A' \beta, i] \in D_{i'} \wedge [A' \rightarrow \eta \cdot, i'] \in D_j</tex>.<br/>  | По построению: <tex> \alpha = \alpha ' A' </tex> и <tex>\exists i', \delta : [A \rightarrow \alpha ' \cdot A' \beta, i] \in D_{i'} \wedge [A' \rightarrow \eta \cdot, i'] \in D_j</tex>.<br/>  | ||
| − | Cледовательно <tex>\alpha = \alpha ' A' \Rightarrow^* w_i  | + | Cледовательно <tex>\alpha = \alpha ' A' \Rightarrow^* w_i \ldots w_{i'-1} w_{i'} \ldots w_{j} = w_i \ldots w_{j-1}</tex>, что дает нам второй пункт утверждения, а так как первый пункт следует из индукционного предположения, все хорошо.  | 
<b><tex>\Longleftarrow</tex></b><br/>  | <b><tex>\Longleftarrow</tex></b><br/>  | ||
| − | В обратную сторону будем доказывать индукцией по суммарной длине вывода  <tex>w_0  | + | В обратную сторону будем доказывать индукцией по суммарной длине вывода  <tex>w_0 \ldots w_{i-1} A \delta \ </tex> из <tex>S'</tex> и  <tex>w_i \ldots w_{j-1}</tex> из <tex>\alpha</tex>. После чего применим  | 
| − | индукцию по длине вывода <tex>w_i  | + | индукцию по длине вывода <tex>w_i \ldots w_{j-1}</tex> из <tex>\alpha</tex>.<br/>  | 
Рассмотрим три случая последнего символа <tex>\alpha</tex>:  | Рассмотрим три случая последнего символа <tex>\alpha</tex>:  | ||
| − | 1. <tex>\alpha = \alpha ' a</tex>, тогда <tex>a = w_{j-1}</tex> и <tex>\alpha ' \Rightarrow^* w_i  | + | 1. <tex>\alpha = \alpha ' a</tex>, тогда <tex>a = w_{j-1}</tex> и <tex>\alpha ' \Rightarrow^* w_i \ldots w_{j-2}</tex>.<br/>  | 
По предположению индукции: <tex>[A \rightarrow \alpha ' \cdot a \beta, i] \in D_{j-1}</tex>, а отсюда по правилу <tex> \mathtt{scan}</tex> получаем <tex>[A \rightarrow \alpha ' a \cdot \beta, i] \in D_{j}</tex>.  | По предположению индукции: <tex>[A \rightarrow \alpha ' \cdot a \beta, i] \in D_{j-1}</tex>, а отсюда по правилу <tex> \mathtt{scan}</tex> получаем <tex>[A \rightarrow \alpha ' a \cdot \beta, i] \in D_{j}</tex>.  | ||
| − | 2. <tex>\alpha = \alpha ' B</tex>, тогда <tex>\exists i' : \alpha ' \Rightarrow^* w_i  | + | 2. <tex>\alpha = \alpha ' B</tex>, тогда <tex>\exists i' : \alpha ' \Rightarrow^* w_i \ldots w_{i'-1} \wedge B ' \Rightarrow^* w_{i'} \ldots w_{j-1}</tex>.<br/>  | 
| − | Тогда имеем <tex>[A \rightarrow \alpha ' a \cdot  \beta, i] \in D_{j}</tex>. Также можно записать <tex>S' \Rightarrow^* w_0  | + | Тогда имеем <tex>[A \rightarrow \alpha ' a \cdot  \beta, i] \in D_{j}</tex>. Также можно записать <tex>S' \Rightarrow^* w_0 \ldots w_{i-1} A \delta</tex>, как <tex>S' \Rightarrow^* w_0 \ldots w_{i-1} w_i \ldots w_{i'-1}B \beta \delta</tex>,  | 
| − | а также <tex>B \rightarrow \eta \wedge \eta \rightarrow w_{i'}  | + | а также <tex>B \rightarrow \eta \wedge \eta \rightarrow w_{i'} \ldots w_{j-1}</tex>.<br/>  | 
| − | Применяя индукцию по второму параметру получим <tex>[B \rightarrow \eta \cdot, i'] \in D_j</tex>, откуда по правилу <tex> \mathtt{complete}</tex> получаем <tex>[A \rightarrow \alpha ' B \cdot \beta, i] \in D_{j}</tex>.  | + | Применяя индукцию по второму параметру получим <tex>[B \rightarrow \eta \cdot, i'] \in D_j \ </tex>, откуда по правилу <tex> \mathtt{complete}</tex> получаем <tex>[A \rightarrow \alpha ' B \cdot \beta, i] \in D_{j}</tex>.  | 
3. <tex>\alpha = \varepsilon </tex>, тогда <tex>i=j</tex>.<br/>    | 3. <tex>\alpha = \varepsilon </tex>, тогда <tex>i=j</tex>.<br/>    | ||
Тогда либо <tex>i = 0 \wedge A = S \wedge \delta = \varepsilon</tex>, что доказывает базу индукции,<br/>  | Тогда либо <tex>i = 0 \wedge A = S \wedge \delta = \varepsilon</tex>, что доказывает базу индукции,<br/>  | ||
| − | либо вывод можно записать в виде <tex>S' \Rightarrow^* w_0  | + | либо вывод можно записать в виде <tex>S' \Rightarrow^* w_0 \ldots w{i'-1}w_{i'} \ldots w{i-1} A \delta ' \delta '' = w_0 \ldots w_{i-1} A \delta \ </tex> для некоторого правила <tex>(A' \rightarrow w_{i'} \ldots w_{i-1} A \delta ') \in P</tex>. <br/>  | 
| − | Отсюда по предположению индукции <tex>[A' \rightarrow \cdot w_{i'}  | + | Отсюда по предположению индукции <tex>[A' \rightarrow \cdot w_{i'} \ldots w_{i-1} A \delta ', i'] \in D_{i'} \ </tex>,    | 
| − | что после нескольких применений правила <tex> \mathtt{scan}</tex> приводит к <tex>[A' \rightarrow w_{i'}  | + | что после нескольких применений правила <tex> \mathtt{scan}</tex> приводит к <tex>[A' \rightarrow w_{i'} \ldots w_{i-1} \cdot  A \delta ', i'] \in D_{i} \ </tex>,  | 
| − | после чего по правилу <tex> \mathtt{predict}</tex> получим <tex>[A \rightarrow \cdot \beta, i] \in D_{j}</tex>, что и требовалось.  | + | после чего по правилу <tex> \mathtt{predict} \ </tex> получим <tex>[A \rightarrow \cdot \beta, i] \in D_{j} \ </tex>, что и требовалось.  | 
}}  | }}  | ||
Текущая версия на 19:27, 4 сентября 2022
Содержание
Алгоритм Эрли позволяет определить, выводится ли данное слово в данной контекстно-свободной грамматике .
Вход: КС грамматика  и слово .
Выход: , если  выводится в ;  — иначе.
| Определение: | 
| Пусть — контекстно-свободная грамматика и — входная цепочка из . Объект вида , где — правило из и — позиция в , называется ситуацией, относящейся к цепочке , где — вспомогательный символ, который не явлется терминалом или нетерминалом ( ). | 
| Определение: | 
| Ситуации хранятся в множествах , называемых списками ситуаций. Причем наличие ситуации в -м списке ситуаций равносильно тому, что . | 
| Определение: | 
| Последовательность списков ситуаций называется списком разбора для входной цепочки . | 
Алгоритм Эрли
Чтобы воспользоваться леммой, необходимо найти для . Алгоритм Эрли является динамическим алгоритмом: он последовательно строит список разбора, причём при построении используются (то есть элементы списков с меньшими номерами и ситуации, содержащиеся в текущем списке на данный момент).
Алгоритм основывается на следующих трёх правилах:
- Если (где — -ый символ строки), то .
 - Если и , то .
 - Если и , то .
 
Псевдокод
Для простоты добавим новый стартовый вспомогательный нетерминал и правило .
function : // Инициализация for to = // Вычисление ситуаций for to while изменяется // Результат if return true else return false
function : if == return for if == =
function : for for =
function : for for =
Корректность алгоритма
| Теорема: | 
Приведенный алгоритм правильно строит все списки ситуаций. 
То есть алгоритм поддерживает инвариант   | 
| Доказательство: | 
| 
 
 1. Включаем по правилу . 2. Включаем по правилу . 3. Включаем по правилу . 
 1. , тогда  и . 2. , тогда . 3. , тогда .  | 
Пример
Построим список разбора для строки в грамматике со следующими правилами:
  | 
  | 
  | ||||||||||||||||||||||||||||||||||||||||||||||||||||
  | 
  | 
  | 
Так как , то .
См. также
- Алгоритм Кока-Янгера-Касами разбора грамматики в НФХ
 - Алгоритм Кока-Янгера-Касами, модификация для произвольной грамматики
 
Источники информации
- Алексей Сорокин — Алгоритм Эрли
 - Ахо А., Ульман Д.— Теория синтакcического анализа, перевода и компиляции. Том 1. Синтаксический анализ. Пер. с англ. — М.:«Мир», 1978. С. 358 — 364.