Участник:Shovkoplyas Grigory — различия между версиями

Версия 19:29, 18 января 2016

Алгоритм Эрли позволяет определить, выводится ли данное слово [math]w[/math] в данной контекстно-свободной грамматике [math]G[/math].

Вход: КС грамматика и слово [math]w[/math].
Выход: [math]true[/math], если [math]w[/math] выводится в [math]G[/math]; [math]false[/math] — иначе.

Содержание

1 Определения
2 Алгоритм Эрли
- 2.1 Псевдокод
3 Корректность алгоритма
- 3.1 [math]\Longrightarrow[/math]
- 3.2 [math]\Longleftarrow[/math]
4 Пример
5 Источники информации

Определения

Определение:

Пусть — контекстно-свободная грамматика и — входная цепочка из . Объект вида , где — правило из и — позиция в , называется ситуацией, относящейся к цепочке . [math] \cdot [/math] — вспомогательный символ, который не явлется терминалом или нетерминалом ( ).

Определение:

Ситуации хранятся в множествах D_0,...,D_{n-1}, называемых спиками ситуаций. Причем наличие ситуации в -м списком ситуаций равносильна тому, что

Определение:

Последовательность списков ситуаций называется списком разбора для входной цепочки .

Алгоритм Эрли

Чтобы воспользоваться леммой, необходимо найти [math]D_n[/math] для [math]w[/math]. Алгоритм Эрли является динамическим алгоритмом: он последовательно строит список разбора, причём при построении [math]D_j[/math] используются [math]D_0, \ldots, D_{j}[/math] (то есть элементы списков с меньшими номерами и ситуации, содержащиеся в текущем списке на данный момент).

Алгоритм основывается на следующих трёх правилах:

Если (где [math]w_j[/math] — [math]j[/math]-ый символ строки), то .
Если и , то .
Если и , то .

Псевдокод

Для простоты добавим новый стартовый вспомогательный нетерминал [math]S'[/math] и правило [math](S' \rightarrow S)[/math].

function [math]\mathtt{earley}(G, w)[/math]:
  // Инициализация 
  [math] D_{0} = \lbrace [S' \rightarrow \cdot S, 0] \rbrace [/math]
  for i = 1 to len(w) - 1
    [math]D_i[/math] = [math]\varnothing [/math]
  // Вычисление ситуаций 
  for j = 0 to len(w) - 1
    [math]\mathtt{scan}(D, j, G, w)[/math]
    while [math]D_j[/math] изменяется
      [math]\mathtt{complete}(D, j, G, w)[/math]
      [math]\mathtt{predict}(D, j, G, w)[/math]
  // Результат 
  if  [math][S' \rightarrow S \cdot, 0] \in D_{len(w)} [/math]
    return True
  else
    return False

// Первое правило 
function [math]\mathtt{scan}(D, j, G, w)[/math]:
  if [math]j[/math] == [math]0[/math]
    return
  for [math][A \rightarrow \alpha \cdot a \beta, i] \in D_{j - 1} [/math]
    if [math]a[/math] == [math]w_{j - 1}[/math]
      [math]D_{j}[/math] [math] \cup[/math]= [math][A \rightarrow \alpha \cdot a \beta, i][/math]

// Второе правило 
function [math]\mathtt{complete}(D, j, G, w)[/math]:
  for [math][B \rightarrow \eta \cdot, i] \in D_{j} [/math]
    for [math][A \rightarrow \alpha \cdot B \beta, k] \in D_{i} [/math]
      [math]D_{j}[/math] [math] \cup[/math]= [math][A \rightarrow \alpha B \cdot \beta, k][/math]

// Третье правило 
function [math]\mathtt{predict}(D, j, G, w)[/math]:
  for [math][A \rightarrow \alpha \cdot B \beta, i] \in D_{j} [/math]
    for [math](B \rightarrow \eta) \in P [/math]
      [math]D_{j}[/math] [math]\cup[/math]= [math][B \rightarrow \cdot \eta, j][/math]

Корректность алгоритма

Теорема:

Приведенный алгоритм правильно строит все списки ситуаций. То есть алгоритм поддерживает инвариант

Доказательство:

[math]\Longrightarrow[/math]

Докажем индукцией по исполнению алгоритма.
База — . Осталось разобраться, в результате применения какого правила ситуация попала в [math]D_{j}[/math]

1. Включаем по правилу [math] \mathtt{scan}[/math].
Это произошло, если [math] \alpha = \alpha ' a[/math], [math]a = w_{j-1}[/math] и .
По предположению индукции и ,
тогда в силу [math]a = w_{j-1}[/math] получаем .
Таким образом условия: и выполняются.

2. Включаем по правилу [math] \mathtt{predict}[/math].
По построению: [math] \alpha = \varepsilon [/math] и [math]i=j[/math], что автоматически влечет второй пункт утверждения.
Кроме того [math]\exists i' \le i[/math] и ситуация , из чего по предположению индукции следует и .
Получаем, что , значит , следовательно , в итоге , что нам и требовалось.

3. Включаем по правилу [math] \mathtt{complete}[/math].
По построению: [math] \alpha = \alpha ' A' [/math] и .
Cледовательно , что дает нам второй пункт утверждения, а так как первый пункт следует из индукционного предположения, все хорошо.

[math]\Longleftarrow[/math]

В обратную сторону будем доказывать индукцией по суммарной длине вывода [math]w_0...w_{i-1} A \delta[/math] из [math]S'[/math] и [math]w_i...w_{j-1}[/math] из [math]\alpha[/math]. После чего применим индукцию по длине вывода [math]w_i...w_{j-1}[/math] из [math]\alpha[/math].
Рассмотрим три случая последнего символа [math]\alpha[/math]:

1. [math]\alpha = \alpha ' a[/math], тогда [math]a = w_{j-1}[/math] и .
По предположению индукции: , а отсюда по правилу [math] \mathtt{scan}[/math] получаем .

2. [math]\alpha = \alpha ' B[/math], тогда .
Тогда имеем . Также можно записать , как , а также , откуда по правилу [math] \mathtt{complete}[/math] получаем .

3. [math]\alpha = \varepsilon [/math], тогда [math]i=j[/math].
Тогда либо , что доказывает базу индукции,
либо вывод можно записать в виде для некоторого правила .
Отсюда по предположению индукции , что после нескольких применений правила [math] \mathtt{scan}[/math] приводит к ,

после чего по правилу получим , что и требовалось.

Пример

Построим список разбора для строки [math]w = (a + a)[/math] в грамматике со следующими правилами:

[math]S \rightarrow T + S[/math];
[math]S \rightarrow T [/math];
[math]T \rightarrow F * T[/math];
[math]T \rightarrow F[/math];
[math]F \rightarrow ( S )[/math];
[math]F \rightarrow a[/math].

Ситуация	Из правила
	0
	3
[math][S \rightarrow \cdot T, 0][/math]	3
	3
[math][T \rightarrow \cdot F, 0][/math]	3
	3
[math][F \rightarrow \cdot a, 0][/math]	3

Ситуация	Из правила
	1
	3
[math][S \rightarrow \cdot T, 1][/math]	3
	3
[math][T \rightarrow \cdot F, 1][/math]	3
	3
[math][F \rightarrow \cdot a, 1][/math]	3

Ситуация	Из правила
[math][F \rightarrow a \cdot, 1][/math]	1
	2
	2
	2
	2
	2

Ситуация	Из правила
	1
	3
[math][S \rightarrow \cdot T, 3][/math]	3
	3
[math][T \rightarrow \cdot F, 3][/math]	3
	3
[math][F \rightarrow \cdot a, 3][/math]	3

Ситуация	Из правила
	1
	2
	2
	2
	2
	2
	2

Ситуация	Из правила
	1
	2
	2
	2
	2
	2

Так как , то [math]w \in L(G) [/math].

Источники информации

Алексей Сорокин — Алгоритм Эрли
Ахо А., Ульман Д.— Теория синтакcического анализа, перевода и компиляции. Том 1. Синтаксический анализ. Пер. с англ. — М.:«Мир», 1978. С. 358 — 364.

@@ Строка 7: / Строка 7: @@
 {{Определение
 |definition =
-Пусть <tex>G = \langle N, \Sigma, P, S \rangle</tex> {{---}} [[Контекстно-свободные грамматики, вывод, лево- и правосторонний вывод, дерево разбора|контекстно-свободная]] грамматика и <tex>w = w_1 w_2 ... w_n</tex> {{---}} входная цепочка из <tex>\Sigma^*</tex>.
+Пусть <tex>G = \langle N, \Sigma, P, S \rangle</tex> {{---}} [[Контекстно-свободные грамматики, вывод, лево- и правосторонний вывод, дерево разбора|контекстно-свободная]] грамматика и <tex>w = w_0 w_1 ... w_{n-1}</tex> {{---}} входная цепочка из <tex>\Sigma^*</tex>.
 Объект вида <tex>[A \rightarrow \alpha \cdot \beta, i]</tex>, где <tex>A \rightarrow \alpha \beta </tex> — правило из <tex>P</tex> и <tex>0 \leqslant i \leqslant n</tex> — позиция в <tex>w</tex>, называется '''ситуацией''', относящейся к цепочке <tex>w</tex>. '''<tex> \cdot </tex>''' {{---}} вспомогательный символ, который не явлется терминалом или нетерминалом ( <tex> \cdot \notin \Sigma \cup N</tex>).
 }}
@@ Строка 13: / Строка 13: @@
 {{Определение
 |definition =
-'''<tex>j</tex>-м списком ситуаций''' <tex>D_j</tex> для входной цепочки <tex>w = w_1 w_2 ... w_n</tex>, где <tex>0 \leqslant j \leqslant n</tex>, называется множество ситуаций <tex>\lbrace [A \rightarrow \alpha \cdot \beta , i] \mid \alpha \Rightarrow^* w_{i+1} ... w_j; \exists \gamma, \delta : S \Rightarrow^* \gamma A \delta, \gamma \Rightarrow^* w_1...w_i \rbrace</tex>. То есть <tex>\gamma \alpha </tex> выводит часть <tex>w</tex> c первого по <tex>j</tex>-й символ.
+Ситуации хранятся в множествах D_0,...,D_{n-1}, называемых спиками ситуаций. Причем наличие ситуации <tex>[A \rightarrow \alpha \cdot \beta , i]</tex> в <tex>j</tex>-м списком ситуаций <tex>D_j</tex> равносильна тому, что
-}}
+<tex>\exists \delta \in \Sigma \cup N : ((S' \Rightarrow^* w_0...w_{i-1} A \delta) \wedge A \Rightarrow^* w_i...w_{j-1})</tex>
-{{Лемма
-|statement = <tex>(\exists \alpha : [S \rightarrow \alpha \cdot, 0] \in D_n) \Leftrightarrow w \in L(G)</tex>.
-|proof = Поскольку <tex>S \Rightarrow^* \gamma S \delta</tex> (при <tex>\gamma = \delta = \varepsilon</tex>), из определения <tex>D_n</tex> получаем, что <tex>([S \rightarrow \alpha \cdot, 0] \in D_n) \Leftrightarrow (S \Rightarrow \alpha \Rightarrow^* w_1 ... w_n = w)</tex>.
 }}
 {{Определение
 |definition =
-Последовательность списков ситуаций <tex>D_0, D_1, .., D_n</tex> называется <b>списком разбора</b> для входной цепочки <tex>w</tex>.
+Последовательность списков ситуаций <tex>D_0, D_1, .., D_{n-1}</tex> называется <b>списком разбора</b> для входной цепочки <tex>w</tex>.
 }}

Участник:Shovkoplyas Grigory — различия между версиями

Версия 19:29, 18 января 2016

Содержание

Определения

Алгоритм Эрли

Псевдокод

Корректность алгоритма

[math]\Longrightarrow[/math]

[math]\Longleftarrow[/math]

Пример

Источники информации

Навигация

Персональные инструменты

Пространства имён

Варианты

Просмотры

Ещё

Поиск

Навигация

Инструменты