Алгоритм Эрли

Текущая версия на 19:27, 4 сентября 2022

Алгоритм Эрли позволяет определить, выводится ли данное слово [math]w[/math] в данной контекстно-свободной грамматике [math]G[/math].

Вход: КС грамматика и слово [math]w[/math].
Выход: [math]true[/math], если [math]w[/math] выводится в [math]G[/math]; [math]false[/math] — иначе.

Определение:

Пусть — контекстно-свободная грамматика и — входная цепочка из . Объект вида , где — правило из и — позиция в , называется ситуацией, относящейся к цепочке , где [math] \cdot [/math] — вспомогательный символ, который не явлется терминалом или нетерминалом ( ).

Определение:

Ситуации хранятся в множествах , называемых списками ситуаций. Причем наличие ситуации в -м списке ситуаций равносильно тому, что .

Определение:

Последовательность списков ситуаций называется списком разбора для входной цепочки .

Чтобы воспользоваться леммой, необходимо найти [math]D_n[/math] для [math]w[/math]. Алгоритм Эрли является динамическим алгоритмом: он последовательно строит список разбора, причём при построении [math]D_j[/math] используются [math]D_0, \ldots, D_{j}[/math] (то есть элементы списков с меньшими номерами и ситуации, содержащиеся в текущем списке на данный момент).

Алгоритм основывается на следующих трёх правилах:

Если (где [math]w_j[/math] — [math]j[/math]-ый символ строки), то .
Если и , то .
Если и , то .

Псевдокод

Для простоты добавим новый стартовый вспомогательный нетерминал [math]S'[/math] и правило [math](S' \rightarrow S)[/math].

function [math]\mathtt{earley}(G, w)[/math]:
  // Инициализация 
  [math] D_{0} = \lbrace [S' \rightarrow \cdot \ S, 0] \rbrace [/math]
  for [math]i = 1[/math] to [math]len(w)[/math]
    [math]D_i[/math] = [math]\varnothing [/math]
  // Вычисление ситуаций 
  for [math]j = 0[/math] to [math]len(w)[/math]
    [math]\mathtt{scan}(D, j, G, w)[/math]
    while [math]D_j[/math] изменяется
      [math]\mathtt{complete}(D, j, G, w)[/math]
      [math]\mathtt{predict}(D, j, G, w)[/math]
  // Результат 
  if  [math][S' \rightarrow S \ \cdot, 0] \in D_{len(w)} [/math]
    return true
  else
    return false

function [math]\mathtt{scan}(D, j, G, w)[/math]:
  if [math]j[/math] == [math]0[/math]
    return
  for [math][A \rightarrow \alpha \cdot a \beta, i] \in D_{j - 1} [/math]
    if [math]a[/math] == [math]w_{j - 1}[/math]
      [math]D_{j}[/math] [math] \cup[/math]= [math][A \rightarrow \alpha a \cdot \beta, i][/math]

function [math]\mathtt{complete}(D, j, G, w)[/math]:
  for [math][B \rightarrow \eta \ \cdot, i] \in D_{j} [/math]
    for [math][A \rightarrow \alpha \cdot B \beta, j] \in D_{i} [/math]
      [math]D_{j}[/math] [math] \cup[/math]= [math][A \rightarrow \alpha B \cdot \beta, j][/math]

function [math]\mathtt{predict}(D, j, G, w)[/math]:
  for [math][A \rightarrow \alpha \cdot B \beta, i] \in D_{j} [/math]
    for [math](B \rightarrow \eta) \in P [/math]
      [math]D_{j}[/math] [math]\cup[/math]= [math][B \rightarrow \cdot \ \eta, j][/math]

Корректность алгоритма

Теорема:

Приведенный алгоритм правильно строит все списки ситуаций. То есть алгоритм поддерживает инвариант

Доказательство:

[math]\Longrightarrow[/math]
Докажем индукцией по исполнению алгоритма.
База индукции:
.
Индукционный переход:
Пусть предположение верно для всех списков ситуаций с номерами меньше [math] j [/math]. Разберемся, в результате применения какого правила ситуация попала в [math]D_{j}[/math]

1. Включаем по правилу [math] \mathtt{scan} \ [/math].
Это произошло, если [math] \alpha = \alpha ' a[/math], [math]a = w_{j-1}[/math] и .
По предположению индукции и ,
тогда в силу [math]a = w_{j-1}[/math] получаем .
Таким образом условия: и выполняются.

2. Включаем по правилу [math] \mathtt{predict} \ [/math].
По построению: [math] \alpha = \varepsilon [/math] и [math]i=j[/math], что автоматически влечет второй пункт утверждения.
Кроме того [math]\exists i' \le i[/math] и ситуация , из чего по предположению индукции следует и .
Получаем, что , значит , следовательно , в итоге , что нам и требовалось.

3. Включаем по правилу [math] \mathtt{complete} \ [/math].
По построению: [math] \alpha = \alpha ' A' [/math] и .
Cледовательно , что дает нам второй пункт утверждения, а так как первый пункт следует из индукционного предположения, все хорошо.

[math]\Longleftarrow[/math]
В обратную сторону будем доказывать индукцией по суммарной длине вывода из [math]S'[/math] и [math]w_i \ldots w_{j-1}[/math] из [math]\alpha[/math]. После чего применим индукцию по длине вывода [math]w_i \ldots w_{j-1}[/math] из [math]\alpha[/math].
Рассмотрим три случая последнего символа [math]\alpha[/math]:

1. [math]\alpha = \alpha ' a[/math], тогда [math]a = w_{j-1}[/math] и .
По предположению индукции: , а отсюда по правилу [math] \mathtt{scan}[/math] получаем .

2. [math]\alpha = \alpha ' B[/math], тогда .
Тогда имеем . Также можно записать , как , а также .
Применяя индукцию по второму параметру получим , откуда по правилу [math] \mathtt{complete}[/math] получаем .

3. [math]\alpha = \varepsilon [/math], тогда [math]i=j[/math].
Тогда либо , что доказывает базу индукции,
либо вывод можно записать в виде для некоторого правила .
Отсюда по предположению индукции , что после нескольких применений правила [math] \mathtt{scan}[/math] приводит к ,

после чего по правилу получим , что и требовалось.

Пример

Построим список разбора для строки [math]w = (a + a)[/math] в грамматике со следующими правилами:

[math]S \rightarrow T + S[/math]
[math]S \rightarrow T [/math]
[math]T \rightarrow F * T[/math]
[math]T \rightarrow F[/math]
[math]F \rightarrow ( S )[/math]
[math]F \rightarrow a[/math]

Ситуация	Из правила
	0
	3
[math][S \rightarrow \cdot T, 0][/math]	3
	3
[math][T \rightarrow \cdot F, 0][/math]	3
	3
[math][F \rightarrow \cdot a, 0][/math]	3

Ситуация	Из правила
	1
	3
[math][S \rightarrow \cdot T, 1][/math]	3
	3
[math][T \rightarrow \cdot F, 1][/math]	3
	3
[math][F \rightarrow \cdot a, 1][/math]	3

Ситуация	Из правила
[math][F \rightarrow a \cdot, 1][/math]	1
	2
	2
	2
	2
	2

Ситуация	Из правила
	1
	3
[math][S \rightarrow \cdot T, 3][/math]	3
	3
[math][T \rightarrow \cdot F, 3][/math]	3
	3
[math][F \rightarrow \cdot a, 3][/math]	3

Ситуация	Из правила
	1
	2
	2
	2
	2
	2
	2

Ситуация	Из правила
	1
	2
	2
	2
	2
	2

Так как , то [math]w \in L(G) [/math].

См. также

Источники информации

Алексей Сорокин — Алгоритм Эрли
Ахо А., Ульман Д.— Теория синтакcического анализа, перевода и компиляции. Том 1. Синтаксический анализ. Пер. с англ. — М.:«Мир», 1978. С. 358 — 364.

Алгоритм Эрли — различия между версиями

Текущая версия на 19:27, 4 сентября 2022