Участник:Shovkoplyas Grigory

Алгоритм Эрли позволяет определить, выводится ли данное слово [math]w[/math] в данной контекстно-свободной грамматике [math]G[/math].

Вход: КС грамматика и слово [math]w[/math].
Выход: [math]true[/math], если [math]w[/math] выводится в [math]G[/math]; [math]false[/math] — иначе.

Содержание

1 Определения
2 Алгоритм Эрли
- 2.1 Псевдокод
3 Корректность алгоритма
- 3.1 [math]\Longrightarrow[/math]
- 3.2 [math]\Longleftarrow[/math]
4 Пример
5 Источники информации

Определения

Определение:

Пусть — контекстно-свободная грамматика и — входная цепочка из . Объект вида , где — правило из и — позиция в , называется ситуацией, относящейся к цепочке . [math] \cdot [/math] — вспомогательный символ, который не явлется терминалом или нетерминалом ( ).

Определение:

[math]j[/math]-м списком ситуаций для входной цепочки , где , называется множество ситуаций . То есть выводит часть c первого по -й символ.

Лемма:

.

Доказательство:

Поскольку (при ), из определения получаем, что .

Определение:

Последовательность списков ситуаций называется списком разбора для входной цепочки .

Алгоритм Эрли

Чтобы воспользоваться леммой, необходимо найти [math]D_n[/math] для [math]w[/math]. Алгоритм Эрли является динамическим алгоритмом: он последовательно строит список разбора, причём при построении [math]D_j[/math] используются [math]D_0, \ldots, D_{j}[/math] (то есть элементы списков с меньшими номерами и ситуации, содержащиеся в текущем списке на данный момент).

Алгоритм основывается на следующих трёх правилах:

Если (где [math]w_j[/math] — [math]j[/math]-ый символ строки), то .
Если и , то .
Если и , то .

Псевдокод

Для простоты добавим новый стартовый вспомогательный нетерминал [math]S'[/math] и правило [math](S' \rightarrow S)[/math].

function [math]\mathtt{earley}(G, w)[/math]:
  // Инициализация 
  [math] D_{0} = \lbrace [S' \rightarrow \cdot S, 0] \rbrace [/math]
  for i = 1 to len(w) - 1
    [math]D_i[/math] = [math]\varnothing [/math]
  // Вычисление ситуаций 
  for j = 0 to len(w) - 1
    [math]\mathtt{scan}(D, j, G, w)[/math]
    while [math]D_j[/math] изменяется
      [math]\mathtt{complete}(D, j, G, w)[/math]
      [math]\mathtt{predict}(D, j, G, w)[/math]
  // Результат 
  if  [math][S' \rightarrow S \cdot, 0] \in D_{len(w)} [/math]
    return True
  else
    return False

// Первое правило 
function [math]\mathtt{scan}(D, j, G, w)[/math]:
  if [math]j[/math] == [math]0[/math]
    return
  for [math][A \rightarrow \alpha \cdot a \beta, i] \in D_{j - 1} [/math]
    if [math]a[/math] == [math]w_{j - 1}[/math]
      [math]D_{j}[/math] [math] \cup[/math]= [math][A \rightarrow \alpha \cdot a \beta, i][/math]

// Второе правило 
function [math]\mathtt{complete}(D, j, G, w)[/math]:
  for [math][B \rightarrow \eta \cdot, i] \in D_{j} [/math]
    for [math][A \rightarrow \alpha \cdot B \beta, k] \in D_{i} [/math]
      [math]D_{j}[/math] [math] \cup[/math]= [math][A \rightarrow \alpha B \cdot \beta, k][/math]

// Третье правило 
function [math]\mathtt{predict}(D, j, G, w)[/math]:
  for [math][A \rightarrow \alpha \cdot B \beta, i] \in D_{j} [/math]
    for [math](B \rightarrow \eta) \in P [/math]
      [math]D_{j}[/math] [math]\cup[/math]= [math][B \rightarrow \cdot \eta, j][/math]

Корректность алгоритма

Теорема:

Приведенный алгоритм правильно строит все списки ситуаций. То есть алгоритм поддерживает инвариант

Доказательство:

[math]\Longrightarrow[/math]

Докажем индукцией по исполнению алгоритма.
База — . Осталось разобраться, в результате применения какого правила ситуация попала в [math]D_{j}[/math]

1. Включаем по правилу [math] \mathtt{scan}[/math].
Это произошло, если [math] \alpha = \alpha ' a[/math], [math]a = w_{j-1}[/math] и .
По предположению индукции и ,
тогда в силу [math]a = w_{j-1}[/math] получаем .
Таким образом условия: и выполняются.

2. Включаем по правилу [math] \mathtt{predict}[/math].
По построению: [math] \alpha = \varepsilon [/math] и [math]i=j[/math], что автоматически влечет второй пункт утверждения.
Кроме того [math]\exists i' \le i[/math] и ситуация , из чего по предположению индукции следует и .
Получаем, что , значит , следовательно , в итоге , что нам и требовалось.

3. Включаем по правилу [math] \mathtt{complete}[/math].
По построению: [math] \alpha = \alpha ' A' [/math] и .
Cледовательно , что дает нам второй пункт утверждения, а так как первый пункт следует из индукционного предположения, все хорошо.

[math]\Longleftarrow[/math]

Для всех наборов нужно доказать, что, если , то алгоритм добавит в [math] I_{j}[/math].

Рангом набора [math] \tau [/math] называется , где [math]\tau_{S'}(\tau)[/math] — длина кратчайшего вывода , [math]\tau_{\gamma}(\tau)[/math] — длина кратчайшего вывода , [math]\tau_{\alpha}(\tau)[/math] — длина кратчайшего вывода .

Докажем утверждение индукцией по рангу набора.
База: если ранг [math]\tau[/math] равен 0, то . Значит, [math]A = S'[/math], , [math]\beta = S [/math]. При инициализации такая ситуация будет добавлена в [math]I_0[/math].
Индукционный переход: пусть ранг [math]\tau[/math] равен [math]r \gt 0[/math], пусть для всех наборов с меньшими рангами утверждение верно. Докажем для набора [math]\tau[/math]. Для этого рассмотрим три случая:

1. [math]\alpha[/math] оканчивается терминалом.
[math]\alpha = \alpha' c[/math]. , значит [math]c = a_{j}[/math]. Рассмотрим набор . , следовательно ранг [math]\tau'[/math] равен [math]r - 2[/math], так как . Значит, по предположению , и будет добавлена в [math]I_{j}[/math] по правилу [math](1)[/math].

2. [math]\alpha[/math] оканчивается нетерминалом.
[math]\alpha = \alpha' B[/math]. , значит [math]\mathcal {9} k[/math] такое, что .
Рассмотрим набор , его ранг меньше [math]r[/math], следовательно по предположению.
Пусть [math]B \Rightarrow \eta[/math] — первый шаг в кратчайшем выводе . Рассмотрим набор . , следовательно .
Пусть длина кратчайшего вывода равна [math]n_1[/math], а длина кратчайшего вывода равна [math]n_2[/math]. Тогда . Так как , то . Очевидно, что . Тогда ранг [math]\tau''[/math] равен . Значит, по предположению для [math]\tau''[/math], . Из того, что и , по правилу [math](2)[/math] будет добавлена в [math]I_{j}[/math].

3. [math]\alpha = \varepsilon[/math].
В этом случае .
[math]\tau_{S'}(\tau) \neq 0[/math] т.к. иначе [math] \gamma = \varepsilon[/math], следовательно , откуда [math] r = 0[/math], но [math]r \gt 0[/math]. Т.к. [math]\tau_{S'}(\tau) \gt 0[/math], , где . Рассмотрим набор , где [math]k[/math] такое, что . Пусть длина кратчайшего вывода равна [math]n_1[/math], а длина кратчайшего вывода равна [math]n_2[/math].

Найдём ранг . . , следовательно ранг равен . Значит, по предположению , следовательно по правилу будет добавлена в .

Пример

Построим список разбора для строки [math]w = (a + a)[/math] в грамматике со следующими правилами:

[math]S \rightarrow T + S[/math];
[math]S \rightarrow T [/math];
[math]T \rightarrow F * T[/math];
[math]T \rightarrow F[/math];
[math]F \rightarrow ( S )[/math];
[math]F \rightarrow a[/math].

Ситуация	Из правила
	0
	3
[math][S \rightarrow \cdot T, 0][/math]	3
	3
[math][T \rightarrow \cdot F, 0][/math]	3
	3
[math][F \rightarrow \cdot a, 0][/math]	3

Ситуация	Из правила
	1
	3
[math][S \rightarrow \cdot T, 1][/math]	3
	3
[math][T \rightarrow \cdot F, 1][/math]	3
	3
[math][F \rightarrow \cdot a, 1][/math]	3

Ситуация	Из правила
[math][F \rightarrow a \cdot, 1][/math]	1
	2
	2
	2
	2
	2

Ситуация	Из правила
	1
	3
[math][S \rightarrow \cdot T, 3][/math]	3
	3
[math][T \rightarrow \cdot F, 3][/math]	3
	3
[math][F \rightarrow \cdot a, 3][/math]	3

Ситуация	Из правила
	1
	2
	2
	2
	2
	2
	2

Ситуация	Из правила
	1
	2
	2
	2
	2
	2

Так как , то [math]w \in L(G) [/math].

Источники информации

Алексей Сорокин — Алгоритм Эрли
Ахо А., Ульман Д.— Теория синтакcического анализа, перевода и компиляции. Том 1. Синтаксический анализ. Пер. с англ. — М.:«Мир», 1978. С. 358 — 364.

Участник:Shovkoplyas Grigory

Содержание

Определения

Алгоритм Эрли

Псевдокод

Корректность алгоритма

[math]\Longrightarrow[/math]

[math]\Longleftarrow[/math]

Пример

Источники информации

Навигация

Персональные инструменты

Пространства имён

Варианты

Просмотры

Ещё

Поиск

Навигация

Инструменты