Участник:Shovkoplyas Grigory — различия между версиями

Версия 20:31, 16 января 2016

Алгоритм Эрли позволяет определить, выводится ли данное слово [math]w[/math] в данной контекстно-свободной грамматике [math]G[/math].

Вход: КС грамматика и слово [math]w[/math].
Выход: [math]true[/math], если [math]w[/math] выводится в [math]G[/math]; [math]false[/math] — иначе.

Содержание

1 Определения
2 Алгоритм Эрли
- 2.1 Псевдокод
3 Корректность алгоритма
- 3.1 Алгоритм не добавит в список ситуацию, которая ему не принадлежит:
- 3.2 В каждый список попадут все ситуации, которые ему принадлежат:
4 Пример
5 Источники информации

Определения

Определение:

Пусть — контекстно-свободная грамматика и — входная цепочка из . Объект вида , где — правило из и — позиция в , называется ситуацией, относящейся к цепочке .

Определение:

[math]j[/math]-м списком ситуаций для входной цепочки , где , называется множество ситуаций . То есть выводит часть c первого по -й символ.

Лемма:

.

Доказательство:

Поскольку (при ), из определения получаем, что .

Определение:

Последовательность списков ситуаций называется списком разбора для входной цепочки .

Алгоритм Эрли

Чтобы воспользоваться леммой, необходимо найти [math]D_n[/math] для [math]w[/math]. Алгоритм Эрли является динамическим алгоритмом: он последовательно строит список разбора, причём при построении [math]D_j[/math] используются [math]D_0, \ldots, D_{j}[/math] (то есть элементы списков с меньшими номерами и ситуации, содержащиеся в текущем списке на данный момент).

Алгоритм основывается на следующих трёх правилах:

Если (где [math]w_j[/math] — [math]j[/math]-ый символ строки), то .
Если и , то .
Если и , то .

Псевдокод

Для простоты добавим новый стартовый вспомогательный нетерминал [math]S'[/math] и правило [math](S' \rightarrow S)[/math].

function [math]\mathtt{earley}(G, w)[/math]:
  // Инициализация 
  [math] D_{0} = \lbrace [S' \rightarrow \cdot S, 0] \rbrace [/math]
  for i = 1 to len(w) - 1
    D[i] = [math]\varnothing [/math]
  // Основная часть 
  for j = 0 to len(w) - 1
    [math]\mathtt{scan}(D, j, G, w)[/math]
    while [math]D_j[/math] изменяется
      [math]\mathtt{complete}(D, j, G, w)[/math]
      [math]\mathtt{predict}(D, j, G, w)[/math]

// Первое правило 
function [math]\mathtt{scan}(D, j, G, w)[/math]:
  if j = 0
    return
  for [math][A \rightarrow \alpha \cdot a \beta, i] \in D_{j - 1} [/math]
    if a == [math]w_{j - 1}[/math]
      [math]D_{j}[/math] [math] \cup[/math]= [math][A \rightarrow \alpha \cdot a \beta, i][/math]

// Второе правило 
function [math]\mathtt{complete}(D, j, G, w)[/math]:
  for [math][B \rightarrow \eta \cdot, i] \in D_{j} [/math]
    for [math][A \rightarrow \alpha \cdot B \beta, k] \in D_{i} [/math]
      [math]D_{j}[/math] [math] \cup[/math]= [math][A \rightarrow \alpha B \cdot \beta, k][/math]

// Третье правило 
function [math]\mathtt{predict}(D, j, G, w)[/math]:
  for [math][A \rightarrow \alpha \cdot B \beta, i] \in D_{j} [/math]
    for [math](B \rightarrow \eta) \in P [/math]
      [math]D_{j}[/math] [math]\cup[/math]= [math][B \rightarrow \cdot \eta, j][/math]

Корректность алгоритма

Теорема:

Приведенный алгоритм правильно строит все списки ситуаций.

Доказательство:

Алгоритм не добавит в список ситуацию, которая ему не принадлежит:

Докажем индукцией по исполнению алгоритма.
База (инициализация): и при .
Индукционный переход: пусть в [math] I_{0},...,I_{j} [/math] нет лишних ситуаций. Пусть включаем в [math]I_{j}[/math]. Рассмотрим три случая:

1. Включаем по правилу [math](1)[/math].
Тогда . По предположению и существуют [math]\gamma'[/math] и [math]\delta' [/math] такие, что . Значит, и при .

2. Включаем по правилу [math](2)[/math].
Тогда и . По предположению, , откуда . Кроме того, существуют [math]\gamma'[/math] и [math]\delta' [/math] такие, что . Значит, при .

3. Включаем по правилу [math](3)[/math].
Тогда . По предположению и существуют [math]\gamma'[/math] и [math]\delta' [/math] такие, что . Значит, при выполнено , следовательно .

В каждый список попадут все ситуации, которые ему принадлежат:

Для всех наборов нужно доказать, что, если , то алгоритм добавит в [math] I_{j}[/math].

Рангом набора [math] \tau [/math] называется , где [math]\tau_{S'}(\tau)[/math] — длина кратчайшего вывода , [math]\tau_{\gamma}(\tau)[/math] — длина кратчайшего вывода , [math]\tau_{\alpha}(\tau)[/math] — длина кратчайшего вывода .

Докажем утверждение индукцией по рангу набора.
База: если ранг [math]\tau[/math] равен 0, то . Значит, [math]A = S'[/math], , [math]\beta = S [/math]. При инициализации такая ситуация будет добавлена в [math]I_0[/math].
Индукционный переход: пусть ранг [math]\tau[/math] равен [math]r \gt 0[/math], пусть для всех наборов с меньшими рангами утверждение верно. Докажем для набора [math]\tau[/math]. Для этого рассмотрим три случая:

1. [math]\alpha[/math] оканчивается терминалом.
[math]\alpha = \alpha' c[/math]. , значит [math]c = a_{j}[/math]. Рассмотрим набор . , следовательно ранг [math]\tau'[/math] равен [math]r - 2[/math], так как . Значит, по предположению , и будет добавлена в [math]I_{j}[/math] по правилу [math](1)[/math].

2. [math]\alpha[/math] оканчивается нетерминалом.
[math]\alpha = \alpha' B[/math]. , значит [math]\mathcal {9} k[/math] такое, что .
Рассмотрим набор , его ранг меньше [math]r[/math], следовательно по предположению.
Пусть [math]B \Rightarrow \eta[/math] — первый шаг в кратчайшем выводе . Рассмотрим набор . , следовательно .
Пусть длина кратчайшего вывода равна [math]n_1[/math], а длина кратчайшего вывода равна [math]n_2[/math]. Тогда . Так как , то . Очевидно, что . Тогда ранг [math]\tau''[/math] равен . Значит, по предположению для [math]\tau''[/math], . Из того, что и , по правилу [math](2)[/math] будет добавлена в [math]I_{j}[/math].

3. [math]\alpha = \varepsilon[/math].
В этом случае .
[math]\tau_{S'}(\tau) \neq 0[/math] т.к. иначе [math] \gamma = \varepsilon[/math], следовательно , откуда [math] r = 0[/math], но [math]r \gt 0[/math]. Т.к. [math]\tau_{S'}(\tau) \gt 0[/math], , где . Рассмотрим набор , где [math]k[/math] такое, что . Пусть длина кратчайшего вывода равна [math]n_1[/math], а длина кратчайшего вывода равна [math]n_2[/math].

Найдём ранг . . , следовательно ранг равен . Значит, по предположению , следовательно по правилу будет добавлена в .

Пример

Построим список разбора для строки [math]w = (a + a)[/math] в грамматике со следующими правилами:

[math]S \rightarrow T + S[/math];
[math]S \rightarrow T [/math];
[math]T \rightarrow F * T[/math];
[math]T \rightarrow F[/math];
[math]F \rightarrow ( S )[/math];
[math]F \rightarrow a[/math].

Ситуация	Из правила
	0
	3
[math][S \rightarrow \cdot T, 0][/math]	3
	3
[math][T \rightarrow \cdot F, 0][/math]	3
	3
[math][F \rightarrow \cdot a, 0][/math]	3

Ситуация	Из правила
	1
	3
[math][S \rightarrow \cdot T, 1][/math]	3
	3
[math][T \rightarrow \cdot F, 1][/math]	3
	3
[math][F \rightarrow \cdot a, 1][/math]	3

Ситуация	Из правила
[math][F \rightarrow a \cdot, 1][/math]	1
	2
	2
	2
	2
	2

Ситуация	Из правила
	1
	3
[math][S \rightarrow \cdot T, 3][/math]	3
	3
[math][T \rightarrow \cdot F, 3][/math]	3
	3
[math][F \rightarrow \cdot a, 3][/math]	3

Ситуация	Из правила
	1
	2
	2
	2
	2
	2
	2

Ситуация	Из правила
	1
	2
	2
	2
	2
	2

Так как , то [math]w \in L(G) [/math].

Источники информации

Алексей Сорокин — Алгоритм Эрли
Ахо А., Ульман Д.— Теория синтакcического анализа, перевода и компиляции. Том 1. Синтаксический анализ. Пер. с англ. — М.:«Мир», 1978. С. 358 — 364.

@@ Строка 31: / Строка 31: @@
 Алгоритм основывается на следующих трёх правилах:
 # Если <tex>[A \rightarrow \alpha \cdot w_{j} \beta, i] \in D_{j-1}</tex> (где <tex>w_j</tex> — <tex>j</tex>-ый символ строки), то <tex>[A \rightarrow \alpha w_{j} \cdot \beta, i] \in D_j</tex>.
-# Если <tex>[ \rightarrow \eta \cdot , k] \in I_j</tex> и <tex>[A \rightarrow \alpha \cdot B \beta, i] \in I_{k}</tex>, то <tex>[A \rightarrow \alpha B \cdot \beta, i] \in I_j</tex>.
+# Если <tex>[B \rightarrow \eta \cdot, i] \in D_j</tex> и <tex>[A \rightarrow \alpha \cdot B \beta, k] \in D_i</tex>, то <tex>[A \rightarrow \alpha B \cdot \beta, k] \in D_j</tex>.
-# Если <tex>[B \rightarrow \alpha \cdot A \eta, k] \in I_j</tex> и <tex>(A \rightarrow \beta) \in P</tex>, то <tex>[A \rightarrow \cdot \beta, j] \in I_j</tex>.
+# Если <tex>[A \rightarrow \alpha \cdot B \beta, i] \in D_{j} </tex> и <tex>(B \rightarrow \eta) \in P </tex>, то <tex>[B \rightarrow \cdot \eta, j] \in D_{j}</tex>.
 === Псевдокод ===
 Для простоты добавим новый стартовый вспомогательный нетерминал <tex>S'</tex> и правило <tex>(S' \rightarrow S)</tex>.
-  <font color=green> // Инициализация </font>
- D[0] = {<tex>[S' \rightarrow \cdot S, 0]</tex>}
+ '''function''' <tex>\mathtt{earley}(G, w)</tex>:
- '''for''' i = 1 '''to''' len(w) - 1
+   <font color=green>// Инициализация </font>
-   D[i] = <tex>\varnothing </tex>
+   <tex> D_{0} = \lbrace [S' \rightarrow \cdot S, 0] \rbrace </tex>
- <font color=green> // Основная часть </font>
+   '''for''' i = 1 '''to''' len(w) - 1
- '''for''' j = 0 '''to''' len(w) - 1
+     D[i] = <tex>\varnothing </tex>
-   scan(D, j)
+   <font color=green>// Основная часть </font>
-   '''while''' D[j] изменяется
+   '''for''' j = 0 '''to''' len(w) - 1
-     complete(D, j)
+     <tex>\mathtt{scan}(D, j, G, w)</tex>
-     predict(D, j)
+     '''while''' <tex>D_j</tex> изменяется
+       <tex>\mathtt{complete}(D, j, G, w)</tex>
+       <tex>\mathtt{predict}(D, j, G, w)</tex>
-  <font color=green> // Первое правило </font>
+  <font color=green>// Первое правило </font>
-  '''function''' scan(D, j)
+  '''function''' <tex>\mathtt{scan}(D, j, G, w)</tex>:
     '''if''' j = 0
       '''return'''
-    '''for''' <tex>[A \rightarrow \alpha \cdot a \beta, i]</tex> <tex>\in</tex> D[j - 1]
+    '''for''' <tex>[A \rightarrow \alpha \cdot a \beta, i] \in D_{j - 1} </tex>
-      '''if''' a = w[j - 1]
+      '''if''' a == <tex>w_{j - 1}</tex>
-        D[j] <tex>\cup</tex>= {<tex>[A \rightarrow \alpha \cdot a \beta, i]</tex>}
+        <tex>D_{j}</tex> <tex> \cup</tex>= <tex>[A \rightarrow \alpha \cdot a \beta, i]</tex>
-  <font color=green> // Второе правило </font>
-  '''function''' predict(D, j)
+  <font color=green>// Второе правило </font>
-   '''for''' <tex>[A \rightarrow \alpha \cdot B \beta, i]</tex> <tex>\in</tex> D[j]
+  '''function''' <tex>\mathtt{complete}(D, j, G, w)</tex>:
-     '''for''' <tex>[B \rightarrow \eta]</tex> <tex>\in</tex> P
+    '''for''' <tex>[B \rightarrow \eta \cdot, i] \in D_{j} </tex>
-       D[j] <tex>\cup</tex>= {<tex>[B \rightarrow \cdot \eta, j]</tex>}
+      '''for''' <tex>[A \rightarrow \alpha \cdot B \beta, k] \in D_{i} </tex>
- <font color=green> // Третье правило </font>
+       <tex>D_{j}</tex> <tex> \cup</tex>= <tex>[A \rightarrow \alpha B \cdot \beta, k]</tex>
- '''function''' complete(D, j)
-    '''for''' <tex>[B \rightarrow \eta \cdot, i]</tex> <tex>\in</tex> D[j]
-      '''for''' <tex>[A \rightarrow \alpha \cdot B \beta, k]</tex> <tex>\in</tex> D[i]
-       D[j] <tex>\cup</tex>= {<tex>[A \rightarrow \alpha B \cdot \beta, k]</tex>}
+ <font color=green>// Третье правило </font>
+ '''function''' <tex>\mathtt{predict}(D, j, G, w)</tex>:
+   '''for''' <tex>[A \rightarrow \alpha \cdot B \beta, i] \in D_{j} </tex>
+     '''for''' <tex>(B \rightarrow \eta) \in P </tex>
+       <tex>D_{j}</tex> <tex>\cup</tex>= <tex>[B \rightarrow \cdot \eta, j]</tex>
 ==Корректность алгоритма==
 {{Теорема

Участник:Shovkoplyas Grigory — различия между версиями

Версия 20:31, 16 января 2016

Содержание

Определения

Алгоритм Эрли

Псевдокод

Корректность алгоритма

Алгоритм не добавит в список ситуацию, которая ему не принадлежит:

В каждый список попадут все ситуации, которые ему принадлежат:

Пример

Источники информации

Навигация

Персональные инструменты

Пространства имён

Варианты

Просмотры

Ещё

Поиск

Навигация

Инструменты