Участник:Shovkoplyas Grigory — различия между версиями
Строка 31: | Строка 31: | ||
Алгоритм основывается на следующих трёх правилах: | Алгоритм основывается на следующих трёх правилах: | ||
# Если <tex>[A \rightarrow \alpha \cdot w_{j} \beta, i] \in D_{j-1}</tex> (где <tex>w_j</tex> — <tex>j</tex>-ый символ строки), то <tex>[A \rightarrow \alpha w_{j} \cdot \beta, i] \in D_j</tex>. | # Если <tex>[A \rightarrow \alpha \cdot w_{j} \beta, i] \in D_{j-1}</tex> (где <tex>w_j</tex> — <tex>j</tex>-ый символ строки), то <tex>[A \rightarrow \alpha w_{j} \cdot \beta, i] \in D_j</tex>. | ||
− | # Если <tex>[ \rightarrow \eta \cdot , | + | # Если <tex>[B \rightarrow \eta \cdot, i] \in D_j</tex> и <tex>[A \rightarrow \alpha \cdot B \beta, k] \in D_i</tex>, то <tex>[A \rightarrow \alpha B \cdot \beta, k] \in D_j</tex>. |
− | # Если <tex>[ | + | # Если <tex>[A \rightarrow \alpha \cdot B \beta, i] \in D_{j} </tex> и <tex>(B \rightarrow \eta) \in P </tex>, то <tex>[B \rightarrow \cdot \eta, j] \in D_{j}</tex>. |
=== Псевдокод === | === Псевдокод === | ||
Для простоты добавим новый стартовый вспомогательный нетерминал <tex>S'</tex> и правило <tex>(S' \rightarrow S)</tex>. | Для простоты добавим новый стартовый вспомогательный нетерминал <tex>S'</tex> и правило <tex>(S' \rightarrow S)</tex>. | ||
− | <font color=green> // Инициализация </font> | + | |
− | + | '''function''' <tex>\mathtt{earley}(G, w)</tex>: | |
− | + | <font color=green>// Инициализация </font> | |
− | + | <tex> D_{0} = \lbrace [S' \rightarrow \cdot S, 0] \rbrace </tex> | |
− | + | '''for''' i = 1 '''to''' len(w) - 1 | |
− | + | D[i] = <tex>\varnothing </tex> | |
− | + | <font color=green>// Основная часть </font> | |
− | + | '''for''' j = 0 '''to''' len(w) - 1 | |
− | + | <tex>\mathtt{scan}(D, j, G, w)</tex> | |
− | + | '''while''' <tex>D_j</tex> изменяется | |
+ | <tex>\mathtt{complete}(D, j, G, w)</tex> | ||
+ | <tex>\mathtt{predict}(D, j, G, w)</tex> | ||
− | <font color=green> // Первое правило </font> | + | <font color=green>// Первое правило </font> |
− | '''function''' scan(D, j) | + | '''function''' <tex>\mathtt{scan}(D, j, G, w)</tex>: |
'''if''' j = 0 | '''if''' j = 0 | ||
'''return''' | '''return''' | ||
− | '''for''' <tex>[A \rightarrow \alpha \cdot a \beta, i] | + | '''for''' <tex>[A \rightarrow \alpha \cdot a \beta, i] \in D_{j - 1} </tex> |
− | '''if''' a = | + | '''if''' a == <tex>w_{j - 1}</tex> |
− | + | <tex>D_{j}</tex> <tex> \cup</tex>= <tex>[A \rightarrow \alpha \cdot a \beta, i]</tex> | |
− | <font color=green> // Второе правило </font> | + | |
− | '''function | + | <font color=green>// Второе правило </font> |
− | + | '''function''' <tex>\mathtt{complete}(D, j, G, w)</tex>: | |
− | + | '''for''' <tex>[B \rightarrow \eta \cdot, i] \in D_{j} </tex> | |
− | + | '''for''' <tex>[A \rightarrow \alpha \cdot B \beta, k] \in D_{i} </tex> | |
− | + | <tex>D_{j}</tex> <tex> \cup</tex>= <tex>[A \rightarrow \alpha B \cdot \beta, k]</tex> | |
− | |||
− | '''for''' <tex>[B \rightarrow \eta \cdot, i] | ||
− | '''for''' <tex>[A \rightarrow \alpha \cdot B \beta, k]</tex> <tex> | ||
− | |||
+ | <font color=green>// Третье правило </font> | ||
+ | '''function''' <tex>\mathtt{predict}(D, j, G, w)</tex>: | ||
+ | '''for''' <tex>[A \rightarrow \alpha \cdot B \beta, i] \in D_{j} </tex> | ||
+ | '''for''' <tex>(B \rightarrow \eta) \in P </tex> | ||
+ | <tex>D_{j}</tex> <tex>\cup</tex>= <tex>[B \rightarrow \cdot \eta, j]</tex> | ||
+ | |||
==Корректность алгоритма== | ==Корректность алгоритма== | ||
{{Теорема | {{Теорема |
Версия 20:31, 16 января 2016
Алгоритм Эрли позволяет определить, выводится ли данное слово контекстно-свободной грамматике .
в даннойВход: КС грамматика
Выход: , если выводится в ; — иначе.
Содержание
Определения
Определение: |
Пусть контекстно-свободная грамматика и — входная цепочка из . Объект вида , где — правило из и — позиция в , называется ситуацией, относящейся к цепочке . | —
Определение: |
-м списком ситуаций для входной цепочки , где , называется множество ситуаций . То есть выводит часть c первого по -й символ. |
Лемма: |
. |
Доказательство: |
Поскольку | (при ), из определения получаем, что .
Определение: |
Последовательность списков ситуаций | называется списком разбора для входной цепочки .
Алгоритм Эрли
Чтобы воспользоваться леммой, необходимо найти динамическим алгоритмом: он последовательно строит список разбора, причём при построении используются (то есть элементы списков с меньшими номерами и ситуации, содержащиеся в текущем списке на данный момент).
для . Алгоритм Эрли являетсяАлгоритм основывается на следующих трёх правилах:
- Если (где — -ый символ строки), то .
- Если и , то .
- Если и , то .
Псевдокод
Для простоты добавим новый стартовый вспомогательный нетерминал
и правило .function: // Инициализация for i = 1 to len(w) - 1 D[i] = // Основная часть for j = 0 to len(w) - 1 while изменяется
// Первое правило function: if j = 0 return for if a == = // Второе правило function : for for =
// Третье правило function: for for =
Корректность алгоритма
Теорема: |
Приведенный алгоритм правильно строит все списки ситуаций. |
Доказательство: |
Алгоритм не добавит в список ситуацию, которая ему не принадлежит:Докажем индукцией по исполнению алгоритма. 1. Включаем по правилу 2. Включаем по правилу 3. Включаем по правилу В каждый список попадут все ситуации, которые ему принадлежат:Для всех наборов нужно доказать, что, если , то алгоритм добавит в .Рангом набора называется , где — длина кратчайшего вывода , — длина кратчайшего вывода , — длина кратчайшего вывода .Докажем утверждение индукцией по рангу набора. 1. 2. 3. |
Пример
Построим список разбора для строки
в грамматике со следующими правилами:- ;
- ;
- ;
- ;
- ;
- .
|
|
| ||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|
|
Так как
Источники информации
- Алексей Сорокин — Алгоритм Эрли
- Ахо А., Ульман Д.— Теория синтакcического анализа, перевода и компиляции. Том 1. Синтаксический анализ. Пер. с англ. — М.:«Мир», 1978. С. 358 — 364.