Алгоритм Эрли

Версия 21:30, 7 декабря 2011

Алгоритм Эрли позволяет определить, выводится ли данное слово [math]\omega[/math] в данной контекстно-свободной грамматике [math]G[/math].

Вход: КС грамматика и слово [math]\omega[/math].
Выход: [math]true[/math], если [math]\omega[/math] выводится в [math]G[/math]; [math]false[/math] — иначе.

Определения

Определение:

Пусть — контекстно-свободная грамматика и — входная цепочка из . Объект вида называется ситуацией, относящейся к цепочке , если — правило из и — позиция в .

Определение:

Cписком ситуаций , где называется множество ситуаций таких, что , и для некоторых и существуют выводы .

Определение:

Последовательность списков ситуаций называется списком разбора для входной цепочки .

Построим список разбора для [math]\omega[/math] Строим [math]I_0[/math]
Шаг 1. Если , включить в [math]I_0[/math].
Пока можно включить новые ситуации в [math]I_0[/math] повторяем шаги 2 и 3.
Шаг 2. Если , включить в [math]I_0[/math] ситуацию для всех из [math]I_0[/math].
Шаг 3. Для всех , для всех [math]\gamma[/math] таких, что включить в [math]I_0[/math].
Построение [math]I_j[/math] по [math]I_0, I_1, ..., I_{j-1}[/math].
Шаг 4. Для каждой ситуации , где [math]a_j[/math] — j-й символ в [math]\omega[/math], включить в [math]I_j[/math].
Пока можно включить новые ситуации в [math]I_j[/math] повторяем шаги 5 и 6.
Шаг 5. Если , то для каждой ситуации включить в [math]I_j[/math].
Шаг 6. Для всех , для всех [math]\gamma[/math] таких, что [math]B \rightarrow \gamma \in P[/math] включить в [math]I_j[/math].

Если , то [math]\omega \in L(G) [/math].

Корректность алгоритма

Теорема:

и и такие, что и .

Доказательство:

[math]\Rightarrow[/math]
Докажем по индукции.
База: для любой ситуации из [math]I_0[/math] и при [math]\gamma = \varepsilon [/math].
Индукционный переход (и.п.): пусть верно для всех ситуаций из списков [math] I_{i}, i \leqslant j [/math]. Пусть включаем в [math]I_{j}[/math]. Рассмотрим три случая:

1. Пусть включаем по правилу 4
Тогда . По и.п. и существуют [math]\gamma'[/math] и [math]\delta' [/math] такие, что . Значит и при для утверждение верно.

2. Пусть включаем по правилу 5
Тогда и . По и.п. , откуда . Также по и.п. существуют [math]\gamma'[/math] и [math]\delta' [/math] такие, что . Значит при для утверждение верно.

3. Пусть включаем по правилу 6
Тогда . По и.п. и существуют [math]\gamma'[/math] и [math]\delta' [/math] такие, что . Значит при выполнено , значит для утверждение верно.

[math]\Leftarrow[/math]
Для всех наборов нужно доказать, что если , то .

Рангом набора [math] \tau [/math] называется , где [math]\tau_{1}(\tau)[/math] — длина кратчайшего вывода , [math]\tau_{2}(\tau)[/math] — длина кратчайшего вывода , [math]\tau_{3}(\tau)[/math] — длина кратчайшего вывода .

Докажем утверждение по индукции:
База: если ранг [math]\tau[/math] равен 0, то . Значит , [math]A = S[/math], следовательно . Значит по правилу 1 Индукционный переход: Пусть ранг [math]\tau[/math] равен [math]r \gt 0[/math], пусть для всех наборов с меньшими рангами утверждение верно. Докажем для набора [math]\tau[/math]. Для этого рассмотрим три случая:

1. [math]\alpha[/math] оканчивается терминалом
[math]\alpha = \alpha' a[/math]. , значит [math]a = a_{j}[/math]. Рассмотрим набор . , следовательно ранг [math]\tau'[/math] равен [math]r - 2[/math], так как . Значит по и.п. , по правилу 4 получаем, что будет добавлена в [math]I_{j}[/math].

2. [math]\alpha[/math] оканчивается нетерминалом
[math]\alpha = \alpha' B[/math]. , значит [math]\mathcal {9} k[/math] такое, что .
Рассмотрим набор , его ранг меньше [math]r[/math]. По и.п. .
Пусть [math]B \Rightarrow \eta[/math] — первый шаг в кратчайшем выводе . Рассмотрим набор . , следовательно .
Обозначим длину кратчайшего вывода за [math]n_1[/math], а длину кратчайшего вывода за [math]n_2[/math]. Тогда [math]\tau_3(\tau) = n_1 + n_2[/math]. Так как , то [math]\tau_3(\tau'') = n_2 - 1[/math]. Очевидно, что . Тогда ранг [math]\tau''[/math] равен . Значит по и.п. для [math]\tau''[/math], . Из того, что и по правилу 4 или 5 будет добавлена в [math]I_{j}[/math].

3. [math]\alpha[/math] является пустой

, значит .
Если , то , следовательно , откуда , а по и.п. . Значит . Тогда такие, что , где . Рассмотрим набор , где такое, что . Обозначим длину кратчайшего вывода за , а длину кратчайшего вывода за .
Найдем ранг . . Следовательно ранг равен . Значит по и.п. , следовательно по правилу 6 будет добавлена в .

Пример

Рассмотрим грамматику [math]G[/math] с правилами:
[math]S \rightarrow T + S[/math]
[math]S \rightarrow T [/math]
[math]T \rightarrow F * T[/math]
[math]T \rightarrow F[/math]
[math]F \rightarrow ( S )[/math]
[math]F \rightarrow a[/math]
Построим для строки [math]\omega = (a + a)[/math] список разбора.

[math]I_0[/math]
— из правила 1
[math][S \rightarrow \cdot T, 0][/math] — из правила 1
— из правила 3
[math][T \rightarrow \cdot F, 0][/math] — из правила 3
— из правила 3
[math][S \rightarrow \cdot a, 0][/math] — из правила 3

[math]I_1[/math]
— из правила 4
— из правила 6
[math][S \rightarrow \cdot T, 1][/math] — из правила 6
— из правила 6
[math][T \rightarrow \cdot F, 1][/math] — из правила 6
— из правила 6
[math][F \rightarrow \cdot a, 1][/math] — из правила 6

[math]I_2[/math]
[math][F \rightarrow a \cdot, 1][/math] — из правила 4
— из правила 5
— из правила 5
— из правила 5
— из правила 5
— из правила 5

[math]I_3[/math]
— из правила 4
— из правила 6
[math][S \rightarrow \cdot T, 3][/math] — из правила 6
— из правила 6
[math][T \rightarrow \cdot F, 3][/math] — из правила 6
— из правила 6
[math][F \rightarrow \cdot a, 3][/math] — из правила 6

[math]I_4[/math]
— из правила 4
— из правила 5
— из правила 5
— из правила 5
— из правила 5
— из правила 5
— из правила 5

[math]I_5[/math]
— из правила 4
— из правила 5
— из правила 5
— из правила 5
— из правила 5

Так как , то [math]\omega \in L(G) [/math].

Литература

Ахо А., Ульман Д. Теория синтакcического анализа, перевода и компиляции. Том 1. Синтаксический анализ. Пер. с англ. — М.:«Мир», 1978. С. 358 — 364.

@@ Строка 24: / Строка 24: @@
 Построим список разбора для <tex>\omega</tex>
 Строим <tex>I_0</tex><br>
-<i>Шаг 1.</i> Если <tex>S \rightarrow \alpha \in P</tex>, включить <tex>[S \rightarrow \cdot \alpha, 0]</tex> в <tex>I_0</tex>.<br>
+<i>Шаг 1.</i> Если <tex>(S \rightarrow \alpha) \in P</tex>, включить <tex>[S \rightarrow \cdot \alpha, 0]</tex> в <tex>I_0</tex>.<br>
 Пока можно включить новые ситуации в <tex>I_0</tex> повторяем шаги 2 и 3.<br>
 <i>Шаг 2.</i> Если <tex>[B \rightarrow \gamma \cdot, 0] \in I_0</tex>, включить в <tex>I_0</tex> ситуацию <tex>[A \rightarrow \alpha B \cdot \beta, 0]</tex> для всех <tex>[A \rightarrow \alpha \cdot B \beta, 0]</tex> из <tex>I_0</tex>.<br>
-<i>Шаг 3.</i> Для всех <tex>[A \rightarrow \alpha \cdot B \beta, 0] \in I_0</tex>, для всех <tex>\gamma</tex> таких, что <tex>B \rightarrow \gamma \in P</tex> включить <tex>[B \rightarrow \cdot \gamma, 0]</tex> в <tex>I_0</tex>.<br>
+<i>Шаг 3.</i> Для всех <tex>[A \rightarrow \alpha \cdot B \beta, 0] \in I_0</tex>, для всех <tex>\gamma</tex> таких, что <tex>(B \rightarrow \gamma) \in P</tex> включить <tex>[B \rightarrow \cdot \gamma, 0]</tex> в <tex>I_0</tex>.<br>
 Построение <tex>I_j</tex> по <tex>I_0, I_1, ..., I_{j-1}</tex>. <br>
 <i>Шаг 4.</i> Для каждой ситуации <tex>[B \rightarrow \alpha \cdot a_{j} \beta, i] \in I_{j-1}</tex>, где <tex>a_j</tex> — j-й символ в <tex>\omega</tex>, включить <tex>[B \rightarrow \alpha a_{j} \cdot \beta, i] </tex> в <tex>I_j</tex>.<br>
@@ Строка 61: / Строка 61: @@
 *<i>Рангом набора </i> <tex> \tau </tex> называется <tex> \tau_{1}(\tau) + 2(j + \tau_{2}(\tau) + \tau_{3}(\tau))</tex>, где <tex>\tau_{1}(\tau)</tex> — длина кратчайшего вывода <tex>S \Rightarrow^* \gamma A \delta </tex>, <tex>\tau_{2}(\tau)</tex> — длина кратчайшего вывода <tex>\gamma \Rightarrow^* a_1...a_{i}</tex>, <tex>\tau_{3}(\tau)</tex> — длина кратчайшего вывода <tex>\alpha \Rightarrow^* a_{i+1}...a_{j}</tex>.
 Докажем утверждение по индукции:<br>
-База: если ранг <tex>\tau</tex> равен 0, то <tex>\tau_{1} = \tau_{2} = \tau_{3} = j = i = 0</tex>. Значит <tex>\alpha = \gamma = \delta = \varepsilon </tex>, <tex>A = S</tex>, следовательно <tex>S \rightarrow \beta \in P</tex>. Значит по правилу 1 <tex>[S \rightarrow \cdot \beta, 0] \in I_0</tex>
+База: если ранг <tex>\tau</tex> равен 0, то <tex>\tau_{1} = \tau_{2} = \tau_{3} = j = i = 0</tex>. Значит <tex>\alpha = \gamma = \delta = \varepsilon </tex>, <tex>A = S</tex>, следовательно <tex>(S \rightarrow \beta) \in P</tex>. Значит по правилу 1 <tex>[S \rightarrow \cdot \beta, 0] \in I_0</tex>
 Индукционный переход:
 Пусть ранг <tex>\tau</tex> равен <tex>r > 0</tex>, пусть для всех наборов с меньшими рангами утверждение верно. Докажем для набора <tex>\tau</tex>. Для этого рассмотрим три случая:<br> <br>
 <b>1. <tex>\alpha</tex> оканчивается терминалом </b> <br>
-<tex>\alpha = \alpha' a</tex>. <tex>\alpha \Rightarrow^*a_{i+1}...a_{j}</tex>, значит <tex>a = a_{j}</tex>. Рассмотрим набор <tex>\tau' = \mathcal {f} \alpha', a_{j} \beta, \gamma, \delta, A, i, j-1 \mathcal {g} </tex>. <tex>A \rightarrow \alpha' a_{j} \beta \in P</tex>, следовательно ранг <tex>\tau'</tex> равен <tex>r - 2</tex>, так как <tex>\tau_{1}(\tau) = \tau_1(\tau'), \tau_2(\tau) = \tau_2(\tau'), \tau_{3}(\tau) = \tau_3(\tau')</tex>. Значит по и.п. <tex>[A \rightarrow \alpha' \cdot a_{j} \beta, i] \in I_{j-1}</tex>, по правилу 4 получаем, что <tex>[A \rightarrow \alpha \cdot \beta, i] </tex> будет добавлена в <tex>I_{j}</tex>. <br> <br>
+<tex>\alpha = \alpha' a</tex>. <tex>\alpha \Rightarrow^*a_{i+1}...a_{j}</tex>, значит <tex>a = a_{j}</tex>. Рассмотрим набор <tex>\tau' = \mathcal {f} \alpha', a_{j} \beta, \gamma, \delta, A, i, j-1 \mathcal {g} </tex>. <tex>(A \rightarrow \alpha' a_{j} \beta) \in P</tex>, следовательно ранг <tex>\tau'</tex> равен <tex>r - 2</tex>, так как <tex>\tau_{1}(\tau) = \tau_1(\tau'), \tau_2(\tau) = \tau_2(\tau'), \tau_{3}(\tau) = \tau_3(\tau')</tex>. Значит по и.п. <tex>[A \rightarrow \alpha' \cdot a_{j} \beta, i] \in I_{j-1}</tex>, по правилу 4 получаем, что <tex>[A \rightarrow \alpha \cdot \beta, i] </tex> будет добавлена в <tex>I_{j}</tex>. <br> <br>
 <b> 2. <tex>\alpha</tex> оканчивается нетерминалом </b><br>
 <tex>\alpha = \alpha' B</tex>. <tex>\alpha \Rightarrow^*a_{i+1}...a_{j}</tex>, значит <tex>\mathcal {9} k</tex> такое, что <tex>\alpha' \Rightarrow^*a_{i+1}...a_{k}, B \Rightarrow^* a_{k+1}...a_{j}</tex>.<br> Рассмотрим набор <tex>\tau' = \mathcal {f} \alpha', B \beta, \gamma, \delta, A, i, k \mathcal {g} </tex>, его ранг меньше <tex>r</tex>. По и.п. <tex>[A \rightarrow \alpha' \cdot B \beta, i] \in I_{k}</tex>. <br>Пусть <tex>B \Rightarrow \eta</tex> — первый шаг в кратчайшем выводе <tex>B \Rightarrow^* a_{k+1}...a_{j}</tex>. Рассмотрим набор <tex>\tau'' = \mathcal {f} \eta, \varepsilon, \gamma \alpha', \beta \delta, B, k, j \mathcal {g} </tex>. <tex>S \Rightarrow^* \gamma A \delta \Rightarrow \gamma \alpha' B \beta \delta</tex>, следовательно <tex>\tau_1(\tau'') \leqslant \tau_1(\tau) + 1</tex>.<br> Обозначим длину кратчайшего вывода <tex>\alpha' \Rightarrow^*a_{i+1}...a_{k}</tex> за <tex>n_1</tex>, а длину кратчайшего вывода <tex> B \Rightarrow^* a_{k+1}...a_{j}</tex> за <tex>n_2</tex>. Тогда <tex>\tau_3(\tau) = n_1 + n_2</tex>. Так как <tex> B \Rightarrow \eta \Rightarrow^* a_{k+1}...a_{j}</tex>, то <tex>\tau_3(\tau'') = n_2 - 1</tex>. Очевидно, что <tex>\tau_2(\tau'') = \tau_2(\tau) + n_1</tex>. Тогда ранг <tex>\tau''</tex> равен <tex>\tau_1(\tau'') + 2(\tau_2(\tau'') + \tau_3(\tau'') + j) \leqslant \tau_1(\tau) + 1 + 2(\tau_2(\tau) + n_1 + n_2 - 1 + j)</tex> <tex>= \tau_1(\tau) - 1 + 2(\tau_2(\tau) + \tau_3(\tau) + j) < r</tex>. Значит по и.п. для <tex>\tau''</tex>, <tex>[B \rightarrow \eta \cdot, k] \in I_{j}</tex>. Из того, что <tex>[A \rightarrow \alpha' \cdot B \beta, i] \in I_{k}</tex> и <tex>[B \rightarrow \eta \cdot, k] \in I_{j}</tex> по правилу 4 или 5 <tex>[A \rightarrow \alpha \cdot \beta, i] </tex> будет добавлена в <tex>I_{j}</tex>. <br> <br>

Алгоритм Эрли — различия между версиями

Версия 21:30, 7 декабря 2011

Содержание

Определения