Алгоритм Кока-Янгера-Касами разбора грамматики в НФХ — различия между версиями

Версия 07:51, 4 декабря 2011

Пусть дана контекстно-свободная грамматика грамматика [math]\Gamma[/math] и слово [math]w \in \Sigma^{*}[/math]. Требуется выяснить, выводится ли это слово в данной грамматике.

Алгоритм для НФХ-грамматики

Пусть [math]\Gamma[/math] приведена к нормальной форме Хомского.

Пусть [math]a_{A, i, j} = true[/math], если из нетерминала [math]A[/math] можно вывести подстроку [math]w[i..j][/math]. Иначе [math]a_{A, i, j} = false[/math]:

.

Будем динамически заполнять матрицу [math]a_{A, i, j}[/math] следующим алгоритмом (индукция по [math]m = j - i[/math]):

База. [math]m = 0[/math]. Ячейки [math]a_{A, i, i}[/math] заполняются значением [math]true[/math], если правило [math]A \rightarrow w[i][/math] принадлежит множеству правил [math]P[/math] грамматики [math]\Gamma[/math]: .

Переход. Рассмотрим все пары . Значения для всех нетерминалов и пар уже вычислены, так что: .

Завершение. После окончания работы ответ содержится в ячейке [math]a_{S, 1, n}[/math], где [math]n = |w|[/math].

Сложность алгоритма

Необходимо вычислить [math]n^2[/math] булевых величин. На каждую требуется затратить [math]n \cdot |P_A|[/math] операций, где [math]|P_A|[/math] – количество правил. Суммируя по всем правилам получаем конечную сложность .

Алгоритму требуется [math]n^2 \cdot |N|[/math] памяти, где [math]|N|[/math] — количество нетерминалов грамматики.

Недостаток алгоритма заключается в том, что изначально грамматику необходимо привести к НФХ.

@@ Строка 13: / Строка 13: @@
 </tex>.
-Будем динамически заполнять матрицу <tex>a_{A, i, j}</tex> следующим алгоритмом (индукция по <tex>m</tex>):
+Будем динамически заполнять матрицу <tex>a_{A, i, j}</tex> следующим алгоритмом (индукция по <tex>m = j - i</tex>):
-*'''База'''. Ячейки <tex>a_{A, i, i}</tex> заполняются истиной, если правило <tex>A \rightarrow w[i]</tex> принадлежит множеству правил <tex>P</tex> грамматики <tex>\Gamma</tex>:
+*'''База'''. <tex>m = 0</tex>. Ячейки <tex>a_{A, i, i}</tex> заполняются значением <tex>true</tex>, если правило <tex>A \rightarrow w[i]</tex> принадлежит множеству правил <tex>P</tex> грамматики <tex>\Gamma</tex>: <tex>a_{A, i, i} = \lbrack A \rightarrow w[i] \in P \rbrack</tex>.
-<tex>a_{A, i, i} = \lbrack A \rightarrow w[i] \in P \rbrack</tex>.
-*'''Переход'''. Пусть на текущем шаге <tex>j-i=m>0</tex>. Если все ячейки, для которых справедливо <tex>j-i<m</tex>, уже вычислены, то алгоритм смотрит, можно ли вывести подстроку <tex>w[i..j]</tex> из этих ячеек:
+*'''Переход'''. Рассмотрим все пары <tex>\lbrace \langle j, i \rangle | j-i=m \rbrace</tex>. Значения для всех нетерминалов и пар <tex>\lbrace \langle j', i' \rangle | j-i<m \rbrace</tex> уже вычислены, так что: <tex>a_{A, i, j} = \bigvee\limits_{k=i}^{j-1} \bigvee\limits_{A \rightarrow BC} \left( a_{B, i, k} \wedge a_{C, k+1, j}  \right)</tex>.
-<tex>a_{A, i, j} = \bigvee\limits_{k=i}^{j-1} \bigvee\limits_{A \rightarrow BC} \left( a_{B, i, k} \wedge a_{C, k+1, j}  \right)</tex>.
 [[Файл:CYK_rule_2.jpg]]
@@ Строка 28: / Строка 26: @@
 Необходимо вычислить <tex>n^2</tex> булевых величин. На каждую требуется затратить <tex>n \cdot |P_A|</tex> операций, где <tex>|P_A|</tex> – количество правил. Суммируя по всем правилам получаем конечную сложность <tex>O \left( n^3 \cdot |\Gamma| \right)</tex>.
-Алгоритму требуется <tex>n^2 \cdot |N|</tex> памяти, где <tex>|N|</tex> – количество нетерминалов грамматики.
+Алгоритму требуется <tex>n^2 \cdot |N|</tex> памяти, где <tex>|N|</tex> — количество нетерминалов грамматики.
-Минус алгоритма заключается в том, что изначально грамматику необходимо привести к НФХ.
+Недостаток алгоритма заключается в том, что изначально грамматику необходимо привести к НФХ.

Алгоритм Кока-Янгера-Касами разбора грамматики в НФХ — различия между версиями

Версия 07:51, 4 декабря 2011

Алгоритм для НФХ-грамматики

Сложность алгоритма

Навигация

Персональные инструменты

Пространства имён

Варианты

Просмотры

Ещё

Поиск

Навигация

Инструменты