Алгоритм Кока-Янгера-Касами, модификация для произвольной грамматики — различия между версиями

Версия 18:25, 14 мая 2019

Задача:

Пусть дана контекстно-свободная грамматика и слово . Требуется выяснить, выводится ли это слово в данной грамматике.

Базовая версия данного алгоритма работает только для грамматик в нормальной форме Хомского. Модифицируем алгоритм для работы на произвольных контекстно-свободных грамматиках. Модификация алгоритма сильно проще в написании, чем приведение к нормальной форме Хомского, поэтому часто используют её, не смотря на то, что время работы у нее больше.

Алгоритм для произвольной грамматики

Будем решать задачу динамическим программированием. Введём динамику , аналогично базовой версии алгоритма.

Также введём вспомогательный четырехмерный массив тогда и только тогда, когда из префикса длины [math]k[/math] правой части данного правила можно вывести [math]w\left[i..j-1\right][/math].

Рассмотрим все тройки , где [math]m[/math] — константа и [math]m \lt n[/math], и [math]k[/math] такое, что [math]k \lt \left|\alpha\right|[/math].

База динамики:

, если в грамматике присутствует правило , иначе ;

.

Переход:

Пусть значения для всех нетерминалов, пар и уже вычислены, поэтому вспомогательная динамика: . То есть, подстроку можно вывести из префикса длины правой части данного правила, если из префикса длины правой части данного правила можно вывести , а подстрока выводится из -го символа правой части правила. Это вычисление может обратится к , но на результат это не повлияет, так как в данный момент .

Но если — терминал, то подстроку можно вывести из префикса длины правой части данного правила, если из префикса длины правой части данного правила можно вывести , а подстрока выводится, если .

Базовая динамика выражается так: . То есть, подстроку можно вывести из нетерминала , если из длины правой части данного правила можно вывести .

Завершение:

После окончания работы ответ содержится в ячейке , где .

Псевдокод


CYK_Modified(S, Г): // S — строка длины n, Г — КС-грамматика 
     for i = 1..n
      for Rj -> alpha // перебор состояний 
       if( A -> w[i] in Г) a[A, i, i+1] = true // если в грамматике Г присутствует правило A -> w[i] 
       else a[A, i, i+1] = false
       if( A -> eps in Г) a[A, i, i] = true // если в грамматике Г присутствует правило A -> eps 
       else a[A, i, i] = false
       h[A->alpha, i, i, 0] = true
     for m = 1..n
      for i = 1..n
          j = i+m
       for k = 1..M
        for Rj -> alpha // перебор состояний 
         h[A->alpha, i, j+1, k] = OR( for r = i..j+1) (h[A->alpha, i, r, k-1] & a[alpha[k],r,j+1])
     for i = 1..n
       for j = 1..n
         for Rj -> alpha
          a[A, i, j] = OR( for A->alpha) h[A->alpha, i, j, |alpha|] // где |alpha| — размер правой части правила
     return a[S, 1, n]

Оценка сложности

Обозначим — максимальную длину правой части правила.

Обработки правил вида [math]A \rightarrow w[i][/math], [math]A \rightarrow \varepsilon[/math] и нахождение выполняются за [math]O(n \cdot |\Gamma|)[/math].

Время одного перехода вспомогательной динамики [math]O(n)[/math], суммарное число состояний . Отсюда расчёт вспомогательной динамики занимает времени, базовая динамика находится, как . Итоговая временная сложность алгоритма равна . Алгоритму требуется памяти.

См. также

@@ Строка 8: / Строка 8: @@
 == Алгоритм для произвольной грамматики ==
-Будем решать задачу динамическим программированием. Введём динамику <tex>a\left[A,i,j\right] = \left[A \Rightarrow^{*} w[i..j-1]\right]</tex>, аналогично [[Алгоритм_Кока-Янгера-Касами_разбора_грамматики_в_НФХ|базовой версии]] алгоритма.
+Будем решать задачу динамическим программированием. Введём динамику <tex>a\left[A,i,j\right] = \left[A \Rightarrow^{*} w[i..j-1]\right] \ </tex>, аналогично [[Алгоритм_Кока-Янгера-Касами_разбора_грамматики_в_НФХ|базовой версии]] алгоритма.
 Также введём вспомогательный четырехмерный массив <tex>h\left[A \rightarrow \alpha, i, j, k\right] = true \ </tex> тогда и только тогда, когда из префикса длины <tex>k</tex> правой части данного правила можно вывести <tex>w\left[i..j-1\right]</tex>.
@@ Строка 16: / Строка 16: @@
 * '''База динамики''':
-:<tex>a\left[A, i, i+1\right] = true</tex>, если в грамматике <tex>\Gamma</tex> присутствует правило <tex>A \rightarrow w[i]</tex>, иначе  <tex>a\left[A, i, i+1\right] = false</tex>;
+:<tex>a\left[A, i, i+1\right] = true \ </tex>, если в грамматике <tex>\Gamma</tex> присутствует правило <tex>A \rightarrow w[i] \ </tex>, иначе  <tex>a\left[A, i, i+1\right] = false \ </tex>;
-:<tex>a\left[A, i, i\right] =  true</tex>, если в грамматике <tex>\Gamma</tex> присутствует правило <tex>A \rightarrow \varepsilon</tex>, иначе <tex>a\left[A, i, i\right] =  false</tex>;
+:<tex>a\left[A, i, i\right] =  true \ </tex>, если в грамматике <tex>\Gamma</tex> присутствует правило <tex>A \rightarrow \varepsilon \ </tex>, иначе <tex>a\left[A, i, i\right] =  false \ </tex>;
-:<tex>h\left[A \rightarrow \alpha, i, i, 0\right] = true</tex>.
+:<tex>h\left[A \rightarrow \alpha, i, i, 0\right] = true \ </tex>.
 * '''Переход''':
-:Пусть значения для всех нетерминалов, пар <tex>\lbrace \langle j', i' \rangle \mid j' - i' < m \rbrace</tex> и <tex>\lbrace k' \mid k' < k \rbrace</tex> уже вычислены, поэтому вспомогательная динамика: <tex> h\left[A \rightarrow \alpha, i, j+1, k\right] = \bigvee\limits_{r=i..j+1}\left(h\left[A \rightarrow \alpha, i, r, k-1\right] \wedge a\left[\alpha\left[k\right],r,j+1\right]\right)</tex>. То есть, подстроку <tex>w[i..j]</tex> можно вывести из префикса длины <tex>k</tex> правой части данного правила, если из префикса длины <tex>k-1</tex> правой части данного правила можно вывести <tex>w\left[i..r-1\right]</tex>, а подстрока <tex>w[r..j]</tex> выводится из <tex>k</tex>-го символа правой части правила. Это вычисление может обратится к <tex>a\left[A,i,j+1\right]</tex>, но на результат это не повлияет, так как в данный момент <tex>a\left[A,i,j+1\right]=false</tex>.
+:Пусть значения для всех нетерминалов, пар <tex>\lbrace \langle j', i' \rangle \mid j' - i' < m \rbrace \ </tex> и <tex>\lbrace k' \mid k' < k \rbrace \ </tex> уже вычислены, поэтому вспомогательная динамика: <tex> h\left[A \rightarrow \alpha, i, j+1, k\right] = \bigvee\limits_{r=i..j+1}\left(h\left[A \rightarrow \alpha, i, r, k-1\right] \wedge a\left[\alpha\left[k\right],r,j+1\right]\right)</tex>. То есть, подстроку <tex>w[i..j]</tex> можно вывести из префикса длины <tex>k</tex> правой части данного правила, если из префикса длины <tex>k-1</tex> правой части данного правила можно вывести <tex>w\left[i..r-1\right]</tex>, а подстрока <tex>w[r..j]</tex> выводится из <tex>k</tex>-го символа правой части правила. Это вычисление может обратится к <tex>a\left[A,i,j+1\right]</tex>, но на результат это не повлияет, так как в данный момент <tex>a\left[A,i,j+1\right]=false</tex>.
-:Но если <tex>\alpha\left[k\right]</tex>  {{---}}  терминал, то подстроку <tex>w[i..j]</tex> можно вывести из префикса длины <tex>k</tex> правой части данного правила, если из префикса длины <tex>k-1</tex> правой части данного правила можно вывести <tex>w\left[i..r-1\right]</tex>, а подстрока <tex>w[r..j]</tex> выводится, если <tex>w\left[r..j\right]=\alpha\left[k\right]</tex>.
+:Но если <tex>\alpha\left[k\right]</tex>  {{---}}  терминал, то подстроку <tex>w[i..j]</tex> можно вывести из префикса длины <tex>k</tex> правой части данного правила, если из префикса длины <tex>k-1</tex> правой части данного правила можно вывести <tex>w\left[i..r-1\right] \ </tex>, а подстрока <tex>w[r..j]</tex> выводится, если <tex>w\left[r..j\right]=\alpha\left[k\right]</tex>.
-:Базовая динамика выражается так: <tex>a\left[A,i,j\right]=\bigvee\limits_{A \rightarrow \alpha}h\left[A \rightarrow \alpha, i, j, \left|\alpha\right|\right]</tex>. То есть, подстроку <tex>w[i..j-1]</tex> можно вывести из нетерминала <tex>A</tex>, если из длины правой части данного правила можно вывести <tex>w\left[i..j-1\right]</tex>,
+:Базовая динамика выражается так: <tex>a\left[A,i,j\right]=\bigvee\limits_{A \rightarrow \alpha}h\left[A \rightarrow \alpha, i, j, \left|\alpha\right|\right] \ </tex>. То есть, подстроку <tex>w[i..j-1] \ </tex> можно вывести из нетерминала <tex>A</tex>, если из длины правой части данного правила можно вывести <tex>w\left[i..j-1\right] \ </tex>.
 * '''Завершение''':
-:После окончания работы ответ содержится в ячейке <tex>a\left[S, 1, n\right]</tex>, где <tex>n = |w|</tex>.
+:После окончания работы ответ содержится в ячейке <tex>a\left[S, 1, n\right] </tex>, где <tex>n = |w|</tex>.
 == Псевдокод ==

Алгоритм Кока-Янгера-Касами, модификация для произвольной грамматики — различия между версиями

Версия 18:25, 14 мая 2019

Содержание

Алгоритм для произвольной грамматики

Псевдокод

Оценка сложности

См. также

Навигация

Персональные инструменты

Пространства имён

Варианты

Просмотры

Ещё

Поиск

Навигация

Инструменты