Алгоритм Кока-Янгера-Касами, модификация для произвольной грамматики — различия между версиями

Версия 23:01, 17 января 2017

Задача:

Пусть дана контекстно-свободная грамматика и слово . Требуется выяснить, выводится ли это слово в данной грамматике.

Базовая версия данного алгоритма работает только для грамматик в нормальной форме Хомского. Модифицируем алгоритм для работы на произвольных контекстно-свободных грамматиках. Модификация алгоритма сильно проще в написании, чем приведение к нормальной форме Хомского, поэтому часто используют её, не смотря на то, что время работы у нее больше.

Алгоритм для произвольной грамматики

Будем решать задачу динамическим программированием. Введём динамику , аналогично базовой версии алгоритма.

Также введём вспомогательный четырехмерный массив тогда и только тогда, когда из префикса длины [math]k[/math] правой части данного правила можно вывести [math]w\left[i..j-1\right][/math].

Рассмотрим все тройки , где [math]m[/math] — константа и [math]m \lt n[/math], и [math]k[/math] такое, что [math]k \lt \left|\alpha\right|[/math].

База динамики:

, если в грамматике присутствует правило , иначе ;

.

Переход:

Пусть значения для всех нетерминалов, пар и уже вычислены, поэтому вспомогательная динамика: . То есть, подстроку можно вывести из префикса длины правой части данного правила, если из префикса длины правой части данного правила можно вывести , а подстрока выводится из -го символа правой части правила. Это вычисление может обратится к , но на результат это не повлияет, так как в данный момент .

Но если — терминал, то подстроку можно вывести из префикса длины правой части данного правила, если из префикса длины правой части данного правила можно вывести , а подстрока выводится, если .

Базовая динамика выражается так: . То есть, подстроку можно вывести из нетерминала , если из длины правой части данного правила можно вывести ,

Завершение:

После окончания работы ответ содержится в ячейке , где .

Псевдокод


 дано строка S из n символов: a1 ... an.
дано грамматика
дан массив a[A,i,j] булевских значений, инициализированных значениями Ложь.
дан массив h[A -> alpha, i, j, k] булевских значений, инициализированных значениями Ложь.
для каждого i = 1 : n
 для каждой продукции Rj -> ai
   присвоить P[1,i,j] = Истина
для каждого i = 2 : n                     -- длина интервала
 для каждого j = 1 : n-i+1               -- начало интервала
   для каждого k = 1 : i-1               -- разбиение интервала
     для каждой продукции RA -> RB RC
       если P[k,j,B] и P[i-k,j+k,C]
       то присвоить P[i,j,A] = Истина
если для некоторого x из множества s P[n,1,x] = Истина, где s все индексы Rs
то возвратить S принадлежит языку
иначе возвратить S не принадлежит языку

Оценка сложности

Обозначим — максимальную длину правой части правила.

Обработки правил вида [math]A \rightarrow w[i][/math], [math]A \rightarrow \varepsilon[/math] и нахождение выполняются за [math]O(n \cdot |\Gamma|)[/math].

Время одного перехода вспомогательной динамики [math]O(n)[/math], суммарное количество состояний . Отсюда расчёт вспомогательной динамики занимает времени, базовая динамика находится, как . Итоговая временная сложность алгоритма равна . Алгоритму требуется памяти.

См. также

Алгоритм Кока-Янгера-Касами, модификация для произвольной грамматики — различия между версиями

Версия 23:01, 17 января 2017

Содержание

Алгоритм для произвольной грамматики

Псевдокод

Оценка сложности

См. также

Навигация

Персональные инструменты

Пространства имён

Варианты

Просмотры

Ещё

Поиск

Навигация

Инструменты