Алгоритм Кока-Янгера-Касами, модификация для произвольной грамматики — различия между версиями
(→Алгоритм для произвольной грамматики) |
|||
| Строка 33: | Строка 33: | ||
:После окончания работы ответ содержится в ячейке <tex>a\left[S, 1, n\right]</tex>, где <tex>n = |w|</tex>. | :После окончания работы ответ содержится в ячейке <tex>a\left[S, 1, n\right]</tex>, где <tex>n = |w|</tex>. | ||
| + | |||
| + | == Псевдокод == | ||
| + | <code> | ||
| + | дано строка S из n символов: a1 ... an. | ||
| + | дано грамматика | ||
| + | дан массив a[A,i,j] булевских значений, инициализированных значениями Ложь. | ||
| + | дан массив h[A -> alpha, i, j, k] булевских значений, инициализированных значениями Ложь. | ||
| + | для каждого i = 1 : n | ||
| + | для каждой продукции Rj -> ai | ||
| + | присвоить P[1,i,j] = Истина | ||
| + | для каждого i = 2 : n -- длина интервала | ||
| + | для каждого j = 1 : n-i+1 -- начало интервала | ||
| + | для каждого k = 1 : i-1 -- разбиение интервала | ||
| + | для каждой продукции RA -> RB RC | ||
| + | если P[k,j,B] и P[i-k,j+k,C] | ||
| + | то присвоить P[i,j,A] = Истина | ||
| + | если для некоторого x из множества s P[n,1,x] = Истина, где s все индексы Rs | ||
| + | то возвратить S принадлежит языку | ||
| + | иначе возвратить S не принадлежит языку | ||
| + | </code> | ||
== Оценка сложности == | == Оценка сложности == | ||
Версия 23:01, 17 января 2017
| Задача: |
| Пусть дана контекстно-свободная грамматика и слово . Требуется выяснить, выводится ли это слово в данной грамматике. |
Базовая версия данного алгоритма работает только для грамматик в нормальной форме Хомского. Модифицируем алгоритм для работы на произвольных контекстно-свободных грамматиках. Модификация алгоритма сильно проще в написании, чем приведение к нормальной форме Хомского, поэтому часто используют её, не смотря на то, что время работы у нее больше.
Алгоритм для произвольной грамматики
Будем решать задачу динамическим программированием. Введём динамику , аналогично базовой версии алгоритма.
Также введём вспомогательный четырехмерный массив тогда и только тогда, когда из префикса длины правой части данного правила можно вывести .
Рассмотрим все тройки , где — константа и , и такое, что .
- База динамики:
- , если в грамматике присутствует правило , иначе ;
- , если в грамматике присутствует правило , иначе ;
- .
- Переход:
- Пусть значения для всех нетерминалов, пар и уже вычислены, поэтому вспомогательная динамика: . То есть, подстроку можно вывести из префикса длины правой части данного правила, если из префикса длины правой части данного правила можно вывести , а подстрока выводится из -го символа правой части правила. Это вычисление может обратится к , но на результат это не повлияет, так как в данный момент .
- Но если — терминал, то подстроку можно вывести из префикса длины правой части данного правила, если из префикса длины правой части данного правила можно вывести , а подстрока выводится, если .
- Базовая динамика выражается так: . То есть, подстроку можно вывести из нетерминала , если из длины правой части данного правила можно вывести ,
- Завершение:
- После окончания работы ответ содержится в ячейке , где .
Псевдокод
дано строка S из n символов: a1 ... an.
дано грамматика
дан массив a[A,i,j] булевских значений, инициализированных значениями Ложь.
дан массив h[A -> alpha, i, j, k] булевских значений, инициализированных значениями Ложь.
для каждого i = 1 : n
для каждой продукции Rj -> ai
присвоить P[1,i,j] = Истина
для каждого i = 2 : n -- длина интервала
для каждого j = 1 : n-i+1 -- начало интервала
для каждого k = 1 : i-1 -- разбиение интервала
для каждой продукции RA -> RB RC
если P[k,j,B] и P[i-k,j+k,C]
то присвоить P[i,j,A] = Истина
если для некоторого x из множества s P[n,1,x] = Истина, где s все индексы Rs
то возвратить S принадлежит языку
иначе возвратить S не принадлежит языку
Оценка сложности
Обозначим — максимальную длину правой части правила.
Обработки правил вида , и нахождение выполняются за .
Время одного перехода вспомогательной динамики , суммарное количество состояний . Отсюда расчёт вспомогательной динамики занимает времени, базовая динамика находится, как . Итоговая временная сложность алгоритма равна . Алгоритму требуется памяти.