Алгоритм Кока-Янгера-Касами, модификация для произвольной грамматики — различия между версиями
(Более подробное описание) |
|||
Строка 4: | Строка 4: | ||
== Алгоритм для произвольной грамматики == | == Алгоритм для произвольной грамматики == | ||
− | Обозначим <tex>M = \max\limits_{A \rightarrow \alpha}\left|\alpha\right|</tex> — максимальную длину правой части правила. | + | Обозначим <tex>M = \max\limits_{A \rightarrow \alpha}\left|\alpha\right|</tex> — максимальную длину правой части правила. |
− | Введём | + | Будем решать задачу динамическим программированием. Введём динамику <tex>a\left[A,i,j\right] = \left[A \Rightarrow^{*} w[i..j]\right]</tex>, аналогично базовой версии алгоритма. |
− | + | Также введём вспомогательный трехмерный массив <tex>h\left[A \rightarrow \alpha, i, j, k\right] = true</tex> тогда и только тогда, когда из префикса длины <tex>k</tex> правой части данного правила можно вывести <tex>w\left[i..j\right]</tex>. | |
− | * ''' | + | * '''База динамики''': <tex>a\left[A, i, i\right] = true</tex>, если в грамматике <tex>\Gamma</tex> присутствует правило <tex>A \rightarrow w[i]</tex>, иначе <tex>a\left[A, i, i\right] = false</tex>. <tex>a\left[A, i, i\right] = \left[ A \rightarrow w[i] \in P \right]</tex> — вывод терминалов, <tex>a\left[A, i, i-1\right] = \left[ A \rightarrow \varepsilon \right]</tex> — <tex>\varepsilon</tex>-вывод; <tex>\forall A \rightarrow \alpha \:\: h\left[A \rightarrow \alpha, i, i-1, 0\right] = true</tex> — <tex>\varepsilon</tex>-вывод для <tex>\varepsilon</tex>-префиксов правил. |
− | * '''Завершение''': После окончания работы ответ содержится в ячейке <tex> | + | * '''Переход''': Пусть для всех подстрок <tex>w[i..j]</tex> динамики уже вычислены. Сначала вычислим вспомогательную динамику: <tex>\forall k: h\left[A \rightarrow \alpha, i, j, k\right] = \bigvee\limits_{r=i-1..j}\left(h\left[A \rightarrow \alpha, i, r, k-1\right] \wedge a\left[\alpha[k],r+1,j\right]\right)</tex>. Это вычисление может обратится к <tex>a\left[A,i,j\right]</tex>, но на результат это не повлияет, так так в данный момент <tex>a\left[A,i,j\right]=false</tex>. Главная динамика выражается так: <tex>a\left[A,i,j\right]=\bigvee\limits_{A \rightarrow \alpha}h\left[A \rightarrow \alpha, i, j, \left|\alpha\right|\right]</tex>. |
+ | |||
+ | * '''Завершение''': После окончания работы ответ содержится в ячейке <tex>a\left[S, 1, n\right]</tex>, где <tex>n = |w|</tex>. | ||
== Оценка сложности == | == Оценка сложности == |
Версия 14:53, 17 января 2017
Пусть дана контекстно-свободная грамматика грамматика и слово . Требуется выяснить, выводится ли это слово в данной грамматике.
Базовая версия данного алгоритма работает только для грамматик в нормальной форме Хомского. Модифицируем алгоритм для работы на произвольных контекстно-свободных грамматиках без цепных правил и без . -правил
Алгоритм для произвольной грамматики
Обозначим
— максимальную длину правой части правила.Будем решать задачу динамическим программированием. Введём динамику
, аналогично базовой версии алгоритма.Также введём вспомогательный трехмерный массив
тогда и только тогда, когда из префикса длины правой части данного правила можно вывести .- База динамики: , если в грамматике присутствует правило , иначе . — вывод терминалов, — -вывод; — -вывод для -префиксов правил.
- Переход: Пусть для всех подстрок динамики уже вычислены. Сначала вычислим вспомогательную динамику: . Это вычисление может обратится к , но на результат это не повлияет, так так в данный момент . Главная динамика выражается так: .
- Завершение: После окончания работы ответ содержится в ячейке , где .
Оценка сложности
Расчёт вспомогательной динамики занимает
времени, основной динамики — . Итоговая временная сложность алгоритма равна . Алгоритму требуется памяти.