Алгоритм Кока-Янгера-Касами, модификация для произвольной грамматики — различия между версиями
Строка 1: | Строка 1: | ||
Пусть дана [[Контекстно-свободные грамматики, вывод, лево- и правосторонний вывод, дерево разбора|контекстно-свободная грамматика]] грамматика <tex>\Gamma</tex> и слово <tex>w \in \Sigma^{*}</tex>. Требуется выяснить, выводится ли это слово в данной грамматике. | Пусть дана [[Контекстно-свободные грамматики, вывод, лево- и правосторонний вывод, дерево разбора|контекстно-свободная грамматика]] грамматика <tex>\Gamma</tex> и слово <tex>w \in \Sigma^{*}</tex>. Требуется выяснить, выводится ли это слово в данной грамматике. | ||
− | [[Алгоритм_Кока-Янгера-Касами_разбора_грамматики_в_НФХ|Базовая версия]] данного алгоритма работает только для грамматик в [[нормальная форма Хомского|нормальной форме Хомского]]. Модифицируем алгоритм для работы на произвольных контекстно-свободных грамматиках. | + | [[Алгоритм_Кока-Янгера-Касами_разбора_грамматики_в_НФХ|Базовая версия]] данного алгоритма работает только для грамматик в [[нормальная форма Хомского|нормальной форме Хомского]]. Модифицируем алгоритм для работы на произвольных контекстно-свободных грамматиках. В отличии от базовой версии, нам не важны [[Удаление_цепных_правил_из_грамматики|цепные правила]] и [[Удаление_eps-правил_из_грамматики|<tex>\varepsilon</tex>-правила]]. |
== Алгоритм для произвольной грамматики == | == Алгоритм для произвольной грамматики == | ||
Строка 19: | Строка 19: | ||
<tex>\forall A \rightarrow \alpha \:\: h\left[A \rightarrow \alpha, i, i, 0\right] = true</tex>. | <tex>\forall A \rightarrow \alpha \:\: h\left[A \rightarrow \alpha, i, i, 0\right] = true</tex>. | ||
− | * '''Переход''': Пусть значения для всех нетерминалов, пар <tex>\lbrace \langle j', i' \rangle | j' - i' < m \rbrace</tex> и <tex>\lbrace k' | k' < k \rbrace</tex> уже вычислены, поэтому вспомогательная динамика: <tex> | + | * '''Переход''': Пусть значения для всех нетерминалов, пар <tex>\lbrace \langle j', i' \rangle | j' - i' < m \rbrace</tex> и <tex>\lbrace k' | k' < k \rbrace</tex> уже вычислены, поэтому вспомогательная динамика: <tex> h\left[A \rightarrow \alpha, i, j+1, k\right] = \bigvee\limits_{r=i..j+1}\left(h\left[A \rightarrow \alpha, i, r, k-1\right] \wedge a\left[\alpha,r,j+1\right]\right)</tex>. То есть, подстроку <tex>w[i \dots j]</tex> можно вывести из префикса длины <tex>k</tex> правой части данного правила, если из префикса длины <tex>k-1</tex> правой части данного правила можно вывести <tex>w\left[i..j-1\right]</tex>, а подстрока <tex>w[r \dots j]</tex> выводится из правой части данного правила. Это вычисление может обратится к <tex>a\left[A,i,j+1\right]</tex>, но на результат это не повлияет, так так в данный момент <tex>a\left[A,i,j\right]=false</tex>. |
− | Главная динамика выражается так: <tex>a\left[A,i,j\right]=\bigvee\limits_{A \rightarrow \alpha}h\left[A \rightarrow \alpha, i, j, \left|\alpha\right|\right]</tex>. | + | Главная динамика выражается так: <tex>a\left[A,i,j\right]=\bigvee\limits_{A \rightarrow \alpha}h\left[A \rightarrow \alpha, i, j, \left|\alpha\right|\right]</tex>. То есть, подстроку <tex>w[i \dots j-1]</tex> можно вывести из нетерминала <tex>A</tex>, если из длины правой части данного правила можно вывести <tex>w\left[i..j-1\right]</tex>, |
* '''Завершение''': После окончания работы ответ содержится в ячейке <tex>a\left[S, 1, n\right]</tex>, где <tex>n = |w|</tex>. | * '''Завершение''': После окончания работы ответ содержится в ячейке <tex>a\left[S, 1, n\right]</tex>, где <tex>n = |w|</tex>. |
Версия 19:34, 17 января 2017
Пусть дана контекстно-свободная грамматика грамматика и слово . Требуется выяснить, выводится ли это слово в данной грамматике.
Базовая версия данного алгоритма работает только для грамматик в нормальной форме Хомского. Модифицируем алгоритм для работы на произвольных контекстно-свободных грамматиках. В отличии от базовой версии, нам не важны цепные правила и . -правила
Алгоритм для произвольной грамматики
Будем решать задачу динамическим программированием. Введём динамику базовой версии алгоритма.
, аналогичноТакже введём вспомогательный четырехмерный массив
тогда и только тогда, когда из префикса длины правой части данного правила можно вывести .Рассмотрим все тройки
, где — константа и , и такое, что .- База динамики:
, если в грамматике присутствует правило , иначе ;
, если в грамматике присутствует правило , иначе ;
.
- Переход: Пусть значения для всех нетерминалов, пар и уже вычислены, поэтому вспомогательная динамика: . То есть, подстроку можно вывести из префикса длины правой части данного правила, если из префикса длины правой части данного правила можно вывести , а подстрока выводится из правой части данного правила. Это вычисление может обратится к , но на результат это не повлияет, так так в данный момент .
Главная динамика выражается так:
. То есть, подстроку можно вывести из нетерминала , если из длины правой части данного правила можно вывести ,- Завершение: После окончания работы ответ содержится в ячейке , где .
Оценка сложности
Обозначим
— максимальную длину правой части правила.Расчёт вспомогательной динамики занимает
времени, основной динамики — . Итоговая временная сложность алгоритма равна . Алгоритму требуется памяти.