Алгоритм Кока-Янгера-Касами разбора грамматики в НФХ

Задача:

Пусть дана контекстно-свободная грамматика в нормальной форме Хомского и слово . Требуется выяснить, выводится ли это слово в данной грамматике.

Содержание

1 Алгоритм
2 Модификации
- 2.1 Количество способов вывести слово
- 2.2 Минимальная стоимость вывода слова
3 Асимптотика
4 Пример работы
5 См. также
6 Источники информации

Алгоритм

Алгоритм Кока-Янгера-Касами (англ. Cocke-Younger-Kasami algorithm, англ. CYK - алгоритм) — универсальный алгоритм, позволяющий по слову узнать, выводимо ли оно в заданной КС-грамматике в нормальной форме Хомского. Будем решать задачу динамическим программированием. Дана строка [math]w[/math] размером [math]n[/math]. Заведем для неё трехмерный массив [math]d[/math] размером [math]|\Gamma| \times n \times n[/math], состоящий из логических значений, и [math]d[A][i][j] = true[/math] тогда и только тогда, когда из нетерминала [math]A[/math] правилами грамматики можно вывести подстроку [math]w[i \dots j][/math].

Рассмотрим все пары , где [math]m[/math] — константа и [math]m \lt n[/math].

[math]i = j[/math]. Инициализируем массив для всех нетерминалов, из которых выводится какой-либо символ строки [math]w[/math]. В таком случае [math]d[A][i][i] = true[/math], если в грамматике [math]\Gamma[/math] присутствует правило [math]A \rightarrow w[i][/math]. Иначе [math]d[A][i][i] = false[/math].

[math]i \ne j[/math]. Значения для всех нетерминалов и пар уже вычислены, поэтому . То есть, подстроку [math]w[i \dots j][/math] можно вывести из нетерминала [math]A[/math], если существует продукция вида [math]A \rightarrow BC[/math] и такое [math]k[/math], что подстрока [math]w[i \dots k][/math] выводима из [math]B[/math], а подстрока [math]w[k + 1 \dots j][/math] выводится из [math]C[/math].

После окончания работы значение [math]d[S][1][n][/math] содержит ответ на вопрос, выводима ли данная строка в данной грамматике, где [math]S[/math] — начальный символ грамматики.

Модификации

Количество способов вывести слово

Если массив будет хранить целые числа, а формулу заменить на , то [math]d[A][i][j][/math] — количество способов получить подстроку [math]w[i \dots j][/math] из нетерминала [math]A[/math].

Минимальная стоимость вывода слова

Пусть [math]P(A \rightarrow BC)[/math] — стоимость вывода по правилу [math]A \rightarrow BC[/math]. Тогда, если использовать формулу , то [math]d[A][i][j][/math] — минимальная стоимость вывода подстроки [math]w[i \dots j][/math] из нетерминала [math]A[/math].

Таким образом, задача о выводе в КС-грамматике в нормальной форме Хомского является обобщением задачи динамического программирования на подотрезке.

Асимптотика

Обработка правил вида [math]A \rightarrow w[i][/math] в шаге 1 выполняется за [math]O(n \cdot |\Gamma|)[/math].

Проход по всем подстрокам в шаге 2 выполняется за [math]O(n^2)[/math]. В обработке одной подстроки присутствует цикл по всем правилам вывода и по всем разбиениям на две подстроки, следовательно обработка работает за [math]O(n \cdot |\Gamma|)[/math]. В итоге получаем конечную сложность [math]O(n^3 \cdot |\Gamma|)[/math].

Пример работы

Дана грамматика правильных скобочных последовательностей [math]\Gamma[/math]:

Дано слово [math]w = $()(())$[/math].

Инициализация массива .

A
	1	2	3	4	5	6
1
2
3
4
5
6

B
	1	2	3	4	5	6
1	●
2
3			●
4				●
5
6

C
	1	2	3	4	5	6
1
2		●
3
4
5					●
6						●

D
	1	2	3	4	5	6
1
2
3
4
5
6

E
	1	2	3	4	5	6
1
2		●
3
4
5					●
6						●

Заполнение массива .

Итерация m = .

A
	1	2	3	4	5	6
1		●
2
3
4					●
5
6

B
	1	2	3	4	5	6
1	●
2
3			●
4				●
5
6

C
	1	2	3	4	5	6
1
2		●
3
4
5					●
6						●

D
	1	2	3	4	5	6
1		●
2
3
4					●
5
6

E
	1	2	3	4	5	6
1
2		●
3
4
5					●
6						●

Итерация m = .

A
	1	2	3	4	5	6
1		●
2
3
4					●
5
6

B
	1	2	3	4	5	6
1	●
2
3			●
4				●
5
6

C
	1	2	3	4	5	6
1
2		●
3
4						●
5					●
6						●

D
	1	2	3	4	5	6
1		●
2
3
4					●
5
6

E
	1	2	3	4	5	6
1
2		●
3
4
5					●
6						●

Итерация m = .

A
	1	2	3	4	5	6
1		●
2
3						●
4					●
5
6

B
	1	2	3	4	5	6
1	●
2
3			●
4				●
5
6

C
	1	2	3	4	5	6
1
2		●
3
4						●
5					●
6						●

D
	1	2	3	4	5	6
1		●
2
3						●
4					●
5
6

E
	1	2	3	4	5	6
1
2		●
3
4
5					●
6						●

Итерация m = .

A
	1	2	3	4	5	6
1		●
2
3						●
4					●
5
6

B
	1	2	3	4	5	6
1	●
2
3			●
4				●
5
6

C
	1	2	3	4	5	6
1
2		●
3
4						●
5					●
6						●

D
	1	2	3	4	5	6
1		●
2
3						●
4					●
5
6

E
	1	2	3	4	5	6
1
2		●
3
4
5					●
6						●

Итерация m = .

A
	1	2	3	4	5	6
1		●
2
3						●
4					●
5
6

B
	1	2	3	4	5	6
1	●
2
3			●
4				●
5
6

C
	1	2	3	4	5	6
1
2		●
3
4						●
5					●
6						●

D
	1	2	3	4	5	6
1		●
2
3						●
4					●
5
6

E
	1	2	3	4	5	6
1
2		●
3
4
5					●
6						●

Итерация m = .

A
	1	2	3	4	5	6
1		●
2
3						●
4					●
5
6

B
	1	2	3	4	5	6
1	●
2
3			●
4				●
5
6

C
	1	2	3	4	5	6
1
2		●
3
4						●
5					●
6						●

D
	1	2	3	4	5	6
1		●
2
3						●
4					●
5
6

E
	1	2	3	4	5	6
1
2		●
3
4
5					●
6						●

См. также

Источники информации

Алгоритм Кока-Янгера-Касами разбора грамматики в НФХ

Содержание

Алгоритм

Модификации

Количество способов вывести слово

Минимальная стоимость вывода слова

Асимптотика

Пример работы

См. также

Источники информации

Навигация

Персональные инструменты

Пространства имён

Варианты

Просмотры

Ещё

Поиск

Навигация

Инструменты