LL(k)-грамматики, множества FIRST и FOLLOW

Эта статья находится в разработке!

Наибольший интерес в построении синтаксических анализаторов (парсеров) представляют LL(1)-грамматики, так как для них возможно построение нисходящих парсеров без возврата, то есть без корректировки выбранных правил в грамматике. LL(1)-грамматики являются подмножеством КС-грамматик. Однако для достаточно большого количества формальных языков можно построить LL(1)-грамматику, например, для языка арифметических выражений и даже для некоторых языков программирования, в частности можно и для языка Java.

Содержание

1 LL(k)-грамматика
2 FIRST и FOLLOW
- 2.1 Примеры
3 Теорема о связи LL(1)-грамматики с множествами FIRST и FOLLOW
4 См. также
5 Источники информации

LL(k)-грамматика

Дадим теперь формально определение LL(k)-грамматики.

Определение:

Пусть — КС-грамматика. Рассмотрим возникновение следующей ситуации во время левостороннего вывода в этой грамматике слова :

где [math] S [/math] — стартовый нетерминал грамматики, [math] p [/math] и [math] y [/math] — цепочки из терминалов, уже разобранная часть слова [math] w [/math], [math] A [/math] — нетерминал грамматики, в которой есть правила [math] A \rightarrow \alpha [/math] и [math] A \rightarrow \alpha' [/math], причём — последовательности из терминалов и нетерминалов.

Тогда если при выполнении условий, что или , верно, что , то называется LL(k)-грамматикой.

Неформально это означает, что если мы уже вывели какой-то префикс разбираемого слова, то, посмотрев на следующие [math] k [/math] cимволов, сможем одназначно выбрать правило вывода.

TODO: картинка

LL(1)-грамматика является частным случаем. Её определение почти такое же, только вместо строки [math] y [/math] один символ .

FIRST и FOLLOW

Ключевую роль в построении парсеров для LL(1)-грамматик играю множества [math] \mathrm{FIRST} [/math] и [math] \mathrm{FOLLOW} [/math].

Пусть [math] c [/math] — символ из алфавита [math] \Sigma [/math], [math] \alpha,\ \beta [/math] — строки из нетерминалов и терминалов (возможно пустые), [math] S,\ A [/math] — нетерминалы грамматики (начальный и произвольный соответственно), [math] \$ [/math] — символ окончания слова. Также будем считать, что в грамматике нет недостижимых правил. Тогда определим [math] \mathrm{FIRST} [/math] и [math] \mathrm{FOLLOW} [/math] следующим образом:

Определение:

Другими словами, [math] \mathrm{FIRST}(\alpha) [/math] — все символы (терминалы), с которых могут начинаться всевозможные выводы из [math] \alpha [/math], а [math] \mathrm{FOLLOW}(A) [/math] — всевозможные символы, которые встречаются после нетерминала [math] A [/math] во всех правилах грамматики.

Примеры

TODO: Какие-нибудь примеры

Теорема о связи LL(1)-грамматики с множествами FIRST и FOLLOW

TODO: Теорема об LL(1)-грамматиках

TODO: Пара следствий

См. также

Источники информации

LL(k)-грамматики, множества FIRST и FOLLOW

Содержание

LL(k)-грамматика

FIRST и FOLLOW

Примеры

Теорема о связи LL(1)-грамматики с множествами FIRST и FOLLOW

См. также

Источники информации

Навигация

Персональные инструменты

Пространства имён

Варианты

Просмотры

Ещё

Поиск

Навигация

Инструменты