Построение FIRST и FOLLOW — различия между версиями
Shersh (обсуждение | вклад) |
Shersh (обсуждение | вклад) (см. также и источники) |
||
| Строка 90: | Строка 90: | ||
<tex> E \to E + E \mid E \cdot E \mid (E) \mid n </tex> | <tex> E \to E + E \mid E \cdot E \mid (E) \mid n </tex> | ||
== См. также == | == См. также == | ||
| + | * [[LL(k)-грамматики, множества FIRST и FOLLOW]] | ||
== Примечания == | == Примечания == | ||
<references/> | <references/> | ||
== Источники информации == | == Источники информации == | ||
| + | * [http://en.wikipedia.org/wiki/LL_parser Wikipedia {{---}} LL parser] | ||
| + | * [http://citforum.ru/programming/theory/serebryakov/4.shtml СitForum {{---}} Синтаксический анализ] | ||
| + | * Альфред Ахо, Рави Сети, Джеффри Ульман. Компиляторы. Принципы, технологии, инструменты. Издательство Вильямс, 2003. ISBN 5-8459-0189-8 | ||
[[Категория: Методы трансляции]] | [[Категория: Методы трансляции]] | ||
[[Категория: Нисходящий разбор]] | [[Категория: Нисходящий разбор]] | ||
Версия 22:32, 28 июня 2014
Для данной LL(1)-грамматики оказывается возможным построить нисходящий рекурсивный парсер, который по слову сможет построить его дерево разбора в грамматике или сказать, что слово не принадлежит языку грамматики. Более того, становится возможной даже автоматическая генерация парсеров для таких грамматик[1].
Чтобы написать парсер для LL(1)-грамматики, необходимо построить множества и , после чего по ним можно составить таблицу синтаксического анализатора.
Содержание
Построение FIRST
Для построения воспользуемся несколькими леммами, которые следуют прямо из определения. Пусть — цепочки из терминалов и нетерминалов, — символ из алфавита.
| Лемма (1): |
Данная лемма означает, что в множество правила , где — произвольный терминал или нетерминал, — нужно добавить , если для всех верно, что .
| Лемма (2): |
Псевдокод
Алгоритм строит для каждого терминала грамматики отображение в множество символов. Перед запуском алгоритма необходимо избавиться от бесполезных символов. Изначально каждое правило отображается в пустое множество.
function constructFIRST():
for
changed = true
while changed
changed = false
for
changed = true if изменился
| Утверждение: |
Приведённый алгоритм правильно строит множество для данной грамматики. |
|
Алгоритм на каждом шаге использует леммы, чтобы построить списки для каждого нетерминала. Поэтому он добавит только те терминалы, которые на самом деле лежат в .
Покажем, что алгоритм найдёт все символы из множества . Предположим, что в грамматике возможен вывод , и алгоритм не включил в . Докажем индукцией по числу шагов , что этого не может быть. Пусть за шагов алгоритм добавит символы в множество для каждого нетерминала , если . База индукции для числа шагов верна, если считать, что для всех терминалов нам известны . Если алгоритм корректно отрабатывает на -ом шаге, то он правильно отработает их на -ом шаге, потому что
Для алгоритм правильно построил по предположению индукции, а для он правильно построит по леммам, следовательно, переход доказан. К тому же алгоритм завершится за конечное число шагов, так как в для каждого нетерминала не может добавиться больше символов, чем есть в алфавите. |
Построение FOLLOW
Сформулируем похожие утверждения для построения .
| Лемма (3): |
Для каждого правила верно, что |
| Лемма (4): |
Для каждого правила вида или верно, что |
Псевдокод
Реализация построения получается сразу из лемм. Для алгоритма сначала требуется выполнить построение для грамматики.
function constructFOLLOW():
for
// в стартовый терминал помещается символ конца строки
changed = true
while changed
changed = false
for
for
if
changed = true if изменился
Корректность данного алгоритма доказывается точно так же, как и корректность алгоритма конструирования .
Пример
Рассмотрим, как будут строиться множества и на примере грамматики арифметических выражений. Ограничимся только операциями сложения, умножения и наличием скобок. Числа будем обозначать одной буквой для простоты. Интуитивная грамматики для арифметических выражений выглядит следующим образом:
См. также
Примечания
Источники информации
- Wikipedia — LL parser
- СitForum — Синтаксический анализ
- Альфред Ахо, Рави Сети, Джеффри Ульман. Компиляторы. Принципы, технологии, инструменты. Издательство Вильямс, 2003. ISBN 5-8459-0189-8