Изменения

Перейти к: навигация, поиск

Автоматы в современном мире

5 байт добавлено, 10:09, 14 марта 2018
Построение НКА
=== Построение НКА ===
Для построения автомата нам нужно построить отдельно части НКА для каждой части выражения, финальным шагом будет соединение всего автомата вместе. Для примера напишем программу на '''C''', представим НКА как связанный список структур состояний <tex>\mathrm{state}</tex>
'''struct''' state:
'''int''' c
'''state''' *out
Каждый <tex>\mathrm{state}</tex> представляет один из фрагментов НКА, зависящий от символа c.
Данная реализация будет поддерживать постфиксную нотацию регулярного выражения. Допустим у нас есть функция <tex>\mathrm{re2post}</tex>, которая переписывает инфиксную форму регулярного выражения <tex>``a(bb)+a"</tex> в эквивалентную постфиксную вида <tex>``abb.+.a."</tex> (<tex>.</tex> используется в качестве разделителя). По мере сканирования постфиксного выражения, будем поддерживать стек вычисленных НКА фрагментов. Символы добавляют новый НКА фрагмент в стек, а операторы вынимают фрагменты и добавляют новые. Каждый фрагмент определяется стартовым состояние и исходящей стрелкой:
'''struct''' frag: '''state''' *start '''ptrList''' *out
<tex>\mathrm{start}</tex> указывает на стартовое состояние фрагмента, а <tex>\mathrm{out}</tex> {{---}} лист указателей на <tex>\mathrm{state*}</tex> указатели, которые ещё не соединены.
Некоторые полезные функции для управления списком указателей:
Обход будет использовать два списка: <tex>\mathrm{cList}</tex> набор состояний, в которых уже находится, и <tex>\mathrm{nList}</tex> набор состояний в которых НКА будет после обработки текущего символа. Цикл исполнения инициализирует <tex>\mathrm{cList}</tex> стартовым состоянием и пошагово проходит.
'''int''' match('''state''' *start, '''char''' *s)
'''List''' *cList, *nList, *t; '''cList''' = startList(start, &l1);
'''nList''' = &l2;
'''for''' ( ; *s, s++) { step(cList, *s, nList); t = cList; cList = nList; nList = t; '''return''' isMatch(cList);
Чтобы избежать преаллокаций на каждой итерации цикла, <tex>\mathrm{match}</tex> использует два преаллоцированных списка <tex>\mathrm{l1}</tex> и <tex>\mathrm{l2}</tex> как <tex>\mathrm{cList}</tex> и <tex>\mathrm{nList}</tex>, и меняет их на каждом шаге.
Если список последних вершин содержит терминальную вершину, то строка распознана.
'''intfun''' isMatch('''List''' *l): '''int''' '''int''' i;
'''for''' (i = 0; i < l->n; i++)
'''if''' (l->s[i] == matchState)
'''return''' 1; '''return''' 0;
Анонимный участник

Навигация