Двусторонний детерминированный конечный автомат — различия между версиями

Версия 00:22, 10 января 2015

Определение:

Двусторонний детерминированный конечный автомат (2ДКА) (англ. Two-way deterministic finite automaton (2DFA)) — набор из восьми элементов , где — алфавит (англ. alphabet), — множество состояний (англ. finite set of states), — левый маркер конца строки, — правый маркер конца строки, — начальное (стартовое) состояние (англ. start state), — допускающее состояние (англ. accept state), — отвергающее состояние (англ. reject state), — функция переходов (англ. transition function).

Также должны быть удовлетворены следующие условия:

[math]\forall q \in Q[/math]

[math]\delta(q, L) = (u, right)[/math] для некоторого [math]u \in Q[/math],
[math]\delta(q, R) = (v, left)[/math] для некоторого [math]v \in Q[/math],

и

[math]\delta(t, b) = (t, right)[/math],
[math]\delta(r, b) = (r, right)[/math],
[math]\delta(t, R) = (t, left)[/math],
[math]\delta(r, R) = (r, left)[/math].

Описание

Зафиксируем [math]x \in \Sigma^*[/math], где [math]x = a_1 a_2 a_3 \dots a_n[/math]. Пусть [math]a_0 = L[/math] и [math]a_{n+1}=R[/math]. Тогда .

Пусть дан 2ДКА с [math]n[/math] состояниями. Тогда можно построить ДКА, распознающий язык тот же язык, с [math]O(e^n)[/math] состояниями.

Для доказательства приведем ход построения требуемого автомата .

Регулярность языков

Рассмотрим длинную входную строку [math]w_1[/math] и разобьем на две подстроки [math]w_1=xz[/math]. Так как у нас наш автомат может производить чтение в любом направлении, то граница [math]x[/math] и [math]z[/math] может быть пересечена несколько раз. Каждый раз, когда автомат пересекает границу справа налево (то есть из [math]z[/math] в [math]x[/math]), он выходит из состояния [math]q[/math]. Когда пересечение происходит снова слева направо (если оно вообще происходит), то автомат выходит из состояния [math]p[/math]. Теперь, если 2ДКА перейдет в [math]x[/math] в состояние [math]q[/math] заново, то он снова может появиться в состоянии [math]p[/math]. Более того, состояние [math]p[/math] зависит исключительно от [math]q[/math] и [math]x[/math]. Обозначим такое отношение через записать [math]T_x(q) = p[/math]. Мы может записать все такие отношения в виде конечной таблицы , где [math]Q[/math] — множество состояний 2ДКА, а [math]d[/math] и [math]h[/math] будут описаны ниже.

На входной строке [math]xz[/math] 2ДКА начнет чтение с левого маркера конца строки. В процессе работы автомата позиция чтения будет меняться. В конце концов это позиция пересечет слева направо границу между [math]x[/math] и [math]z[/math]. В первый раз, когда это произойдет в каком-нибудь состоянии [math]T_x(d)[/math] (для этого мы и выделили [math]d[/math]). Так же автомат может никогда не выйти из [math]x[/math]. В таком случае мы запишем [math]T_x(d) = h[/math]. Состояние [math]T_x(d)[/math] дает немного информации о [math]x[/math], но только конечное количество, поскольку существует только конечное количество вариантов для [math]T_x(d)[/math]. Отметим, что [math]T_x(d)[/math] зависит только от [math]x[/math] и не зависит от [math]z[/math]. Если на вход подавалась строка [math]xw[/math] вместо [math]xz[/math], то в таком случае при пересечении границы из [math]x[/math] в [math]w[/math] автомат также был бы в состоянии [math]T_x(d)[/math], потому что его значение до того момента определялось только [math]x[/math] и до тех пор не все, что находится справа от границы никак не влияет.

Если [math]T_x(d) = h[/math], то 2ДКА должен быть в бесконечном цикле внутри [math]x[/math] и никогда не допустит или отвергнет входную строку.

Предположим, что 2ДКА переходит из [math]x[/math] в [math]z[/math] и спустя время перейти обратно в состояние [math]q[/math]. Если это происходит, то потом:

либо снова произойдет переход из [math]x[/math] в некоторое состояние [math]p[/math]. В таком случае мы определим [math]T_x(q)=p[/math].
либо никогда не перейдет. В таком случае [math]T_x(q) = h[/math].

Ещё раз отметим, что [math]T_x(q)[/math] зависит только от [math]x[/math] и [math]q[/math] и не зависит от [math]z[/math]. Если автомат переходит в [math]x[/math] справа в состояние [math]q[/math], то тогда он появится заново в состоянии [math]T_x(q)[/math] (или никогда не перейдет, если [math]T_x(q) = h[/math]), потому что автомат детерминированный, и поведение его поведение полностью определяется [math]x[/math] и состоянием, в которое он вошел.

Если мы запишем [math]T_x(q)[/math] для каждого состояния [math]q[/math] вместе с [math]T_x(d)[/math], это даст нам всю информацию о [math]x[/math], которую можно перенести через границу между [math]x[/math] и [math]z[/math]. Все это позволит узнать [math]T_x(d)[/math] сразу после пересечения границы, а также посмотреть значения [math]T_x(q)[/math]. Если [math]y[/math] — другая строка, такая что [math]T_y=T_x[/math], то тогда [math]x[/math] и [math]y[/math] будут неразличимы.

Заметим, что у нас конечное число возможных таблиц , а именно [math](k+1)^{k+1}[/math], где [math]k[/math] — размер множество [math]Q[/math]. Таким образом, у нас конечное количество информации о [math]x[/math], которое мы может перенести через границу справа от [math]x[/math], и которое закодировано у нас в таблицe [math]T_x[/math].

Отметим также, что если [math]T_x=T_y[/math] и автомат допускает строку [math]xz[/math], то тогда он допускает и строку [math]yz[/math], потому что последовательность состояний перенесенных через границу [math]x[/math] и [math]z[/math] (либо [math]y[/math] и [math]z[/math]) в любом направлении полностью определяется таблицами [math]T_x=T_y[/math] и строкой [math]z[/math]. Чтобы допустить строку [math]xz[/math], автомат должен в какой-то момент прочитать правый маркер конца строки, находясь в допускающем состоянии [math]t[/math].

Теперь мы может использовать теорему Майхилла — Нероуда, чтобы показать, что язык [math]L(M)[/math] нашего автомата [math]M[/math] регулярный.

, где [math]=_{L(M)}[/math] — отношение эквивалентности на множестве слов в алфавите. Таким образом, если 2 строки имеют одинаковые таблицы, то тогда они эквивалентны отношением [math]=_{L(M)}[/math]. Поскольку у нас только конечное число таблиц, отношение [math]=_{L(M)}[/math] имеет только конечное количество классов эквивалентности, самое большее один для каждой таблицы. По теореме [math]L(M)[/math] — регулярный язык.

Пример

Рассмотрим следующий язык при [math]\forall n \gt 0[/math].

Он может быть легко распознан с помощью следующего недетерменированного конечного автомата.

Теперь построим на его основе ДКА. Мы можем построить автомат [math]A_n[/math], который запоминает последние [math]n[/math] входных символов. Следовательно, когда мы находимся с состоянии, соответствующему подстроке , и читаем очередной символ [math]\gamma[/math], то мы переходим в состояние, которому уже будет соответствовать подстрока . Однако, в случае [math]\sigma_1 = \gamma = a[/math] автомат переходит в допускающее состояние, где в цикле может переходить на любому символу. Следует отметить, что такая стратегия строит ДКА c [math]2^n + 1[/math] состояниями. Ниже представлен автомат [math]A_3[/math], который распознает язык [math]L_3[/math].

Покажем, что построенные таким образом автоматы будут минимальными.

Каждые две попарно различных строки [math]x[/math] и [math]y[/math] длины [math]n[/math] различимы. Чтобы доказать это, достаточно рассмотреть строку [math]b^{i-1}a[/math], где — самая левая позиция символа, в которой начинают различаться строки [math]x[/math] и [math]y[/math], и проверить, что ровно одна строка [math]xb^{i-1}a[/math] или [math]yb^{i-1}a[/math] принадлежит [math]L_n[/math].
Каждая строка длины [math]n[/math] не принадлежит [math]L_n[/math] и, следовательно, различима от строки [math]a^{n+1}[/math], которая принадлежит [math]L_n[/math].
Таким образом, [math]2^n + 1[/math] строк в [math]\Sigma^n \cup \{a^{n+1}\}[/math] являются попарно различимыми для [math]L_n[/math]. Как следствие, [math]2^n + 1[/math] — минимальное количество состояний для ДКА, который способен распознать язык [math]L_n[/math].

См. также

Детерминированные конечные автоматы

Источники информации

@@ Строка 40: / Строка 40: @@
 Отметим также, что если <tex>T_x=T_y</tex> и автомат допускает строку <tex>xz</tex>, то тогда он допускает и строку <tex>yz</tex>, потому что последовательность состояний перенесенных через границу <tex>x</tex> и <tex>z</tex> (либо <tex>y</tex> и <tex>z</tex>) в любом направлении полностью определяется таблицами <tex>T_x=T_y</tex> и строкой <tex>z</tex>. Чтобы допустить строку <tex>xz</tex>, автомат должен в какой-то момент прочитать правый маркер конца строки, находясь в допускающем состоянии <tex>t</tex>.
+Теперь мы может использовать теорему Майхилла — Нероуда, чтобы показать, что язык <tex>L(M)</tex> нашего автомата <tex>M</tex> регулярный.
+<tex>T_x = T_y => \forall z ( M accepts xz <=> M accepts yz) <=> \forall z (xz \in L(M) <=> yz \in L(M)) <=> x =_{L(M)} y</tex>, где <tex>=_{L(M)}</tex> {{---}} отношение эквивалентности на множестве слов в алфавите. Таким образом, если 2 строки имеют одинаковые таблицы, то тогда они эквивалентны отношением <tex>=_{L(M)}</tex>. Поскольку у нас только конечное число таблиц, отношение <tex>=_{L(M)}</tex> имеет только конечное количество классов эквивалентности, самое большее один для каждой таблицы. По теореме <tex>L(M)</tex> {{---}} регулярный язык.
 == Пример ==

Двусторонний детерминированный конечный автомат — различия между версиями

Версия 00:22, 10 января 2015

Содержание

Описание

Регулярность языков

Пример

См. также

Источники информации

Навигация

Персональные инструменты

Пространства имён

Варианты

Просмотры

Ещё

Поиск

Навигация

Инструменты