Альтернативное доказательство теоремы Клини (через систему уравнений в регулярных выражениях) — различия между версиями

Материал из Викиконспекты
Перейти к: навигация, поиск
(Система уравнений)
(Обычный вариант)
Строка 123: Строка 123:
 
является начальным, а второе {{---}} заключительным.  В нашем примере <tex>1</tex> {{---}} начальное состояние, а <tex>2</tex> {{---}} заключительное, поэтому нам нужно лишь выражение <tex>R_{12}^{(1)}</tex>, равное <tex>1^*0(0 + 1)^*</tex>
 
является начальным, а второе {{---}} заключительным.  В нашем примере <tex>1</tex> {{---}} начальное состояние, а <tex>2</tex> {{---}} заключительное, поэтому нам нужно лишь выражение <tex>R_{12}^{(1)}</tex>, равное <tex>1^*0(0 + 1)^*</tex>
  
Отметим, что первый вариант значительно короче. В общем случае, обычно проще решить систему уравнений, чем выполнять несколько итераций. Учитывая, что количество итераций увеличивается с увеличением переходов в автомате (мы ищем все варианты прохода в финальное состояние), то даже в автомате из трех состояний количество итераций может быть достаточно большим.
+
Отметим, что первый вариант значительно короче. В общем случае, обычно проще решить систему уравнений, чем выполнять несколько итераций. Учитывая, что количество итераций увеличивается с увеличением переходов в автомате (мы ищем все варианты прохода в терминальное состояние), то даже в автомате из трех состояний количество итераций может быть достаточно большим.
  
 
== См. также ==
 
== См. также ==

Версия 20:10, 4 января 2017

Альтернативное доказательство

Теорема:
Класс автоматных языков является подмножеством регулярных.
Доказательство:
[math]\triangleright[/math]
Автомат1.png

Рассмотрим автоматный язык [math]L[/math] и ДКА для него. Для доказательства теоремы достаточно построить регулярное выражение, порождающее язык [math]L[/math].

Пусть наш автомат состоит из [math]n[/math] состояний, и состояние [math]0[/math] — стартовое. Также пусть [math]L_i[/math] — язык, состоящий из слов, которые приводят из состояния [math]i[/math] в терминальное.

Заметим, что [math]L_i = \bigcup c L_j[/math] для всех [math] c \in \Sigma [/math] и [math]j[/math] таких, что [math]\delta(i, c)=j[/math]. Действительно, если по слову [math] \alpha [/math] из состояния [math]j[/math] мы можем попасть в терминальное состояние, а между состояниями [math] i [/math] и [math] j [/math] есть переход по символу [math] c [/math], то слово [math] c \alpha [/math] принадлежит языку [math]L_i[/math]. Также, если [math]\varepsilon \in L_i[/math], то есть если состояние является терминальным, то добавим [math]\varepsilon[/math] в объединение для [math]L_i[/math].

Мы получили систему из [math]n[/math] регулярных выражений с [math]n[/math] неизвестными, причем [math] \varepsilon \notin \alpha_{ij}[/math] ([math] \alpha_{ij} [/math] — коэффициент перед [math] j [/math]-й переменной в [math] i [/math] уравнении) для всех [math] i [/math] и [math] j [/math], так как в автомате нет [math] \varepsilon [/math]-переходов, а следовательно, система имеет единственное решение. Также заметим, что [math]L_0[/math] содержит все слова, по которым из стартового состояния можно дойти до терминального, но тогда [math]L_0 = L[/math].

В итоге мы построили систему уравнений в регулярных выражениях, решив которую, мы получим регулярное выражение, порождающее язык [math]L[/math].
[math]\triangleleft[/math]

Отметим, что длина построенного таким образом регулярного выражения обычно заметно короче, чем если бы мы строили его по теореме Клини. Кроме того, построение регулярного выражения таким образом обычно гораздо проще (выполняется за меньшее количество шагов).

Пример

Система уравнений

At least one zero.png

Найдем регулярное выражение для языка двоичных представлений чисел, в которых есть хотя бы один ноль. Для этого составим уравнение, добавляя соответствующие переменные в правую часть при наличии перехода по символу, а так же [math]\varepsilon[/math] для терминального состояния, как это указано в доказательстве.

[math] \begin{cases} L_1 = 1L_1\\ L_2 = 0L_1 + 0L_2 + 1L_2 + \varepsilon \end{cases} [/math]

Найдем [math] L_1 [/math]:

[math]L_1 = 1L_1[/math].

Так как [math] \varepsilon \notin 1 [/math], то [math]L_1 = 1^*[/math].

Выразим [math] L_2 [/math] через [math] L_1 [/math]:

[math]L_2 = 0L_1 + 0L_2 + 1L_2 + \varepsilon[/math]

Откуда [math]L_2 = 01^* (0 + 1)^*[/math].

Обычный вариант

Теперь найдем регулярное выражение для этого же автомата с помощью теоремы Клини (обычный вариант). Для начала построим таблицу, согласно теореме по шагам:

Выражение Значения
[math]R_{11}^{(0)}[/math] [math]\varepsilon + 1[/math]
[math]R_{12}^{(0)}[/math] [math]0[/math]
[math]R_{21}^{(0)}[/math] [math]\varnothing[/math]
[math]R_{22}^{(0)}[/math] [math](\varepsilon + 0 + 1)[/math]

Например, в выражении [math]R_{11}^{(0)}[/math] присутствует член [math]\varepsilon[/math], потому что и начальным, и конечным является состояние [math]1[/math]. Это выражение включает также [math]1[/math], поскольку существует путь из состояния [math]1[/math] в состояние [math]1[/math] по входу [math]1[/math]. Выражение [math]R_{12}^{(0)}[/math] равно [math]0[/math], потому что есть дуга с меткой [math]0[/math], ведущая из состояния [math]1[/math] в состояние [math]2[/math]. Здесь нет члена [math]\varepsilon[/math], поскольку начальное и конечное состояния различаются. И, наконец, [math]R_{21}^{(0)} = \varnothing[/math], так как нет путей, ведущих из состояния [math]2[/math] в состояние [math]1[/math]. Теперь применим индукцию для построения более сложных выражений.

Правило для вычисления выражения [math]R_{ij}^{(1)}[/math] представляет собой пример общего правила из части теоремы Клини:

[math]R_{ij}^{(1)} = R_{ij}^{(0)} + R_{i1}^{(0)} (R_{11}^{(0)})^* R_{1j}^{(0)}[/math]

Выражение Прямая подстановка Упрощенное выражение
[math]R_{11}^{(1)}[/math] [math]\varepsilon + 1 + (\varepsilon + 1)(\varepsilon + 1)^*(\varepsilon + 1)[/math] [math]1^*[/math]
[math]R_{12}^{(1)}[/math] [math]0 + (\varepsilon + 1)(\varepsilon + 1)^*0[/math] [math]1^*0[/math]
[math]R_{21}^{(1)}[/math] [math]\varnothing + \varnothing(\varepsilon + 1)^*(\varepsilon + 1)[/math] [math]\varnothing[/math]
[math]R_{22}^{(1)}[/math] [math]\varepsilon + 0 + 1 + \varnothing(\varepsilon + 1)^*0[/math] [math](\varepsilon + 0 + 1)[/math]

И, наконец, последний шаг индукции

Выражение Упрощенное выражение (после подстановки)
[math]R_{11}^{(1)}[/math] [math]1^*[/math]
[math]R_{12}^{(1)}[/math] [math]1^*0(0 + 1)^*[/math]
[math]R_{21}^{(1)}[/math] [math]\varnothing[/math]
[math]R_{22}^{(1)}[/math] [math](0 + 1)^*[/math]

Окончательное регулярное выражение, эквивалентное автомату, строится путем объединения всех тех выражений, для которых первое состояние является начальным, а второе — заключительным. В нашем примере [math]1[/math] — начальное состояние, а [math]2[/math] — заключительное, поэтому нам нужно лишь выражение [math]R_{12}^{(1)}[/math], равное [math]1^*0(0 + 1)^*[/math]

Отметим, что первый вариант значительно короче. В общем случае, обычно проще решить систему уравнений, чем выполнять несколько итераций. Учитывая, что количество итераций увеличивается с увеличением переходов в автомате (мы ищем все варианты прохода в терминальное состояние), то даже в автомате из трех состояний количество итераций может быть достаточно большим.

См. также

Источники информации