Участница:Наталья Юльцова — различия между версиями

Материал из Викиконспекты
Перейти к: навигация, поиск
(Преобразование регулярного выражения в \varepsilon-НКА.)
(Преобразование регулярного выражения в \varepsilon-НКА.)
Строка 11: Строка 11:
 
[[Файл:RegToAut.png|280px|thumb|right|рис. 1. "Виды выражений"]]  
 
[[Файл:RegToAut.png|280px|thumb|right|рис. 1. "Виды выражений"]]  
  
В построении регулярных выражений используются константы(<tex>\varepsilon</tex> и ∅) и переменные для обозначения языков, и операторы для обозначения объединения(|), конкатенации и замыкания Клини(*). Регулярные выражения можно определить рекурсивно. Для каждого регулярного выражения <tex>E</tex> описывается представленный им язык, который обозначается через <tex>L(E)</tex>.  
+
В построении регулярных выражений используются константы(<tex>\varepsilon</tex> и ∅) и переменные для обозначения языков, и операторы для обозначения объединения(<tex>|</tex>), конкатенации и замыкания Клини(<tex>^*</tex>). Регулярные выражения можно определить рекурсивно. Для каждого регулярного выражения <tex>E</tex> описывается представленный им язык, который обозначается через <tex>L(E)</tex>.  
  
 
Чтобы преобразовать регулярное выражения в <tex>\varepsilon</tex>-НКА, предполагается, что <tex>L = L(R)</tex> для регулярного выражения <tex>R</tex>. Построение проводится структурной индукцией по выражению <tex>R</tex>. Три части индукции представлены на рис. 1. Произведем разбиение данного регулярного выражения на подвыражения. Возможны четыре случая.  
 
Чтобы преобразовать регулярное выражения в <tex>\varepsilon</tex>-НКА, предполагается, что <tex>L = L(R)</tex> для регулярного выражения <tex>R</tex>. Построение проводится структурной индукцией по выражению <tex>R</tex>. Три части индукции представлены на рис. 1. Произведем разбиение данного регулярного выражения на подвыражения. Возможны четыре случая.  

Версия 23:03, 5 января 2021

Преобразование регулярного выражения в ДКА

Чтобы преобразовать регулярное выражение в ДКА, нужно:

  1. Преобразовать регулярное выражение в [math]\varepsilon[/math]-НКА.
  2. Устранить [math]\varepsilon[/math]-переходы.
  3. Построим по НКА эквивалентный ДКА.

Преобразование регулярного выражения в [math]\varepsilon[/math]-НКА.

рис. 1. "Виды выражений"

В построении регулярных выражений используются константы([math]\varepsilon[/math] и ∅) и переменные для обозначения языков, и операторы для обозначения объединения([math]|[/math]), конкатенации и замыкания Клини([math]^*[/math]). Регулярные выражения можно определить рекурсивно. Для каждого регулярного выражения [math]E[/math] описывается представленный им язык, который обозначается через [math]L(E)[/math].

Чтобы преобразовать регулярное выражения в [math]\varepsilon[/math]-НКА, предполагается, что [math]L = L(R)[/math] для регулярного выражения [math]R[/math]. Построение проводится структурной индукцией по выражению [math]R[/math]. Три части индукции представлены на рис. 1. Произведем разбиение данного регулярного выражения на подвыражения. Возможны четыре случая.

Виды выражений:

  1. Данное выражение имеет вид [math]R|S[/math] для некоторых подвыражений [math]R[/math] и [math]S[/math]. Тогда ему соответствует автомат, представленный на рис. 1.a.
  2. Выражение имеет вид [math]RS[/math]. Автомат для этой конкатенации представлен на рис. 1.б.
  3. Выражение имеет вид [math]R^*[/math] для некоторого подвыражения [math]R[/math]. Используем автомат, представленный на рис. 1.в.
  4. Выражение имеет вид [math](R)[/math] для некоторого подвыражения [math]R[/math]. Автомат для [math]R[/math] может быть автоматом и для [math](R)[/math], поскольку скобки не влияют на язык, задаваемый выражением.

Пример

Задача: Преобразовать регулярное выражение [math](0|1)^*1(0|1)[/math] в ДКА.

Регулярное выражение Автомат
Преобразуем регулярное выражение [math](0|1)^*1(0|1)[/math] в [math]\varepsilon[/math]-НКА. Построим сначала автомат для [math]0|1[/math]. Это выражение имеет вид [math]R|S[/math].
0+1.png
Далее считаем, что [math](0|1)[/math] это подвыражение вида [math]R[/math], и строим выражение [math](0|1)^*[/math].
(0+1)star.png
Выражение [math](0|1)^*1[/math] имеет вид [math]RS[/math], [math](0|1)^*1(0|1)[/math] имеет тот же вид.
(0+1)star1(0+1).png
Удалим [math]\varepsilon[/math]-переходы, согласно алгоритму из статьи, получим НКА.
RemoveEps.png
Преобразуем НКА в ДКА по алгоритму Томпсона.
MinDKA.png

Преобразование ДКА в регулярное выражение

Алгебраический метод Бжозовского

При преобразовании ДКА в регулярное выражение создается система регулярных выражений для каждого состояния в ДКА, а затем она решается для регулярных выражений [math]R_i[/math], связанных с терминальным состояниями [math]q_i[/math]. Построение уравнения происходит следующим образом: для каждого состояния [math]q_i[/math] уравнение [math]R_i[/math] является объединением переходов, ведущих в это состояние. Переход a из [math]q_i[/math] в [math]q_j[/math] обозначается за [math]aR_i[/math]. Если [math]q_i[/math] - терминальное состояние, то в [math]R_i[/math] добавляется [math]\varepsilon[/math]. Это приводит к системе уравнений вида:

[math] \begin{cases} R_1 = a_1*R_1 + a_2*R_2 + a_3*R_3 + ... \\ R_2 = a_1*R_1 + a_2*R_2 + a_3*R_3 + ... + \varepsilon \\ ... \\ R_m = a_1*R_1 + a_2*R_2 + a_3*R_3 + ... + \varepsilon \end{cases} [/math]

где [math]a_x[/math] = ∅ если нет перехода от [math]R_i[/math] к [math]R_j[/math]. Система может быть решена с помощью простой подстановки, за исключением случаев, когда неизвестное появляется как в правой, так и в левой части уравнения. Для этого можно воспользоваться теоремой Ардена:

Уравнение вида [math]R = Q + RP[/math], где [math]P \ne \varepsilon[/math], имеет решение [math]R = QP^*[/math].

Пример

AutToReg.png

Задача: Построить регулярное выражение, удовлетворяющее данному ДКА.

Решение:

[math] \begin{cases} R_1 = b*R_2 + a*R_3 + \varepsilon \\ R_2 = a*R_1 \\ R_3 = b*R_1 \\ R_4 = a*R_2 + b*R_3 + a*R_4 + b*R_4 + \varepsilon \end{cases} [/math]

Рассмотрим первое терминальное состояние:

[math]R_1 = \varepsilon + abR_1 + baR_1 = \varepsilon + R_1(ab+ba)[/math]

Воспользуемся теоремой Ардена:

[math]R_1=(ab+ba)^*[/math]

Рассмотрим второе терминальное состояние :

[math]R_4=R_1(aa+bb)+R_4(a+b)=R_1(aa+bb)(a+b)^*[/math]

Объединим выражения для терминальных состояний и получим искомое регулярное выражение:

[math]R = R_1 + R_4= (ab+ba)^* (\varepsilon + (aa+bb) (a+b)^*)[/math]

См. Также

Источники информации

  • John E. Hopcroft, Rajeev Motwani, Jeffrey D. Ullman «Introduction to Automata Theory, Languages, and Computation», 2/E
  • Christoph Neumann «Converting Deterministic Finite Automata to Regular Expressions»