Локальные автоматы — различия между версиями

Текущая версия на 19:11, 4 сентября 2022

Содержание

1 Описание
2 Пример
3 Локальный язык
4 Алгоритм Глушкова
- 4.1 Описание
- 4.2 Пример работы
5 См. также
6 Источники информации

Описание

Определение:

Граф Майхилла [math]G[/math] (над алфавитом [math]\Sigma[/math]) (англ. Myhill graph) — ориентированный граф, удовлетворяющий свойствам:

Для каждой упорядоченной пары вершин [math]v[/math] и [math]u[/math] существует только одно ребро из [math]v[/math] в [math]u[/math].
Некоторые вершины обозначены начальными, а некоторые — конечными. Ребро может одновременно быть начальным и конечным.
Вершины обозначены различными символами из конечного алфавита [math]\Sigma[/math], то есть мы можем обращаться к вершине по ее символу.

Пусть [math]G[/math] — граф Майхилла над алфавитом [math]\Sigma[/math].

Символ [math]c \in \Sigma[/math] назовем разрешенным, если им помечена вершина, являющая одновременно начальной и конечной.

Не пустая строка [math]c_1c_2 \ldots c_n[/math] из [math]\Sigma^*[/math] длиной не менее двух символов, называется разрешенной, если символом [math]c_1[/math] отмечена стартовая вершина, а символом [math]c_n[/math] — конечная, и для всех в [math]G[/math] существует ребро [math](c_i, c_{i+1})[/math].

Язык [math]L(G)[/math], распознаваемый графом Майхилла, состоит из всех разрешенных строк из [math]\Sigma^+[/math].

Покажем, что графы Майхилла могут быть представлены в виде автоматов. Пусть — ДКА.

Определение:

Автомат называется локальным (англ. local automaton, Glushkov automaton), если для любого из множество содержит не более одного элемента.

Определение:

Локальный автомат называется стандартным локальным автоматом (англ. standard local automation), если в нем нет перехода в начальное состояние.

Таким образом, автомат является локальным, если для каждого [math]c[/math] из [math]\Sigma[/math] нет переходов, отмеченных [math]c[/math], или если все они ведут в одно состояние.

Покажем, что граф Майхилла может быть преобразован в стандартный локальный автомат таким образом, что распознаваемый им язык не изменится.

Теорема:

Язык распознается графом Майхилла тогда и только тогда, когда он распознается стандартным локальным автоматом, стартовое состояние которого не является терминальным.

Доказательство:

[math]\Rightarrow[/math]

Пусть — граф Майхилла.

Построим автомат следующим образом:

Добавим вершину [math]i[/math] в [math]G[/math] с ребрами от [math]i[/math] к каждой стартовой вершине [math]G[/math]; отметим вершину [math]i[/math] как стартовое состояние.
Отметим конечные вершины как терминальные состояния.
Отметим каждое ребро результирующего ориентированного графа символом, стоящим в вершине, на которою оно указывает.

Переходы преобразуются следующим образом:

По построению стартовое состояние не является терминальным.

Покажем, что полученный автомат конечен.

Ребра, выходящие из стартового состояния обозначены различными символами, потому что они указывают на вершины, которые, по свойству 3, были отмечены различными символами в исходном автомате.

Если мы рассмотрим любое другое состояние , то два перехода из могут иметь одинаковые метки только в том случае, если в оба ориентированных ребра идут в одну и ту же вершину. Но этого не может быть по свойству 1.

То есть — ДКА. По построению он является стандартным локальным автоматом.

Теперь просто проверить, что .

[math] \Leftarrow [/math]

Пусть — стандартный локальный автомат, стартовое состояние которого не является терминальным.

Построим по нему граф Майхилла следующим образом:

Отметим все состояния [math] \mathcal{A} [/math], кроме стартового, [math] input [/math] символами, стоящими на ребрах, входящих в эти состояния.
Сотрем все метки на ребрах [math] \mathcal{A} [/math].
Отметим все состояния [math] s [/math] как начальные вершины, если существует переход из [math] i [/math] в [math] s [/math]
Отметим все терминальные состояния как конечные вершины.
Удалим вершину [math] i [/math] и все ребра, исходящие из нее.

Назовем полученный граф — он будет графом Майхилла по построению. Легко проверить, что .

Пример

Рисунок 1

Рисунок 2

Граф Майхилла, изображенный на рисунке 1 может быть использован для распознавания строк над алфавитом [math]\Sigma = \{a, b\}[/math]. По определению, язык, распознаваемый данным графом, состоит из непустых строк, начинающихся и заканчивающихся на [math]a[/math].

Недетерминированный автомат на рисунке 2 является локальным автоматом и распознает тот же самый язык.

Локальный язык

Рассмотрим язык, распознаваемый стандартным локальным автоматом.

Определение:

Язык называется локальным языком (англ. local language), если может быть описан следующим образом:
.

Другими словами, непустое слово принадлежит локальному языку, если оно начинается с символа из [math]P[/math], оканчивается на символ из [math]S[/math] и не содержит пары символов из множества [math]N[/math].

Пусть — локальный язык. Определим автомат [math]\mathcal{A}[/math] следующим образом:

набор состояний ,
начальное состояние [math]\varepsilon[/math],
терминальные состояния [math]S[/math],
[math]\delta(\varepsilon, a) = a[/math] если [math]a \in P[/math] и [math]\delta(a, b) = b[/math] если [math]ab \not\in N[/math].

Если [math]L[/math] содержит пустую строку, то множество терминальных состояний [math]\mathcal{A}[/math] — [math]S \cup \{ \varepsilon \}[/math].

Утверждение:

Определенный таким образом автомат — стандартный локальный автомат, распознающий .

Автомат является локальным поскольку для каждого состояния [math]s[/math] и любого символа [math]a[/math] [math]\delta(s, a)[/math] либо неопределена либо равна [math]a[/math]. По построению автомат является стандартным. Покажем, что [math]L(\mathcal{A}) = L[/math].
Пусть . Тогда в автомате существует путь:

.

Здесь [math]a_n[/math] — терминальное состояние, [math]a_n \in S[/math]. Переход из [math]\varepsilon[/math] в [math]a_1[/math] определен, поэтому [math]a_1 \in P[/math]. Для каждого факт, что переход [math]a_j \rightarrow a_{j+1}[/math] существует, означает что [math]a_j a_{j+1} \not \in N[/math]. Следовательно, [math]x \in L[/math].

Пусть [math]x = a_1 \ldots a_n \in L[/math]. Тогда [math]a_1 \in P[/math], [math]a_n \in S[/math] и для каждого [math]j[/math] [math]a_j a_{j+1} \not \in N[/math]. Следовательно в автомате существует путь из начального состояния в терминальное:

.

Следовательно, .

Утверждение:

Язык, распознаваемый локальным автоматом, является локальным.

Алгоритм Глушкова

Описание

Дано регулярное выражение [math]e[/math]. Алгоритм Глушкова строит недетерминированный автомат, который распознает язык [math]L(e)[/math], распознаваемый [math]e[/math]. Построение происходит в несколько шагов:

Линеаризация регулярного выражения. Каждый символ из алфавита, содержащийся в регулярном выражении, переименовывается таким образом, что каждый символ содержится в новом регулярном выражении не более одного раза. Пусть [math]A[/math] — исходный алфавит, [math]B[/math] — новый алфавит.

Вычисление множеств [math]P(e'), S(e'), N(e')[/math], где [math]e'[/math] — линеаризованное регулярное выражение. [math]P(e')[/math] — множество символов, с которых начинается слово из [math]L(e')[/math]. [math]S(e')[/math] — множество символов, на которые оканчивается слово из [math]L(e')[/math] и [math]N(e')[/math] — множество пар символов, которые встречаются в слове из [math]L(e')[/math]. Более формально:
,
,
.

Вычисление множества [math]\Lambda(e')[/math] такого что .

Вычисление локального языка с заданными множествами и построение по нему автомата.

Делинеаризация, переименование каждого символа из [math]B[/math] в соответствующий ему символ из [math]A[/math].

Пример работы

Автомат, построенный в ходе работы алгоритма Глушкова

Рассмотрим регулярное выражение [math]e = (a(ab)^*)^* + (ba)^*[/math]:

Линеаризуем его путем добавления индекса к каждому символу:

.

Составим множества [math]P[/math], [math]S[/math], и [math]N[/math]:

,

.

Так как пустое слово принадлежит языку, то .

Автомат локального языка содержит начальное состояние, обозначенное как [math]1[/math], и состояния для каждого из пяти символов алфавита .

В построенном автомате существует переход из [math]1[/math] (соответствующего пустой строке) в два состояния из [math]P'[/math], переход из [math]a[/math] в [math]b[/math] если [math]ab \in N'[/math], три состояния [math]S'[/math] терминальные (как и состояние [math]1[/math]).

Получим автомат для [math]L(e)[/math], удалив индексы, добавленные на первом этапе.

См. также

Контексты и синтаксические моноиды

Источники информации

Хопкрофт Д., Мотвани Р., Ульман Д. — Введение в теорию автоматов, языков и вычислений
Mark V. Lawson — Finite Automata
Wikipedia — Glushkov's construction algorithm

@@ Строка 41: / Строка 41: @@
 :Пусть <tex>G</tex> {{---}} граф Майхилла.
 :Построим автомат <tex>\mathcal{A}</tex> следующим образом:
-:* Добавим вершину <tex>\Diamond</tex> в <tex>G</tex> с ребрами от <tex>\Diamond</tex> к каждой стартовой вершине <tex>G</tex>; отметим вершину <tex>\Diamond</tex> как стартовое состояние.
+:* Добавим вершину <tex>i</tex> в <tex>G</tex> с ребрами от <tex>i</tex> к каждой стартовой вершине <tex>G</tex>; отметим вершину <tex>i</tex> как стартовое состояние.
 :* Отметим конечные вершины как терминальные состояния.
 :* Отметим каждое ребро результирующего ориентированного графа символом, стоящим в вершине, на которою оно указывает.
@@ Строка 50: / Строка 50: @@
 :Покажем, что полученный автомат конечен.
 :Ребра, выходящие из стартового состояния обозначены различными символами, потому что они указывают на вершины, которые, по свойству 3, были отмечены различными символами в исходном автомате.
-:Если мы рассмотрим любое другое состояние <tex>s</tex>, то два перехода из <tex>s</tex> могут иметь одинаковые метки только в том случае, если в <tex>G</tex> оба ориентированных ребра идут в одну и ту же вершину. Но этого не может быть по свойтсву 1.
+:Если мы рассмотрим любое другое состояние <tex> s </tex>, то два перехода из <tex> s </tex> могут иметь одинаковые метки только в том случае, если в <tex>G</tex> оба ориентированных ребра идут в одну и ту же вершину. Но этого не может быть по свойству 1.
 :То есть <tex>\mathcal{A}</tex> {{---}} [[Детерминированные_конечные_автоматы | ДКА]]. По построению он является стандартным локальным автоматом.
-:Теперь просто проверить, что <tex>L(\mathcal{A}) = L(G)</tex>.
+:Теперь просто проверить, что <tex>L(\mathcal{A}) = L(G) </tex>.
-<tex>\Leftarrow</tex>
+<tex> \Leftarrow </tex>
-:Пусть <tex>\mathcal{A} = (S, \Sigma, i, \delta, T)</tex> {{---}} стандартный локальный автомат, стартовое состояние которого не является терминальным.
+:Пусть <tex> \mathcal{A} = (S, \Sigma, i, \delta, T) </tex> {{---}} стандартный локальный автомат, стартовое состояние которого не является терминальным.
 :Построим по нему граф Майхилла следующим образом:
-:* Отметим все состояния <tex>\mathcal{A}</tex>, кроме стартового, <tex>input</tex> символами, стоящими на ребрах, входящих в эти состояния.
+:* Отметим все состояния <tex> \mathcal{A} </tex>, кроме стартового, <tex> input </tex> символами, стоящими на ребрах, входящих в эти состояния.
-:* Сотрем все метки на ребрах <tex>\mathcal{A}</tex>.
+:* Сотрем все метки на ребрах <tex> \mathcal{A} </tex>.
-:* Отметим все состояния <tex>s</tex> как начальные вершины, если существует переход из <tex>i</tex> в <tex>s</tex>
+:* Отметим все состояния <tex> s </tex> как начальные вершины, если существует переход из <tex> i </tex> в <tex> s </tex>
 :* Отметим все терминальные состояния как конечные вершины.
-:* Удалим вершину <tex>i</tex> и все ребра, исходящие из нее.
+:* Удалим вершину <tex> i </tex> и все ребра, исходящие из нее.
-:Назовем полученный граф <tex>G</tex> {{---}} он будет графом Майхилла по построению. Легко проверить, что <tex>L(G) = L(\mathcal{A})</tex>.
+:Назовем полученный граф <tex> G </tex> {{---}} он будет графом Майхилла по построению. Легко проверить, что <tex> L(G) = L(\mathcal{A}) </tex>.
 }}
@@ Строка 113: / Строка 113: @@
 ===Описание===
 Дано регулярное выражение <tex>e</tex>. Алгоритм Глушкова строит недетерминированный автомат, который распознает язык <tex>L(e)</tex>, распознаваемый <tex>e</tex>. Построение происходит в несколько шагов:
-# Линеаризация регулярного выражения. Каждый символ из алфавита, содержащийся в регулярном выражении, переименовывается таким образом, что каждый символ содержится в новом регулярном выражении не более одного раза. Пусть <tex>A</tex> {{---}} исходный алфавит, <tex>B</tex> {{---}} новый алфавит.
-# Вычисление множеств <tex>P(e'), S(e'), N(e')</tex>, где <tex>e'</tex> {{---}} линеаризованное регулярное выражение. <tex>P(e')</tex> {{---}} множество символов, с которых начинается слово из <tex>L(e')</tex>. <tex>S(e')</tex> {{---}} множество символов, на которые оканчивается слово из <tex>L(e')</tex> и <tex>N(e')</tex> {{---}} множество пар символов, которые встречаются в слове из <tex>L(e')</tex>. Более формально: <br><tex>P(e')=\{a\in B\mid aB^*\cap L(e')\ne\emptyset\}</tex>,<br><tex>S(e')=\{a\in B\mid B^*a\cap L(e')\ne\emptyset\}</tex>,<br><tex>N(e')=\{u\in B^2\mid B^*uB^*\cap L(e')\ne\emptyset\}</tex>.
+* Линеаризация регулярного выражения. Каждый символ из алфавита, содержащийся в регулярном выражении, переименовывается таким образом, что каждый символ содержится в новом регулярном выражении не более одного раза. Пусть <tex>A</tex> {{---}} исходный алфавит, <tex>B</tex> {{---}} новый алфавит.
-# Вычисление множества <tex>\Lambda(e')</tex> такого что <tex>\Lambda(e')=\{\varepsilon\}\cap L(e')</tex>.
-# Вычисление локального языка с заданными множествами и построение по нему автомата.
+* Вычисление множеств <tex>P(e'), S(e'), N(e')</tex>, где <tex>e'</tex> {{---}} линеаризованное регулярное выражение. <tex>P(e')</tex> {{---}} множество символов, с которых начинается слово из <tex>L(e')</tex>. <tex>S(e')</tex> {{---}} множество символов, на которые оканчивается слово из <tex>L(e')</tex> и <tex>N(e')</tex> {{---}} множество пар символов, которые встречаются в слове из <tex>L(e')</tex>. Более формально: <br><tex>P(e')=\{a\in B\mid aB^*\cap L(e')\ne\emptyset\}</tex>,<br><tex>S(e')=\{a\in B\mid B^*a\cap L(e')\ne\emptyset\}</tex>,<br><tex>N(e')=\{u\in B^2\mid B^*uB^*\cap L(e')\ne\emptyset\}</tex>.
-# Делинеаризация, переименование каждого символа из <tex>B</tex> в соответствующий ему символ из <tex>A</tex>.
+* Вычисление множества <tex>\Lambda(e')</tex> такого что <tex>\Lambda(e')=\{\varepsilon\}\cap L(e')</tex>.
+* Вычисление локального языка с заданными множествами и построение по нему автомата.
+* Делинеаризация, переименование каждого символа из <tex>B</tex> в соответствующий ему символ из <tex>A</tex>.
 ===Пример работы===
 [[Файл:Glushkov_lin_automata.jpg|frame|right|Автомат, построенный в ходе работы алгоритма Глушкова]]
-Рассмотрим регулярное выражение <tex>e = (a(ab)^*)^* + (ba)^*</tex>.
+Рассмотрим регулярное выражение <tex>e = (a(ab)^*)^* + (ba)^*</tex>:
-. Линеаризуем его путем добавления индекса к каждому символу:
+* Линеаризуем его путем добавления индекса к каждому символу:
 :<tex>e'=(a_1(a_2b_3)^*)^*+(b_4a_5)^*</tex>.
-. Составим множества <tex>P</tex>, <tex>S</tex>, и <tex>N</tex>:
+* Составим множества <tex>P</tex>, <tex>S</tex>, и <tex>N</tex>:
 :<tex>P(e')=\{a_1,b_4\}</tex>,<br />
 :<tex>S(e')=\{a_1,b_3,a_5\}</tex>,<br />
@@ Строка 133: / Строка 139: @@
 Так как пустое слово принадлежит языку, то <math>\Lambda(e')=\{\varepsilon\}</math>.
-. Автомат локального языка <tex>L'=P'B^*\cap B^*S'\setminus B^*(B^2\setminus N')B^*</tex> содержит начальное состояние, обозначенное как <tex>1</tex>, и состояния для каждого из пяти символов алфавита <tex>B=\{a_1, a_2, b_3, b_4, a_5\}</tex>.<br>
+* Автомат локального языка <tex>L'=P'B^*\cap B^*S'\setminus B^*(B^2\setminus N')B^*</tex> содержит начальное состояние, обозначенное как <tex>1</tex>, и состояния для каждого из пяти символов алфавита <tex>B=\{a_1, a_2, b_3, b_4, a_5\}</tex>.<br>
 В построенном автомате существует переход из <tex>1</tex> (соответствующего пустой строке) в два состояния из <tex>P'</tex>, переход из <tex>a</tex> в <tex>b</tex> если <tex>ab \in N'</tex>, три состояния <math>S'</math> терминальные (как и состояние <tex>1</tex>).
-. Получим автомат для <tex>L(e)</tex>, удалив индексы, добавленные на первом этапе.
+* Получим автомат для <tex>L(e)</tex>, удалив индексы, добавленные на первом этапе.
 == См. также ==
@@ Строка 142: / Строка 148: @@
 == Источники информации ==
-* Хопкрофт Д., Мотвани Р., Ульман Д. {{---}} Введение в теорию автоматов, языков и вычислений
+* ''Хопкрофт Д., Мотвани Р., Ульман Д.'' {{---}} Введение в теорию автоматов, языков и вычислений
-* Mark V. Lawson {{---}} Finite Automata
+* ''Mark V. Lawson'' {{---}} Finite Automata
 * [https://en.wikipedia.org/wiki/Glushkov's_construction_algorithm Wikipedia {{---}} Glushkov's construction algorithm]
 [[Категория: Теория формальных языков]]
 [[Категория: Автоматы и регулярные языки]]
+[[Категория: Другие автоматы]]

Локальные автоматы — различия между версиями

Текущая версия на 19:11, 4 сентября 2022

Содержание

Описание

Пример

Локальный язык

Алгоритм Глушкова

Описание

Пример работы

См. также

Источники информации

Навигация

Персональные инструменты

Пространства имён

Варианты

Просмотры

Ещё

Поиск

Навигация

Инструменты