Построение по НКА эквивалентного ДКА, алгоритм Томпсона — различия между версиями

Версия 17:53, 16 мая 2018

Содержание

1 Описание
2 Построение эквивалентного ДКА по НКА
- 2.1 Доказательство эквивалентности
3 Алгоритм Томпсона
4 См. также
5 Источники информации

Описание

Алгоритм Томпсона строит по НКА эквивалентный ДКА следующим образом:

Начало.
Шаг 1. Помещаем в очередь [math]Q[/math] множество, состоящее только из стартовой вершины.
Шаг 2. Затем, пока очередь не пуста выполняем следующие действия:
- Достаем из очереди множество, назовем его [math]q[/math]
- Для всех [math]c \in \Sigma[/math] посмотрим в какое состояние ведет переход по символу [math]c[/math] из каждого состояния в [math]q[/math]. Полученное множество состояний положим в очередь [math]Q[/math] только если оно не лежало там раньше. Каждое такое множество в итоговом ДКА будет отдельной вершиной, в которую будут вести переходы по соответствующим символам.
- Если в множестве [math]q[/math] хотя бы одна из вершин была терминальной в НКА, то соответствующая данному множеству вершина в ДКА также будет терминальной.
Конец.

Построение эквивалентного ДКА по НКА

Пусть нам дан произвольный НКА: .

Построим по нему следующий ДКА: , где:

,
[math]s_d = \{s\}[/math],
,
.

Доказательство эквивалентности

Теорема:

Построенный ДКА эквивалентен данному НКА.

Доказательство:

Докажем, что любое слово, которое принимает НКА, будет принято построенным ДКА. Заметим, что . Рассмотрим слово [math]w=w_1 \dots w_m[/math], которое принимает автомат НКА: . Проверим, что построенный ДКА тоже принимает это слово. Заметим, что [math]s \in s_d[/math], а, значит, исходя из нашего наблюдения, мы получаем, что [math]u_1 \in {u_d}_1[/math], где [math]{u_d}_1 = \delta_d(s, w_1)[/math]. Далее, несложно заметить, что , где . Таким образом, [math]u_m \in {u_d}_m[/math], а из определения терминальных состояний в построенном ДКА мы получаем, что [math]{u_d}_m \in T_d[/math], то есть наш ДКА тоже принимает cлово [math]w[/math].
Докажем, что любое слово, которое принимает построенный ДКА, принимает и НКА. Сначала сделаем наблюдение, что если [math]q_d=\{q\}[/math], и мы из него достигли по строке [math]S[/math] какого-то состояния [math]p_d[/math], то [math]\forall p \in p_d[/math] существует путь из [math]q[/math] в [math]p[/math] в НКА по строке [math]S[/math]. Рассмотрим слово [math]w=w_1 \dots w_m[/math], которое принимает автомат ДКА: . Проверим, что НКА тоже принимает это слово. Так как [math]s_d = \{s\}[/math], и мы из [math]s_d[/math] достигли [math]{u_d}_m \in T_d[/math], возьмём любое терминальное состояние [math]u_m \in {u_d}_m[/math]. По нашему наблюдению в НКА есть путь из [math]s[/math] в [math]u_m[/math] по строке [math]w[/math], а, значит, НКА принимает это слово.

Таким образом, множества слов, допускаемых ДКА и НКА, совпадают, то есть они эквивалентны.

Алгоритм Томпсона

Данный алгоритм преобразовывает НКА в эквивалентный ДКА. Будем использовать вышеуказанный способ построения с одним дополнением — не будем учитывать состояния недостижимые из стартового. Поэтому в алгоритме используется обход в ширину.

Алгоритм

[math]\mathtt{P}[/math] — очередь состояний, соответствующих множествам, состоящих из состояний НКА.
[math]\mathtt{Q_d}[/math] — массив множеств, соответствующих состояниям ДКА.
[math]\mathtt{s}[/math] — стартовое состояние НКА.

Automaton getDFAbyNFA([math]\langle \Sigma, Q, s, T, \delta \rangle[/math] : Automaton):
   [math]P[/math].push([math]\{s\}[/math])
   [math]Q_d[/math] = [math]\varnothing[/math]
   while [math]P[/math] [math] \neq [/math] [math]\varnothing [/math]
      [math]P[/math].pop([math]p_d[/math])
      for [math]c \in \Sigma[/math]
         [math]q_d[/math] = [math]\varnothing[/math]
         for [math]p \in p_d[/math]
            [math]q_d[/math] = [math]q_d \cup \{ \delta(p, c) \}[/math]
         [math]\delta_d(p_d, q_d)[/math] = [math]c[/math]
         if [math]q_d \notin Q_d[/math]
            [math]P[/math].push([math]q_d[/math])
            [math]Q_d[/math].add([math]q_d[/math])           
   [math]T_d[/math] = [math]\{q_d \in Q_d \mid \exists p \in T : p \in q_d\}[/math]
   return [math]\langle \Sigma, Q_d, \{s\}, T_d, \delta_d \rangle[/math]

Асимптотика

Так как количество подмножеств множества состояний НКА не более, чем [math]2^n[/math], а каждое подмножество мы обрабатываем ровно один раз за время [math]O(n)[/math], получаем верхнюю оценку времени работы алгоритма — [math]O(n \cdot 2^n)[/math].

Пример

Пусть нам дан недетерминированный конечный автомат:

По нашему заданию эквивалентного ДКА мы получаем:

Помещаем в очередь множество из одной стартовой вершины — [math]\{1\}[/math]: [math]Q = \{\{1\}\}[/math].
Достаём из очереди множество [math]\{1\}[/math]: [math]Q = \{\}[/math].
[math]q_d(\{1\}, a) = \{1, 2\}[/math], кладём множество [math]\{1, 2\}[/math] в очередь: [math]Q = \{\{1, 2\}\}[/math].
[math]q_d(\{1\}, b) = \{1\}[/math], нам не надо класть множество [math]\{1\}[/math] в очередь, так как оно уже там было.
Достаём из очереди множество [math]\{1, 2\}[/math]: [math]Q = \{\}[/math].
, нам не надо класть множество [math]\{1, 2\}[/math] в очередь, так как оно уже там было.
, нам не надо класть множество [math]\{1, 2\}[/math] в очередь, так как оно уже там было.
Помечаем все терминальные вершины, в данном случае — [math]\{1, 2\}[/math].

В итоге получаем ДКА, эквивалентный исходному:

.

См. также

Источники информации

Серебряков В.А. Теория и реализация языков программирования. М.: МЗ-Пресс, 2003 (1-е изд.) и 2006 (2-е изд) — С. 294. — ISBN 5-94073-094-9

@@ Строка 1: / Строка 1: @@
-[[Категория: Теория формальных языков]]
+== Описание ==
-== Алгоритм систем подмножеств ==
+Алгоритм Томпсона строит по [[Недетерминированные конечные автоматы|НКА]] эквивалентный [[Детерминированные конечные автоматы|ДКА]] следующим образом:
-Данный алгоритм заменяет НКА из <tex>n</tex> состояний на эквивалентный ДКА из <tex>2^n</tex> состояний.
+* Начало.
+* '''Шаг 1.''' Помещаем в очередь <tex>Q</tex> множество, состоящее только из стартовой вершины.
-НКА: <tex>\langle \Sigma , Q, s \in Q, T \subset Q, \delta : Q \times \Sigma \to P(Q) \rangle</tex>.
+* '''Шаг 2.''' Затем, пока очередь не пуста выполняем следующие действия:
+** Достаем из очереди множество, назовем его <tex>q</tex>
-ДКА: <tex>\langle \Sigma , Q_d, \{s\} \in Q_d, T \subset Q_d, \delta_D : Q_d \times \Sigma \to Q_d \rangle</tex>, где <tex>Q_d = 2^Q</tex>.
+** Для всех <tex>c \in \Sigma</tex> посмотрим в какое состояние ведет переход по символу <tex>c</tex> из каждого состояния в <tex>q</tex>. Полученное множество состояний положим в очередь <tex>Q</tex> только если оно не лежало там раньше. Каждое такое множество в итоговом ДКА будет отдельной вершиной, в которую будут вести переходы по соответствующим символам.
+** Если в множестве <tex>q</tex> хотя бы одна из вершин была терминальной в НКА, то соответствующая данному множеству вершина в ДКА также будет терминальной.
-=== Алгоритм ===
+* Конец.
-'''Задание состояний:'''
-&nbsp;&nbsp;&nbsp;&nbsp;Состояние нашего ДКА будет соответствовать подмножеству состояний НКА - то есть их будет ровно <tex>2^n</tex>.
-'''Задание переходов:'''
-&nbsp;&nbsp;&nbsp;&nbsp;Возьмём состояние нашего ДКА <tex>q</tex>, соответствующее подмножеству состояний НКА {{---}} <tex>(a_1, a_2, ..., a_m)</tex>, и символ <tex>c</tex>. Тогда <tex>\delta_D(q, c) = p</tex>, где p - состояние ДКА, соответствующее подмножеству состояний НКА - <tex>\cup_{i=1}^{m} \delta(a_i, c)</tex>, где <tex>\delta_D</tex> {{---}} функция перехода в ДКА, а <tex>\delta</tex> {{---}} функция перехода в НКА.
-'''Задание стартового состояния:'''
-&nbsp;&nbsp;&nbsp;&nbsp;Стартовое состояние - состояние ДКА, соответствующее множеству из одного стартового состояния НКА.
-'''Задание терминальных вершин:'''
-&nbsp;&nbsp;&nbsp;&nbsp;Если в подмножестве состояний НКА есть хотя бы одна терминальная вершина, то вершина ДКА, соответствующая этому подмножеству, будет терминальной.
+== Построение эквивалентного ДКА по НКА ==
-'''Терминология:'''
+Пусть нам дан произвольный НКА: <tex>\langle \Sigma , Q, s \in Q, T \subset Q, \delta : Q \times \Sigma \to 2^Q \rangle</tex>.
-&nbsp;&nbsp;&nbsp;&nbsp;<tex>q</tex> - состояние НКА.
+Построим по нему следующий ДКА: <tex>\langle \Sigma , Q_d, s_d \in Q_d, T_d \subset Q_d, \delta_d : Q_d \times \Sigma \to Q_d \rangle</tex>, где:
+# <tex>Q_d = \{q_d \mid q_d \subset 2^Q \}</tex>,
-&nbsp;&nbsp;&nbsp;&nbsp;<tex>q_d</tex> - состояние ДКА.
+# <tex>s_d = \{s\}</tex>,
+# <tex>T_d = \{q \in Q_d \mid \exists p \in T : p \in q\}</tex>,
-&nbsp;&nbsp;&nbsp;&nbsp;<tex>\delta</tex> - функция перехода в НКА.
+# <tex>\delta_d(q, c) = \{ \delta(a, c) \mid a \in q \}</tex>.
-&nbsp;&nbsp;&nbsp;&nbsp;<tex>\delta_D</tex> - функция перехода в ДКА.
-&nbsp;&nbsp;&nbsp;&nbsp;<tex>q \in q_d</tex> - <tex>q</tex> принадлежит <tex>q_d</tex>, если множество состояний НКА, соответствующее состоянию <tex>q_d</tex>, содержит состояние <tex>q</tex>.
 ===Доказательство эквивалентности===
@@ Строка 41: / Строка 24: @@
 Построенный ДКА эквивалентен данному НКА.
 |proof=
-<tex>1.</tex> Докажем, что любое слово, которое принимает НКА, будет принято построенным ДКА.
+#Докажем, что любое слово, которое принимает НКА, будет принято построенным ДКА. Заметим, что <tex>\forall q \in q_d, \forall c \in \Sigma, \forall p \in \delta(q, c): p \in \delta_d(q_d, c)</tex>. Рассмотрим слово <tex>w=w_1 \dots w_m</tex>, которое принимает автомат НКА: <tex>\langle s, w_1w_2 \dots w_m \rangle \vdash \langle u_1, w_2 \dots w_m \rangle \vdash \langle u_m, \varepsilon \rangle, u_m \in T</tex>. Проверим, что построенный ДКА тоже принимает это слово. Заметим, что <tex>s \in s_d</tex>, а, значит, исходя из нашего наблюдения, мы получаем, что <tex>u_1 \in {u_d}_1</tex>, где <tex>{u_d}_1 = \delta_d(s, w_1)</tex>. Далее, несложно заметить, что <tex>\forall i \leqslant m : u_i \in {u_d}_i</tex>, где <tex>\langle s_d, w_1w_2 \dots w_m \rangle \vdash \langle {u_d}_1, w_2 \dots w_m \rangle \vdash \langle {u_d}_i, w_{i + 1} \dots w_m\rangle</tex>. Таким образом, <tex>u_m \in {u_d}_m</tex>, а из определения терминальных состояний в построенном ДКА мы получаем, что <tex>{u_d}_m \in T_d</tex>, то есть наш ДКА тоже принимает cлово <tex>w</tex>.
+#Докажем, что любое слово, которое принимает построенный ДКА, принимает и НКА. Сначала сделаем наблюдение, что если <tex>q_d=\{q\}</tex>, и мы из него достигли по строке <tex>S</tex> какого-то состояния <tex>p_d</tex>, то <tex>\forall p \in p_d</tex> существует путь из <tex>q</tex> в <tex>p</tex> в НКА по строке <tex>S</tex>. Рассмотрим слово <tex>w=w_1 \dots w_m</tex>, которое принимает автомат ДКА: <tex>\langle s_d, w_1w_2 \dots w_m \rangle \vdash \langle {u_d}_1, w_2 \dots w_m \rangle \vdash \langle {u_d}_m, \varepsilon \rangle, {u_d}_m \in T_d</tex>. Проверим, что НКА тоже принимает это слово. Так как <tex>s_d = \{s\}</tex>, и мы из <tex>s_d</tex> достигли <tex>{u_d}_m \in T_d</tex>, возьмём любое терминальное состояние <tex>u_m \in {u_d}_m</tex>. По нашему наблюдению в НКА есть путь из <tex>s</tex> в <tex>u_m</tex> по строке <tex>w</tex>, а, значит, НКА принимает это слово.
+Таким образом, множества слов, допускаемых ДКА и НКА, совпадают, то есть они эквивалентны.
+}}
-&nbsp;&nbsp;&nbsp;&nbsp;Сделаем наблюдение, что если <tex>q \in q_d</tex> и символ перехода - <tex>c</tex>, то <tex>\forall p \in \delta(q, c)</tex>: <tex>p \in \delta_D(q_d, c)</tex>.
+== Алгоритм Томпсона ==
+Данный алгоритм преобразовывает НКА в эквивалентный ДКА. Будем использовать вышеуказанный способ построения с одним дополнением {{---}} не будем учитывать состояния недостижимые из стартового.
+Поэтому в алгоритме используется обход в ширину.
-&nbsp;&nbsp;&nbsp;&nbsp;Рассмотрим последовательность состояний НКА, когда принимали слово - <tex>(q_1, ..., q_m)</tex> - и последовательность состояний ДКА, когда принимали слово - <tex>({q_d}_1, ..., {q_d}_m)</tex>.
+===Алгоритм===
+* <tex>\mathtt{P}</tex> {{---}} очередь состояний, соответствующих множествам, состоящих из состояний НКА.
+* <tex>\mathtt{Q_d}</tex> {{---}} массив множеств, соответствующих состояниям ДКА.
+* <tex>\mathtt{s}</tex> {{---}} стартовое состояние НКА.
+ '''Automaton''' getDFAbyNFA(<tex>\langle \Sigma, Q, s, T, \delta \rangle</tex> : '''Automaton'''):
+    <tex>P</tex>.push(<tex>\{s\}</tex>)
+    <tex>Q_d</tex> = <tex>\varnothing</tex>
+    '''while''' <tex>P</tex> <tex> \neq </tex> <tex>\varnothing </tex>
+       <tex>P</tex>.pop(<tex>p_d</tex>)
+       '''for''' <tex>c \in \Sigma</tex>
+          <tex>q_d</tex> = <tex>\varnothing</tex>
+          '''for''' <tex>p \in p_d</tex>
+             <tex>q_d</tex> = <tex>q_d \cup \{ \delta(p, c) \}</tex>
+          <tex>\delta_d(p_d, q_d)</tex> = <tex>c</tex>
+          '''if''' <tex>q_d \notin Q_d</tex>
+             <tex>P</tex>.push(<tex>q_d</tex>)
+             <tex>Q_d</tex>.add(<tex>q_d</tex>)
+    <tex>T_d</tex> = <tex>\{q_d \in Q_d \mid \exists p \in T : p \in q_d\}</tex>
+    '''return''' <tex>\langle \Sigma, Q_d, \{s\}, T_d, \delta_d \rangle</tex>
-&nbsp;&nbsp;&nbsp;&nbsp;Мы знаем, что <tex>q_m</tex> - терминальная, так как НКА принимает слово. Надо доказать, что <tex>{q_d}_m</tex> - терминальная.
+===Асимптотика===
+Так как количество подмножеств множества состояний НКА не более, чем <tex>2^n</tex>, а каждое подмножество мы обрабатываем ровно один раз за время <tex>O(n)</tex>, получаем верхнюю оценку времени работы алгоритма {{---}} <tex>O(n \cdot 2^n)</tex>.
-&nbsp;&nbsp;&nbsp;&nbsp;Заметим, что <tex>q_1 \in {q_d}_1</tex> - так как это стартовые состояния, а, значит, по нашему наблюдению <tex>q_2 \in {q_d}_2</tex> и так далее. Получается, что <tex>q_m \in {q_d}_m</tex>. Мы знаем, что <tex>q_m</tex> - терминальная вершина, а, значит, по определению терминальной вершины в нашем ДКА, что <tex>{q_d}_m</tex> - тоже терминальная.
+===Пример===
+Пусть нам дан [[Недетерминированные конечные автоматы|недетерминированный конечный автомат]]:
-<tex>2.</tex> Докажем, что любое слово, которое принимает построенный ДКА, принимает и НКА.
+[[Файл:DKA.png|250px]]
-&nbsp;&nbsp;&nbsp;&nbsp;Рассмотрим последовательность состояний ДКА, когда принимали слово - <tex>({q_d}_1, ..., {q_d}_m)</tex>.
+По нашему заданию эквивалентного ДКА мы получаем:
-&nbsp;&nbsp;&nbsp;&nbsp;Сделаем наблюдение, что если <tex>q_d</tex>, соответствует множеству из одного элемента - <tex>q</tex>, и мы из него достигли по строке <tex>S</tex> какого-то состояния <tex>p_d</tex>, то <tex>\forall p \in p_d</tex>: существует путь из <tex>q</tex> в <tex>p</tex> в НКА по строке <tex>S</tex>.
+[[Файл:NKA_definition.png|250px]]
-&nbsp;&nbsp;&nbsp;&nbsp;А так как <tex>{q_d}_1</tex> - стартовое состояние, соответствует множеству из одного элемента - <tex>q_1</tex> - стартовое состояние. Мы из <tex>{q_d}_1</tex> достигли <tex>{q_d}_m</tex>, возьмём любое терминальное состояние <tex>q_m \in {q_d}_m</tex> - по нашему наблюдению, в НКА есть путь из <tex>q_1</tex> в <tex>q_m</tex> по нужной строке, а, значит, что НКА принимает это слово.
+#Помещаем в очередь множество из одной стартовой вершины — <tex>\{1\}</tex>: <tex>Q = \{\{1\}\}</tex>.
+#Достаём из очереди множество <tex>\{1\}</tex>: <tex>Q = \{\}</tex>.
+#<tex>q_d(\{1\}, a) = \{1, 2\}</tex>, кладём множество <tex>\{1, 2\}</tex> в очередь: <tex>Q = \{\{1, 2\}\}</tex>.
+#<tex>q_d(\{1\}, b) = \{1\}</tex>, нам не надо класть множество <tex>\{1\}</tex> в очередь, так как оно уже там было.
+#Достаём из очереди множество <tex>\{1, 2\}</tex>: <tex>Q = \{\}</tex>.
+#<tex>q_d(\{1, 2\}, a) = \{1, 2\}</tex>, нам не надо класть множество <tex>\{1, 2\}</tex> в очередь, так как оно уже там было.
+#<tex>q_d(\{1, 2\}, b) = \{1, 2\}</tex>, нам не надо класть множество <tex>\{1, 2\}</tex> в очередь, так как оно уже там было.
+#Помечаем все терминальные вершины, в данном случае — <tex>\{1, 2\}</tex>.
-Получается, что мы доказали, что если НКА принимает слово, равносильно тому, что ДКА его тоже принимает.
+В итоге получаем ДКА, эквивалентный исходному:
-А это означает, что автоматы эквивалентны.
+[[Файл:NKA_algorithm.png|250px]].
-}}
-== Алгоритм Томпсона ==
+== См. также ==
-Данный алгоритм преобразовывает НКА в эквивалентный ДКА.
-Мы будем использовать предыдущий алгоритм построения с одним дополнением - нам не нужны состояния недостижимые из стартового.
-Поэтому в алгоритме используется обход в ширину.
+* [[Регулярные языки: два определения и их эквивалентность]]
+* [[Минимизация ДКА, алгоритм за O(n^2) с построением пар различимых состояний]]
+* [[Теорема Клини (совпадение классов автоматных и регулярных языков)]]
-===Алгоритм===
+== Источники информации ==
-<tex>Q</tex> - очередь состояний, соответствующих множествам, состоящих из состояний НКА.
+* ''Серебряков В.А.'' Теория и реализация языков программирования. М.: МЗ-Пресс, 2003 (1-е изд.) и 2006 (2-е изд) — С. 294. — ISBN 5-94073-094-9
-<tex>s</tex> - стартовое состояние НКА.
-  '''1:''' <tex>Q.push(\{s\})</tex>
-  '''2:''' <tex>while</tex> <tex>not</tex> <tex>(isEmpty(Q))\{</tex>
-  '''3:'''    <tex>Q.pop(q_d)</tex>
-  '''4:'''    <tex>for</tex> <tex>c \in \Sigma \{</tex>
-  '''5:'''      <tex>p_d = \o</tex>
-  '''6:'''      <tex>for</tex> <tex>q \in q_d</tex>
-  '''7:'''        <tex>p_d = p_d \cup \delta(q, c)</tex>
-  '''8:'''      <tex>if</tex> <tex>(p_d</tex> <tex>haven't</tex> <tex>been</tex> <tex>in</tex> <tex>Q</tex>)
-  '''9:'''        <tex>Q.push(p_d)</tex>
-  '''10:'''   <tex>\}</tex>
-  '''11:''' <tex>\}</tex>
-Верхняя оценка на работу алгоритмы - <tex>O(n \cdot 2^n)</tex> - так как количество подмножеств множества состояний НКА не более, чем <tex>2^n</tex>, а каждое подмножество мы обрабатываем за <tex>O(n)</tex> и ровно один раз.
+[[Категория: Теория формальных языков]]
+[[Категория: Автоматы и регулярные языки]]

Построение по НКА эквивалентного ДКА, алгоритм Томпсона — различия между версиями

Версия 17:53, 16 мая 2018

Содержание

Описание

Построение эквивалентного ДКА по НКА

Доказательство эквивалентности

Алгоритм Томпсона

Алгоритм

Асимптотика

Пример

См. также

Источники информации

Навигация

Персональные инструменты

Пространства имён

Варианты

Просмотры

Ещё

Поиск

Навигация

Инструменты