Построение по НКА эквивалентного ДКА, алгоритм Томпсона — различия между версиями
(→Алгоритм систем подмножеств) |
(→Алгоритм) (Метки: правка с мобильного устройства, правка из мобильной версии) |
||
(не показано 65 промежуточных версий 10 участников) | |||
Строка 1: | Строка 1: | ||
− | + | == Описание == | |
− | == | + | Алгоритм Томпсона строит по [[Недетерминированные конечные автоматы|НКА]] эквивалентный [[Детерминированные конечные автоматы|ДКА]] следующим образом: |
− | + | * Начало. | |
− | + | * '''Шаг 1.''' Помещаем в очередь <tex>Q</tex> множество, состоящее только из стартовой вершины. | |
− | + | * '''Шаг 2.''' Затем, пока очередь не пуста выполняем следующие действия: | |
− | + | ** Достаем из очереди множество, назовем его <tex>q</tex> | |
− | + | ** Для всех <tex>c \in \Sigma</tex> посмотрим в какое состояние ведет переход по символу <tex>c</tex> из каждого состояния в <tex>q</tex>. Полученное множество состояний положим в очередь <tex>Q</tex> только если оно не лежало там раньше. Каждое такое множество в итоговом ДКА будет отдельной вершиной, в которую будут вести переходы по соответствующим символам. | |
− | + | ** Если в множестве <tex>q</tex> хотя бы одна из вершин была терминальной в НКА, то соответствующая данному множеству вершина в ДКА также будет терминальной. | |
− | + | * Конец. | |
− | ''' | ||
− | |||
− | |||
− | |||
− | ''' | ||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | + | == Построение эквивалентного ДКА по НКА == | |
− | + | Пусть нам дан произвольный НКА: <tex>\langle \Sigma , Q, s \in Q, T \subset Q, \delta : Q \times \Sigma \to 2^Q \rangle</tex>. | |
− | + | Построим по нему следующий ДКА: <tex>\langle \Sigma , Q_d, s_d \in Q_d, T_d \subset Q_d, \delta_d : Q_d \times \Sigma \to Q_d \rangle</tex>, где: | |
− | + | # <tex>Q_d = \{q_d \mid q_d \subset 2^Q \}</tex>, | |
− | + | # <tex>s_d = \{s\}</tex>, | |
− | + | # <tex>T_d = \{q \in Q_d \mid \exists p \in T : p \in q\}</tex>, | |
− | + | # <tex>\delta_d(q, c) = \{ \delta(a, c) \mid a \in q \}</tex>. | |
− | |||
− | |||
− | |||
− | |||
===Доказательство эквивалентности=== | ===Доказательство эквивалентности=== | ||
Строка 41: | Строка 24: | ||
Построенный ДКА эквивалентен данному НКА. | Построенный ДКА эквивалентен данному НКА. | ||
|proof= | |proof= | ||
− | <tex>1.</tex> Докажем, что любое слово, которое принимает НКА, | + | #Докажем, что любое слово, которое принимает НКА, будет принято построенным ДКА. Заметим, что <tex>\forall q \in q_d, \forall c \in \Sigma, \forall p \in \delta(q, c): p \in \delta_d(q_d, c)</tex>. Рассмотрим слово <tex>w=w_1 \dots w_m</tex>, которое принимает автомат НКА: <tex>\langle s, w_1w_2 \dots w_m \rangle \vdash \langle u_1, w_2 \dots w_m \rangle \vdash \langle u_m, \varepsilon \rangle, u_m \in T</tex>. Проверим, что построенный ДКА тоже принимает это слово. Заметим, что <tex>s \in s_d</tex>, а, значит, исходя из нашего наблюдения, мы получаем, что <tex>u_1 \in {u_d}_1</tex>, где <tex>{u_d}_1 = \delta_d(s, w_1)</tex>. Далее, несложно заметить, что <tex>\forall i \leqslant m : u_i \in {u_d}_i</tex>, где <tex>\langle s_d, w_1w_2 \dots w_m \rangle \vdash \langle {u_d}_1, w_2 \dots w_m \rangle \vdash \langle {u_d}_i, w_{i + 1} \dots w_m\rangle</tex>. Таким образом, <tex>u_m \in {u_d}_m</tex>, а из определения терминальных состояний в построенном ДКА мы получаем, что <tex>{u_d}_m \in T_d</tex>, то есть наш ДКА тоже принимает cлово <tex>w</tex>. |
+ | #Докажем, что любое слово, которое принимает построенный ДКА, принимает и НКА. Сначала сделаем наблюдение, что если <tex>q_d=\{q\}</tex>, и мы из него достигли по строке <tex>S</tex> какого-то состояния <tex>p_d</tex>, то <tex>\forall p \in p_d</tex> существует путь из <tex>q</tex> в <tex>p</tex> в НКА по строке <tex>S</tex>. Рассмотрим слово <tex>w=w_1 \dots w_m</tex>, которое принимает автомат ДКА: <tex>\langle s_d, w_1w_2 \dots w_m \rangle \vdash \langle {u_d}_1, w_2 \dots w_m \rangle \vdash \langle {u_d}_m, \varepsilon \rangle, {u_d}_m \in T_d</tex>. Проверим, что НКА тоже принимает это слово. Так как <tex>s_d = \{s\}</tex>, и мы из <tex>s_d</tex> достигли <tex>{u_d}_m \in T_d</tex>, возьмём любое терминальное состояние <tex>u_m \in {u_d}_m</tex>. По нашему наблюдению в НКА есть путь из <tex>s</tex> в <tex>u_m</tex> по строке <tex>w</tex>, а, значит, НКА принимает это слово. | ||
+ | Таким образом, множества слов, допускаемых ДКА и НКА, совпадают, то есть они эквивалентны. | ||
+ | }} | ||
− | + | == Алгоритм Томпсона == | |
+ | Данный алгоритм преобразовывает НКА в эквивалентный ДКА. Будем использовать вышеуказанный способ построения с одним дополнением {{---}} не будем учитывать состояния недостижимые из стартового. | ||
+ | Поэтому в алгоритме используется обход в ширину. | ||
− | + | ===Алгоритм=== | |
+ | * <tex>\mathtt{P}</tex> {{---}} очередь состояний, соответствующих множествам, состоящих из состояний НКА. | ||
+ | * <tex>\mathtt{Q_d}</tex> {{---}} массив множеств, соответствующих состояниям ДКА. | ||
+ | * <tex>\mathtt{s}</tex> {{---}} стартовое состояние НКА. | ||
+ | '''Automaton''' getDFAbyNFA(<tex>\langle \Sigma, Q, s, T, \delta \rangle</tex> : '''Automaton'''): | ||
+ | <tex>P</tex>.push(<tex>\{s\}</tex>) | ||
+ | <tex>Q_d</tex> = <tex>\varnothing</tex> | ||
+ | '''while''' <tex>P</tex> <tex> \neq </tex> <tex>\varnothing </tex> | ||
+ | <tex>P</tex>.pop(<tex>p_d</tex>) | ||
+ | '''for''' <tex>c \in \Sigma</tex> | ||
+ | <tex>q_d</tex> = <tex>\varnothing</tex> | ||
+ | '''for''' <tex>p \in p_d</tex> | ||
+ | <tex>q_d</tex> = <tex>q_d \cup \{ \delta(p, c) \}</tex> | ||
+ | <tex>\delta_d(p_d, q_d)</tex> = <tex>c</tex> | ||
+ | '''if''' <tex>q_d \notin Q_d</tex> | ||
+ | <tex>P</tex>.push(<tex>q_d</tex>) | ||
+ | <tex>Q_d</tex>.add(<tex>q_d</tex>) | ||
+ | <tex>T_d</tex> = <tex>\{q_d \in Q_d \mid \exists p \in T : p \in q_d\}</tex> | ||
+ | '''return''' <tex>\langle \Sigma, Q_d, \{s\}, T_d, \delta_d \rangle</tex> | ||
− | + | ===Асимптотика=== | |
+ | Так как количество подмножеств множества состояний НКА не более, чем <tex>2^n</tex>, а каждое подмножество мы обрабатываем ровно один раз за время <tex>O(n)</tex>, получаем верхнюю оценку времени работы алгоритма {{---}} <tex>O(n \cdot 2^n)</tex>. | ||
− | + | ===Пример=== | |
+ | Пусть нам дан [[Недетерминированные конечные автоматы|недетерминированный конечный автомат]]: | ||
− | + | [[Файл:DKA.png|250px]] | |
− | + | По нашему заданию эквивалентного ДКА мы получаем: | |
− | + | [[Файл:NKA_definition.png|250px]] | |
− | + | #Помещаем в очередь множество из одной стартовой вершины — <tex>\{1\}</tex>: <tex>Q = \{\{1\}\}</tex>. | |
+ | #Достаём из очереди множество <tex>\{1\}</tex>: <tex>Q = \{\}</tex>. | ||
+ | #<tex>q_d(\{1\}, a) = \{1, 2\}</tex>, кладём множество <tex>\{1, 2\}</tex> в очередь: <tex>Q = \{\{1, 2\}\}</tex>. | ||
+ | #<tex>q_d(\{1\}, b) = \{1\}</tex>, нам не надо класть множество <tex>\{1\}</tex> в очередь, так как оно уже там было. | ||
+ | #Достаём из очереди множество <tex>\{1, 2\}</tex>: <tex>Q = \{\}</tex>. | ||
+ | #<tex>q_d(\{1, 2\}, a) = \{1, 2\}</tex>, нам не надо класть множество <tex>\{1, 2\}</tex> в очередь, так как оно уже там было. | ||
+ | #<tex>q_d(\{1, 2\}, b) = \{1, 2\}</tex>, нам не надо класть множество <tex>\{1, 2\}</tex> в очередь, так как оно уже там было. | ||
+ | #Помечаем все терминальные вершины, в данном случае — <tex>\{1, 2\}</tex>. | ||
− | + | В итоге получаем ДКА, эквивалентный исходному: | |
− | + | [[Файл:NKA_algorithm.png|250px]]. | |
− | |||
− | == | + | == См. также == |
− | |||
− | |||
− | + | * [[Регулярные языки: два определения и их эквивалентность]] | |
+ | * [[Минимизация ДКА, алгоритм за O(n^2) с построением пар различимых состояний]] | ||
+ | * [[Теорема Клини (совпадение классов автоматных и регулярных языков)]] | ||
− | == | + | == Источники информации == |
− | + | * ''Серебряков В.А.'' Теория и реализация языков программирования. М.: МЗ-Пресс, 2003 (1-е изд.) и 2006 (2-е изд) — С. 294. — ISBN 5-94073-094-9 | |
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | + | [[Категория: Теория формальных языков]] | |
+ | [[Категория: Автоматы и регулярные языки]] |
Версия 17:53, 16 мая 2018
Содержание
Описание
Алгоритм Томпсона строит по НКА эквивалентный ДКА следующим образом:
- Начало.
- Шаг 1. Помещаем в очередь множество, состоящее только из стартовой вершины.
- Шаг 2. Затем, пока очередь не пуста выполняем следующие действия:
- Достаем из очереди множество, назовем его
- Для всех посмотрим в какое состояние ведет переход по символу из каждого состояния в . Полученное множество состояний положим в очередь только если оно не лежало там раньше. Каждое такое множество в итоговом ДКА будет отдельной вершиной, в которую будут вести переходы по соответствующим символам.
- Если в множестве хотя бы одна из вершин была терминальной в НКА, то соответствующая данному множеству вершина в ДКА также будет терминальной.
- Конец.
Построение эквивалентного ДКА по НКА
Пусть нам дан произвольный НКА:
.Построим по нему следующий ДКА:
, где:- ,
- ,
- ,
- .
Доказательство эквивалентности
Теорема: |
Построенный ДКА эквивалентен данному НКА. |
Доказательство: |
|
Алгоритм Томпсона
Данный алгоритм преобразовывает НКА в эквивалентный ДКА. Будем использовать вышеуказанный способ построения с одним дополнением — не будем учитывать состояния недостижимые из стартового. Поэтому в алгоритме используется обход в ширину.
Алгоритм
- — очередь состояний, соответствующих множествам, состоящих из состояний НКА.
- — массив множеств, соответствующих состояниям ДКА.
- — стартовое состояние НКА.
Automaton getDFAbyNFA(: Automaton): .push( ) = while .pop( ) for = for = = if .push( ) .add( ) = return
Асимптотика
Так как количество подмножеств множества состояний НКА не более, чем
, а каждое подмножество мы обрабатываем ровно один раз за время , получаем верхнюю оценку времени работы алгоритма — .Пример
Пусть нам дан недетерминированный конечный автомат:
По нашему заданию эквивалентного ДКА мы получаем:
- Помещаем в очередь множество из одной стартовой вершины — : .
- Достаём из очереди множество : .
- , кладём множество в очередь: .
- , нам не надо класть множество в очередь, так как оно уже там было.
- Достаём из очереди множество : .
- , нам не надо класть множество в очередь, так как оно уже там было.
- , нам не надо класть множество в очередь, так как оно уже там было.
- Помечаем все терминальные вершины, в данном случае — .
В итоге получаем ДКА, эквивалентный исходному:
См. также
- Регулярные языки: два определения и их эквивалентность
- Минимизация ДКА, алгоритм за O(n^2) с построением пар различимых состояний
- Теорема Клини (совпадение классов автоматных и регулярных языков)
Источники информации
- Серебряков В.А. Теория и реализация языков программирования. М.: МЗ-Пресс, 2003 (1-е изд.) и 2006 (2-е изд) — С. 294. — ISBN 5-94073-094-9