Детерминированные конечные автоматы — различия между версиями

Материал из Викиконспекты
Перейти к: навигация, поиск
(Псевдокод)
м (rollbackEdits.php mass rollback)
 
(не показано 110 промежуточных версий 12 участников)
Строка 1: Строка 1:
 
{{Определение
 
{{Определение
 
|definition=
 
|definition=
'''Детерминированный конечный автомат (ДКА) (англ. ''deterministic finite automaton (DFA)'')''' — набор из пяти элементов <tex>\langle \Sigma , Q, s \in Q, T \subset Q, \delta : Q \times \Sigma \to Q \rangle</tex>, где <tex>\Sigma</tex> — алфавит (англ. ''alphabet''), <tex>Q</tex> — множество состояний (англ. ''finite set of states''), <tex>s</tex> — начальное (стартовое) состояние (англ. ''start state''), <tex>T</tex> — множество допускающих состояний (англ. ''set of accept states''), <tex>\delta</tex> — функция переходов (англ. ''transition function'').
+
'''Детерминированный конечный автомат (ДКА)''' (англ. ''deterministic finite automaton (DFA)'') — набор из пяти элементов <tex>\langle \Sigma , Q, s \in Q, T \subset Q, \delta : Q \times \Sigma \to Q \rangle</tex>, где <tex>\Sigma</tex> — алфавит (англ. ''alphabet''), <tex>Q</tex> — множество состояний (англ. ''finite set of states''), <tex>s</tex> — начальное (стартовое) состояние (англ. ''start state''), <tex>T</tex> — множество допускающих состояний (англ. ''set of accept states''), <tex>\delta</tex> — функция переходов (англ. ''transition function'').
 
}}
 
}}
  
Строка 9: Строка 9:
 
|id=допускает
 
|id=допускает
 
|definition=
 
|definition=
Будем говорить, что автомат '''допускает''' слово, если после окончания описанного выше процесса автомат окажется в допускающем состоянии.
+
Будем говорить, что автомат '''допускает''' (англ. ''accept'') слово, если после окончания описанного выше процесса автомат окажется в допускающем состоянии.
 
}}
 
}}
 
'''Замечание.''' Если в какой-то момент из текущего состояния нет перехода по считанному символу, то будем считать, что автомат не допускает данное слово. При реализации вместо отдельного рассмотрения данного случая иногда удобно вводить фиктивную нетерминальную '''''«дьявольскую вершину»''''' (также '''''тупиковое состояние''''', '''''сток'''''), из которой любой переход ведет в неё же саму, и заменить все несуществующие переходы на переходы в «дьявольскую вершину».
 
'''Замечание.''' Если в какой-то момент из текущего состояния нет перехода по считанному символу, то будем считать, что автомат не допускает данное слово. При реализации вместо отдельного рассмотрения данного случая иногда удобно вводить фиктивную нетерминальную '''''«дьявольскую вершину»''''' (также '''''тупиковое состояние''''', '''''сток'''''), из которой любой переход ведет в неё же саму, и заменить все несуществующие переходы на переходы в «дьявольскую вершину».
  
 
== Способы представления ==
 
== Способы представления ==
* Диаграмма переходов — граф, вершины которого соответствуют состояниям автомата, а рёбра — переходам между состояниями.
+
===Диаграмма переходов===
* Таблица переходов <tex>T (|Q| \times |\Sigma|)</tex>, дающая табличное представление функции <tex>\delta</tex>.
 
  
== Примеры ==
+
Диаграмма переходов — граф, вершины которого соответствуют состояниям автомата, а рёбра — переходам между состояниями.
{| border="1" cellpadding="5" cellspacing="0" style="text-align:center" width=60%
+
:<tex>\bigcirc</tex> — нетерминальное состояние,
|style="background:#ffffff"|Автомат, принимающий непустые строки из чередующихся символов ''a'' и ''b'',<br/>
+
:<tex>\circledcirc</tex> — терминальное состояние,
<small>а) без «дьявольской вершины», <br/>б) с «дьявольской вершиной» (отмечена серым цветом).
+
:Стрелка <tex>\downarrow</tex> указывает на начальное состояние.
 +
{| class = "wikitable"  
 +
!Пример!!Описание
 +
|-align="center"
 +
| style="background-color:white;" | [[Файл:Automata_Search.png|340px]]
 +
|Автомат для поиска образца в тексте для строки <tex>abbab</tex>.
 +
|-align="center"
 +
| style="background-color:white;" | [[Файл:Finite state machine 1.png|250 px]]
 +
|Автомат, принимающий непустые строки из чередующихся символов <tex>a</tex> и <tex>b</tex>,без «дьявольской вершины».
 +
|-align="center"
 +
| style="background-color:white;" | [[Файл:Finite state machine 2.png|200 px]]
 +
|Автомат, принимающий непустые строки из чередующихся символов <tex>a</tex> и <tex>b</tex>с «дьявольской вершиной».
 +
|-align="center"
 +
|}
 +
 
 +
===Таблица переходов===
 +
 
 +
Таблица переходов <tex>T (|Q| \times |\Sigma|)</tex>, дающая табличное представление функции <tex>\delta</tex>.
  
<tex>\bigcirc</tex> — нетерминальное состояние,
+
<tex>M = (Q, \Sigma , \delta, q_0, F)</tex>, где
<br/><tex>\circledcirc</tex> — терминальное состояние.
+
*<tex>Q = {S_1, S_2}</tex>,
<br/>Стрелка <tex>\downarrow</tex> указывает на начальное состояние.</small>
+
*<tex>\Sigma = \{0, 1 \}</tex>,
|style="background:#ffffff"|а)[[Файл:Finite state machine 1.png|150 px]]
+
*<tex>q_0 = S_1</tex>,
б)[[Файл:Finite state machine 2.png|200 px]]
+
*<tex>F = {S_1}</tex>,
 +
*<tex>\delta</tex> {{---}} функция переходов, представленная таблицей:
 +
:{| class="wikitable" border="1" style="border-collapse:collapse"
 +
! !! <center><tex>0</tex></center> !! <center><tex>1</tex></center>
 +
|-
 +
!<tex>S_1</tex>
 +
| <tex>S_2</tex>
 +
| <tex>S_1</tex>
 
|-
 
|-
|style="background:#ffffff"|[[Автомат для поиска образца в тексте]] для строки ''abbab''.
+
!<tex>S_2</tex>
|style="background:#ffffff"|[[Файл:Automata_Search.png|340px]]
+
| <tex>S_1</tex>
 +
| <tex>S_2</tex>
 
|}
 
|}
  
Строка 35: Строка 59:
 
{{Определение
 
{{Определение
 
|definition=
 
|definition=
'''Мгновенное описание (конфигурация)''' {{---}} пара <tex>\langle q, \alpha \rangle</tex>, где <tex>q</tex> {{---}} текущее состояние, <tex>\alpha</tex> {{---}} оставшиеся символы.
+
'''Мгновенное описание''' ('''конфигурация''') (англ. ''snapshot'') {{---}} пара <tex>\langle q, \alpha \rangle</tex>, где <tex>q</tex> {{---}} текущее состояние, <tex>\alpha</tex> {{---}} оставшиеся символы.
 
}}
 
}}
Будем говорить, что конфигурация <tex>\langle p, \beta \rangle</tex> выводима из <tex>\langle q, \alpha \rangle</tex> за 1 шаг <tex>(\langle q, \alpha \rangle \vdash \langle p, \beta \rangle)</tex>, если:
+
Будем говорить, что конфигурация <tex>\langle p, \beta \rangle</tex> выводима из <tex>\langle q, \alpha \rangle</tex> за один шаг <tex>(\langle q, \alpha \rangle \vdash \langle p, \beta \rangle)</tex>, если:
 
* <tex>\alpha = c\beta</tex>,
 
* <tex>\alpha = c\beta</tex>,
 
* <tex>\delta (q, c)=p </tex>.
 
* <tex>\delta (q, c)=p </tex>.
Строка 54: Строка 78:
 
{{Определение
 
{{Определение
 
|definition=
 
|definition=
Множество <tex>L(\mathcal{A})=\{\alpha| \exists t \in T : \langle s, \alpha \rangle \vdash^* \langle t, \varepsilon \rangle\}</tex> называется '''языком автомата <tex>\mathcal{A}</tex>'''.
+
Множество <tex>L(\mathcal{A})=\{\alpha \mid \exists t \in T : \langle s, \alpha \rangle \vdash^* \langle t, \varepsilon \rangle\}</tex> называется '''языком автомата''' (англ. ''automata's language'') <tex>\mathcal{A}</tex>.
 
}}
 
}}
 
Иначе говоря, языком автомата является множество всех допускаемых им слов. Произвольный язык является автоматным, если существует ДКА, допускающий те и только те слова, которые принадлежат языку.
 
Иначе говоря, языком автомата является множество всех допускаемых им слов. Произвольный язык является автоматным, если существует ДКА, допускающий те и только те слова, которые принадлежат языку.
Строка 64: Строка 88:
  
 
== Изоморфизм двух автоматов ==
 
== Изоморфизм двух автоматов ==
=== Формулировка ===
+
{{Определение
 +
|definition=
 +
Автоматы называются '''изоморфными''' (англ. ''isomorphic''), если существует [[Отображения | биекция]] между их вершинами такая, что сохраняются все переходы, терминальные состояния соответствуют терминальным, а начальные {{---}} начальным.
 +
}}
 +
{{Задача
 +
|definition=  
 
Задано два детерминированных конечных автомата. Определить, изоморфны ли они друг другу.
 
Задано два детерминированных конечных автомата. Определить, изоморфны ли они друг другу.
 
Гарантируется, что все состояния автоматов достижимы.
 
Гарантируется, что все состояния автоматов достижимы.
 +
}}
  
 
=== Алгоритм ===
 
=== Алгоритм ===
Будем проверять изоморфизм переходов для двух вершин(то есть если множество переходов по ребрам для двух вершин совпадают, то такие вершины изоморфны). Тогда если соответствующие вершины будут изоморфны, то два автомата изоморфны. Запустим обход в глубину из стартовых вершин, тогда две вершины изоморфны, если множество переходов по ребрам для двух вершин совпадают и концы соответствующих ребер изоморфны. Этот алгоритм пройдет по всем веришнам и ребрам, из этого следует время работы <tex>O(N + M) </tex>, где <tex> N</tex> суммарное число вершин в автоматах, <tex> M</tex> - суммарное число ребер.
+
Из определения следует, что если автоматы изоморфны, то можно их состояния занумеровать одним способом так, что вершины из разных автоматов с одинаковыми номерами будут равны — то есть в каждом из этих двух состояний существует переход в какое-то состояние с таким же номером, что и переход по этой же букве в другом состоянии. Поэтому мы можем зафиксировать какую-то нумерацию, например, в порядке [[Обход в глубину, цвета вершин | обхода в глубину]] по символам в лексикографическом порядке и просто проверить состояния с одинаковыми номерами на равенство. Если все состояния будут равны, то автоматы будут равны, в нашем случае будет следовать изоморфизм двух автоматов. Асимптотика алгоритма совпадает с асимптотикой обхода в глубину, то есть <tex>O(N + M) </tex>, где <tex> N</tex> {{---}} суммарное число вершин в автоматах, <tex> M</tex> {{---}} суммарное число ребер.
  
 
=== Псевдокод ===
 
=== Псевдокод ===
  '''boolean''' dfs(Vertex u, Vertex v) {
+
* <tex> \mathtt {Transitions} </tex> {{---}} множество пар  <tex>\langle a</tex>, <tex>T \rangle</tex> , где <tex> a \in \Sigma</tex>, <tex>T \in Q</tex>
     '''for'''(Edge e u.edges) {
+
* <tex> \mathtt {Assotiations} </tex> {{---}} массив, где каждому состоянию первого автомата соответствует найденное состояние второго автомата.
          '''if''' ('''not''' v.edges.contains(e)) {
+
  '''boolean''' dfs(u: '''Vertex''', v: '''Vertex'''):
            '''return false''';
+
     visited[u] = ''true''   <font color="green">// заметим, что достаточно только одного массива <tex>\mathtt{visited}</tex> на два автомата</font>
          }
+
   
     }
+
    '''if''' (v.terminal '''!=''' u.terminal)
     '''for'''(Edge e v.edges) {
+
      '''return''' ''false''  
          '''if''' ('''not''' u.edges.contains(e)) {
+
    associations[u] = v
            '''return false''';
+
     '''boolean''' result = ''true''
           }
+
     '''for''' (<tex>\langle c, q \rangle</tex> : u.transitions)    
     }
+
      '''Vertex''' t1 = u.transitions.getVertex(c)
 +
      '''Vertex''' t2 = v.transitions.getVertex(c)
 +
      '''if''' одна из вершин t1, t2 ''дьявольская'', а другая {{---}} нет
 +
        '''return''' ''false''
 +
      '''if''' (visited[t1])
 +
        result = result '''and''' t2 '''==''' associations[t1]
 +
      '''else'''
 +
        result = result '''and''' dfs(t1, t2)               
 +
            
 +
     '''return''' result
  
 
== См. также ==
 
== См. также ==
 
* [[Недетерминированные конечные автоматы]]
 
* [[Недетерминированные конечные автоматы]]
* [[Автомат для поиска образца в тексте]]
+
* [[Автомат Кнута-Морриса-Пратта]]
 +
* [[Суффиксный автомат]]
 
* [[Алгоритм Ахо-Корасик]]
 
* [[Алгоритм Ахо-Корасик]]
 
* [[Теорема Клини (совпадение классов автоматных и регулярных языков)]]
 
* [[Теорема Клини (совпадение классов автоматных и регулярных языков)]]
  
== Источники ==
+
== Источники информации==
 
* ''Хопкрофт Д., Мотвани Р., Ульман Д.'' Введение в теорию автоматов, языков и вычислений, 2-е изд. : Пер. с англ. — М.:Издательский дом «Вильямс», 2002. — С. 61.— ISBN 5-8459-0261-4
 
* ''Хопкрофт Д., Мотвани Р., Ульман Д.'' Введение в теорию автоматов, языков и вычислений, 2-е изд. : Пер. с англ. — М.:Издательский дом «Вильямс», 2002. — С. 61.— ISBN 5-8459-0261-4
* [[wikipedia:Deterministic_finite_automaton | Wikipedia {{---}} Deterministic_finite_automaton]]
 
 
* ''Lawson, Mark V. (2004). Finite automata''. Chapman and Hall/CRC. ISBN 1-58488-255-7.
 
* ''Lawson, Mark V. (2004). Finite automata''. Chapman and Hall/CRC. ISBN 1-58488-255-7.
 +
* [[wikipedia:Deterministic finite automaton | Wikipedia {{---}} Deterministic finite automaton]]
  
 
[[Категория: Теория формальных языков]]
 
[[Категория: Теория формальных языков]]
 
[[Категория: Автоматы и регулярные языки]]
 
[[Категория: Автоматы и регулярные языки]]

Текущая версия на 19:20, 4 сентября 2022

Определение:
Детерминированный конечный автомат (ДКА) (англ. deterministic finite automaton (DFA)) — набор из пяти элементов [math]\langle \Sigma , Q, s \in Q, T \subset Q, \delta : Q \times \Sigma \to Q \rangle[/math], где [math]\Sigma[/math] — алфавит (англ. alphabet), [math]Q[/math] — множество состояний (англ. finite set of states), [math]s[/math] — начальное (стартовое) состояние (англ. start state), [math]T[/math] — множество допускающих состояний (англ. set of accept states), [math]\delta[/math] — функция переходов (англ. transition function).


Процесс допуска

Изначально автомат находится в стартовом состоянии [math]s[/math]. Автомат считывает символы по очереди. При считывании очередного символа [math]p_i[/math] автомат переходит в состояние [math]\delta(q, p_i)[/math], где [math]q[/math] — текущее состояние автомата. Процесс продолжается до тех пор, пока не будет достигнут конец входного слова.

Определение:
Будем говорить, что автомат допускает (англ. accept) слово, если после окончания описанного выше процесса автомат окажется в допускающем состоянии.

Замечание. Если в какой-то момент из текущего состояния нет перехода по считанному символу, то будем считать, что автомат не допускает данное слово. При реализации вместо отдельного рассмотрения данного случая иногда удобно вводить фиктивную нетерминальную «дьявольскую вершину» (также тупиковое состояние, сток), из которой любой переход ведет в неё же саму, и заменить все несуществующие переходы на переходы в «дьявольскую вершину».

Способы представления

Диаграмма переходов

Диаграмма переходов — граф, вершины которого соответствуют состояниям автомата, а рёбра — переходам между состояниями.

[math]\bigcirc[/math] — нетерминальное состояние,
[math]\circledcirc[/math] — терминальное состояние,
Стрелка [math]\downarrow[/math] указывает на начальное состояние.
Пример Описание
Automata Search.png Автомат для поиска образца в тексте для строки [math]abbab[/math].
Finite state machine 1.png Автомат, принимающий непустые строки из чередующихся символов [math]a[/math] и [math]b[/math],без «дьявольской вершины».
Finite state machine 2.png Автомат, принимающий непустые строки из чередующихся символов [math]a[/math] и [math]b[/math], с «дьявольской вершиной».

Таблица переходов

Таблица переходов [math]T (|Q| \times |\Sigma|)[/math], дающая табличное представление функции [math]\delta[/math].

[math]M = (Q, \Sigma , \delta, q_0, F)[/math], где

  • [math]Q = {S_1, S_2}[/math],
  • [math]\Sigma = \{0, 1 \}[/math],
  • [math]q_0 = S_1[/math],
  • [math]F = {S_1}[/math],
  • [math]\delta[/math] — функция переходов, представленная таблицей:
[math]0[/math]
[math]1[/math]
[math]S_1[/math] [math]S_2[/math] [math]S_1[/math]
[math]S_2[/math] [math]S_1[/math] [math]S_2[/math]

Автоматные языки

Определение:
Мгновенное описание (конфигурация) (англ. snapshot) — пара [math]\langle q, \alpha \rangle[/math], где [math]q[/math] — текущее состояние, [math]\alpha[/math] — оставшиеся символы.

Будем говорить, что конфигурация [math]\langle p, \beta \rangle[/math] выводима из [math]\langle q, \alpha \rangle[/math] за один шаг [math](\langle q, \alpha \rangle \vdash \langle p, \beta \rangle)[/math], если:

  • [math]\alpha = c\beta[/math],
  • [math]\delta (q, c)=p [/math].

Будем говорить, что конфигурация [math]\langle p, \beta \rangle[/math] выводима из [math]\langle q, \alpha \rangle[/math] за конечное число шагов [math](\langle q, \alpha \rangle \vdash^* \langle p, \beta \rangle)[/math], если [math]\exists n:[/math]

  • [math]\alpha = c_1 c_2 ... c_n\beta[/math],
  • [math]\langle q, c_1 c_2 c_3 ... c_n\beta \rangle \vdash \langle u_1, c_2 c_3 ... c_n\beta \rangle \vdash \langle u_2, c_3 ... c_n\beta \rangle \vdash ... \vdash \langle u_{n-1}, c_n\beta \rangle \vdash \langle p, \beta \rangle[/math].


Лемма:
[math]\langle q, \alpha \rangle \vdash^* \langle p, \varepsilon \rangle, \langle p, \beta \rangle \vdash^* \langle r, \varepsilon \rangle \Rightarrow \langle q, \alpha\beta \rangle \vdash^* \langle r, \varepsilon \rangle[/math].
Доказательство:
[math]\triangleright[/math]
[math]\langle q, \alpha\beta \rangle \vdash^* \langle p, \beta \rangle \vdash^* \langle r, \varepsilon \rangle.[/math]
[math]\triangleleft[/math]


Определение:
Множество [math]L(\mathcal{A})=\{\alpha \mid \exists t \in T : \langle s, \alpha \rangle \vdash^* \langle t, \varepsilon \rangle\}[/math] называется языком автомата (англ. automata's language) [math]\mathcal{A}[/math].

Иначе говоря, языком автомата является множество всех допускаемых им слов. Произвольный язык является автоматным, если существует ДКА, допускающий те и только те слова, которые принадлежат языку.


Определение:
Множество языков всех ДКА образует множество автоматных языков [math]\mathrm{AUT}[/math].


Изоморфизм двух автоматов

Определение:
Автоматы называются изоморфными (англ. isomorphic), если существует биекция между их вершинами такая, что сохраняются все переходы, терминальные состояния соответствуют терминальным, а начальные — начальным.


Задача:
Задано два детерминированных конечных автомата. Определить, изоморфны ли они друг другу. Гарантируется, что все состояния автоматов достижимы.


Алгоритм

Из определения следует, что если автоматы изоморфны, то можно их состояния занумеровать одним способом так, что вершины из разных автоматов с одинаковыми номерами будут равны — то есть в каждом из этих двух состояний существует переход в какое-то состояние с таким же номером, что и переход по этой же букве в другом состоянии. Поэтому мы можем зафиксировать какую-то нумерацию, например, в порядке обхода в глубину по символам в лексикографическом порядке и просто проверить состояния с одинаковыми номерами на равенство. Если все состояния будут равны, то автоматы будут равны, в нашем случае будет следовать изоморфизм двух автоматов. Асимптотика алгоритма совпадает с асимптотикой обхода в глубину, то есть [math]O(N + M) [/math], где [math] N[/math] — суммарное число вершин в автоматах, [math] M[/math] — суммарное число ребер.

Псевдокод

  • [math] \mathtt {Transitions} [/math] — множество пар [math]\langle a[/math], [math]T \rangle[/math] , где [math] a \in \Sigma[/math], [math]T \in Q[/math]
  • [math] \mathtt {Assotiations} [/math] — массив, где каждому состоянию первого автомата соответствует найденное состояние второго автомата.
boolean dfs(u: Vertex, v: Vertex): 
   visited[u] = true   // заметим, что достаточно только одного массива [math]\mathtt{visited}[/math] на два автомата
   
   if (v.terminal != u.terminal)
     return false   
   associations[u] = v
   boolean result = true
   for ([math]\langle c, q \rangle[/math] : u.transitions)      
     Vertex t1 = u.transitions.getVertex(c)
     Vertex t2 = v.transitions.getVertex(c)
     if одна из вершин t1, t2 дьявольская, а другая — нет
       return false
     if (visited[t1]) 
       result = result and t2 == associations[t1]
     else
       result = result and dfs(t1, t2)                
         
   return result

См. также

Источники информации

  • Хопкрофт Д., Мотвани Р., Ульман Д. Введение в теорию автоматов, языков и вычислений, 2-е изд. : Пер. с англ. — М.:Издательский дом «Вильямс», 2002. — С. 61.— ISBN 5-8459-0261-4
  • Lawson, Mark V. (2004). Finite automata. Chapman and Hall/CRC. ISBN 1-58488-255-7.
  • Wikipedia — Deterministic finite automaton