Минимизация ДКА, алгоритм за O(n^2) с построением пар различимых состояний — различия между версиями

Материал из Викиконспекты
Перейти к: навигация, поиск
м (Источники)
м (rollbackEdits.php mass rollback)
 
(не показаны 73 промежуточные версии 11 участников)
Строка 1: Строка 1:
==Определения==
+
{{Задача
{{Определение
 
 
|definition =  
 
|definition =  
Состояния <tex>u</tex> и <tex>v</tex> '''различимы строкой''' <tex>s</tex>, если
+
Пусть дан [[Детерминированные_конечные_автоматы | автомат]] <tex>\mathcal{A}</tex>. Требуется построить автомат <tex>\mathcal{A}_{min}</tex> с наименьшим количеством состояний, распознающий тот же язык, что и <tex>\mathcal{A}</tex>.
# <tex> \langle u, s \rangle \vdash^* \langle t, \varepsilon \rangle </tex>, где <tex>t \in T </tex>,
 
# <tex> \langle v, s \rangle \vdash^* \langle z, \varepsilon \rangle </tex>, где <tex>z \notin T </tex>.
 
}}
 
{{Определение
 
|definition =
 
Состояния <tex>u</tex> и <tex>v</tex> '''эквивалентны''', если они не различимы никакой строкой <tex>s</tex>.
 
 
}}
 
}}
  
 +
==Алгоритм==
 +
=== Описание ===
 +
Основная идея алгоритма заключается в том, чтобы разбить состояния на [[Отношение эквивалентности#Классы эквивалентности | классы эквивалентности]] — они и будут состояниями минимизированного автомата.
 +
 +
Для реализации алгоритма нам потребуются [[Очередь | очередь]] <tex>Q</tex> и таблица <tex>marked</tex> размером <tex>n \times n</tex>, где <tex>n</tex> — количество состояний автомата. Будем помечать в таблице пары [[Эквивалентность состояний ДКА | неэквивалентных состояний]] и класть их в очередь.
  
{{Теорема
+
* В исходном автомате мы имели <tex>n</tex> состояний с номерами от <tex>0</tex> до <tex>n - 1</tex>. Удобно будет увеличить все номера состояний на <tex>1</tex> и добавить в исходный автомат вершину <tex>0</tex>, в которую будут вести по умолчанию все переходы по всем символам (в том числе переходы по всем символам в эту вершину из неё самой), которых не было в исходном автомате, тем самым увеличив количество состояний <tex>n</tex> на <tex>1</tex>. Теперь стартовое состояние будет иметь номер <tex>1</tex>.
|statement =
+
* '''Шаг 1'''. Построим множество <tex>\delta^{-1}</tex>, в котором будем хранить списки обратных ребер.
Если <tex>u</tex> и <tex>v</tex>, <tex>v</tex> и <tex>z</tex> эквивалентны, то <tex>u</tex> и <tex>z</tex> эквивалентны.
+
* '''Шаг 2'''. Найдем все достижимые состояния из стартового. Например, с помощью [[Обход_в_глубину,_цвета_вершин | обхода в глубину]].
|proof =
+
* '''Шаг 3'''. Добавим в очередь <tex>Q</tex> пары состояний, различимых строкой <tex> \varepsilon </tex>, и пометим их в таблице.
Пусть <tex>u</tex> и <tex>z</tex> неэквивалентны. Тогда <tex> \mathcal {9} s</tex> такая, что
+
* '''Шаг 4'''. Для каждой непомеченной пары <tex> \langle u, v \rangle </tex> нужно проверить, что <tex>\exists c \in \Sigma</tex> такой, что пара <tex>\langle \delta(u, c), \delta(v, c) \rangle</tex> помечена. Тогда мы можем пометить пару <tex> \langle u, v \rangle </tex>.
# <tex> \langle u, s \rangle \vdash^* \langle t, \varepsilon \rangle </tex>, где <tex>t \in T </tex>,
+
: Пока <tex>Q</tex> не станет пуста, будем делать следующее:
# <tex> \langle z, s \rangle \vdash^* \langle t_1, \varepsilon \rangle </tex>, где <tex>t_1 \notin T </tex>.
+
: 1. Извлечем пару <tex> \langle u, v \rangle </tex> из <tex>Q</tex>.  
Рассмотрим <tex>x</tex> такой, что <tex> \langle v, s \rangle \vdash^* \langle x, \varepsilon \rangle </tex>. <br>
+
: 2. Для каждого символа <tex>c \in \Sigma</tex> перебираем пары состояний <tex>\langle \delta^{-1}(u, c), \delta^{-1}(v,c) \rangle</tex>. Если находим ещё непомеченную пару, то помечаем её в таблице и кладем в очередь.
Если <tex>x \in T</tex>, то <tex>v</tex> и <tex>z</tex> различимы строкой <tex>s</tex>. Противоречие. <br>
+
: В момент опустошения очереди пары состояний, не помеченные в таблице, являются парами эквивалентных состояний.
Если <tex>x \notin T</tex>, то <tex>u</tex> и <tex>v</tex> различимы строкой <tex>s</tex>. Противоречие. <br>
+
* '''Шаг 5'''. За один проход по таблице разбиваем пары эквивалентных состояний на классы эквивалентности.
Значит, <tex>u</tex> и <tex>z</tex> эквивалентны.
+
* '''Шаг 6'''. За один проход по списку классов эквивалентности выделяем список новых состояний и переходов между ними.
}}
+
Стартовым состоянием полученного автомата будет состояние, соответствующее классу эквивалентности, содержащему стартовое состояние исходного автомата.
  
==Алгоритм==
 
Основная идея алгоритма заключается в том, чтобы разбить состояния на классы эквивалентности — они и будут состояниями минимизированного автомата. <br>
 
Для реализации алгоритма нам потребуются очередь <tex>Q</tex> и таблица размером <tex>n \times n</tex>, где <tex>n</tex> — количество состояний автомата. <br>
 
Будем помечать в таблице пары неэквивалентных состояний и класть их в очередь. <br>
 
Изначально добавим в очередь <tex>Q</tex> пары состояний различимых строкой <tex> \varepsilon </tex> и пометим их в таблице.
 
Пока <tex>Q</tex> не станет пуста, будем делать следующее:
 
#Извлечем пару <tex> \langle u, v \rangle </tex> из <tex>Q</tex>.
 
#Отметим в таблице и добавим в очередь <tex>Q</tex> все пары <tex> \langle t, k \rangle </tex> такие, что <tex> \mathcal {9} c \in \Sigma, \langle t, c \rangle \vdash \langle u, \varepsilon \rangle, \langle k, c \rangle \vdash \langle v, \varepsilon \rangle </tex>, и пара <tex> \langle t, k \rangle</tex> не отмечена в таблице.
 
В момент опустошения очереди пары состояний, не помеченных в таблице, являются парами эквивалентных состояний. 
 
За один проход по таблице, согласно теореме, разбиваем пары эквивалентных состояний на классы эквивалентности. <br>
 
Стартовым состоянием полученного автомата будет состояние, соответствующее классу эквивалентности, содержащему стартовое состояние исходного автомата. <br>
 
 
Терминальными состояниями полученного автомата будут состояния, соответствующие классам эквивалентности, содержащим терминальные состояния исходного автомата.
 
Терминальными состояниями полученного автомата будут состояния, соответствующие классам эквивалентности, содержащим терминальные состояния исходного автомата.
  
==Корректность алгоритма==
+
===Корректность===
Пусть в результате применения данного алгоритма к автомату <tex>A</tex> мы получили автомат <tex>A_{min}</tex>. Докажем, что этот автомат минимальный и единственный с точностью до изоморфизма. <br>
+
Пусть в результате применения данного алгоритма к автомату <tex>A</tex> мы получили автомат <tex>\mathcal{A}_{min}</tex>. Докажем, что этот автомат минимальный и единственный с точностью до изоморфизма.
Пусть существует автомат <tex>A'</tex> эквивалентный <tex>A</tex>, но с числом состояний меньшим чем в <tex>A_{min}</tex>.
+
 
Стартовые состояния <tex>s \in A_{min}</tex> и <tex>s' \in A'</tex> эквивалентны, так как <tex>A_{min}</tex> и <tex>A'</tex> допускают один и тот же язык. Рассмотрим строку <tex>\alpha = a_1a_2...a_{k}</tex>, где <tex>a_{i} \in \Sigma</tex> такую, что <tex> \langle s, \alpha \rangle \vdash^* \langle u, \varepsilon \rangle </tex>, <tex> \langle s', \alpha \rangle \vdash^* \langle u', \varepsilon \rangle </tex>. Пусть <tex>\langle s, a_1 \rangle \vdash^* \langle l, \varepsilon \rangle </tex> и <tex>\langle s', a_1 \rangle \vdash^* \langle l', \varepsilon \rangle </tex>. Так как <tex>s</tex> и <tex>s'</tex> эквивалентны, то <tex>l</tex> и <tex>l'</tex> эквивалентны. Аналогично для всех <tex>a_{i}</tex>. В итоге получим, что <tex>u</tex> эквивалентно <tex>u'</tex>. Значит для каждого состояния из <tex>A_{min}</tex> существует эквивалентное состояние из <tex>A'</tex>.<br>
+
Пусть существует автомат <tex>\mathcal{A}'</tex>, эквивалентный <tex>\mathcal{A}</tex>, но с числом состояний меньшим, чем в <tex>\mathcal{A}_{min}</tex>.
Состояний в <tex>A'</tex> меньше, чем в <tex>A_{min}</tex>, значит двум состояниям из <tex>A_{min}</tex> эквивалентно одно состояние из <tex>A'</tex>. Тогда эти два состояния эквивалентны, но автомат <tex>A_{min}</tex> построен так, что в нем нет эквивалентных состояний. Противоречие.<br>
+
Стартовые состояния <tex>s \in \mathcal{A}_{min}</tex> и <tex>s' \in \mathcal{A}'</tex> эквивалентны, так как <tex>\mathcal{A}_{min}</tex> и <tex>\mathcal{A}'</tex> допускают один и тот же язык. Рассмотрим строку <tex>\alpha = a_1a_2 \ldots a_{k}</tex>, где <tex>a_{i} \in \Sigma</tex>, такую, что <tex> \langle s, \alpha \rangle \vdash^* \langle u, \varepsilon \rangle </tex>, <tex> \langle s', \alpha \rangle \vdash^* \langle u', \varepsilon \rangle </tex>. Пусть <tex>\langle s, a_1 \rangle \vdash \langle l, \varepsilon \rangle </tex> и <tex>\langle s', a_1 \rangle \vdash \langle l', \varepsilon \rangle </tex>. Так как <tex>s</tex> и <tex>s'</tex> эквивалентны, то <tex>l</tex> и <tex>l'</tex> эквивалентны. Аналогично для всех <tex>a_{i}</tex>. В итоге получим, что <tex>u</tex> эквивалентно <tex>u'</tex>. Значит, для каждого состояния из <tex>\mathcal{A}_{min}</tex> существует эквивалентное состояние из <tex>\mathcal{A}'</tex>.
Так как каждому состоянию из <tex>A_{min}</tex> эквивалентно состояние из <tex>A'</tex>, то автоматы <tex>A_{min}</tex> и <tex>A'</tex> изоморфны.
+
 
 +
Состояний в <tex>A'</tex> меньше, чем в <tex>\mathcal{A}_{min}</tex>, значит двум состояниям из <tex>\mathcal{A}_{min}</tex> эквивалентно одно состояние из <tex>\mathcal{A}'</tex>. Тогда эти два состояния эквивалентны, но автомат <tex>\mathcal{A}_{min}</tex> построен так, что в нем нет эквивалентных состояний. Противоречие.
 +
 
 +
Так как каждому состоянию из <tex>\mathcal{A}_{min}</tex> эквивалентно состояние из <tex>\mathcal{A}'</tex>, то автоматы <tex>\mathcal{A}_{min}</tex> и <tex>\mathcal{A}'</tex> изоморфны.
 +
 
 +
== Псевдокод ==
 +
Функция для построения таблицы неэквивалентности.
 +
'''boolean'''[][] buildTable('''int''' n, '''boolean'''[] isTerminal, '''vector'''[][] <tex>\delta^{-1}</tex>):
 +
    '''queue''' Q
 +
    '''boolean''' marked[n][n]
 +
    <font color="green">// Шаг 3</font>
 +
    '''for''' i = 0<tex>\ldots</tex>n - 1
 +
      '''for''' j = 0<tex>\ldots</tex>n - 1
 +
          '''if''' '''not''' marked[i][j] '''and''' isTerminal[i] != isTerminal[j]
 +
            marked[i][j] = marked[j][i] = ''true''
 +
            Q.push(<tex>\langle i, j \rangle</tex>)
 +
 +
    <font color="green">// Шаг 4</font>
 +
    '''while''' '''not''' Q.isEmpty()
 +
      <tex>\langle u, v \rangle</tex> = Q.poll()
 +
      '''for''' c <tex>\in</tex> <tex>\Sigma</tex>
 +
          '''for''' r <tex>\in</tex> <tex>\delta^{-1}</tex>[u][c]
 +
            '''for''' s <tex>\in</tex> <tex>\delta^{-1}</tex>[v][c]
 +
                '''if''' '''not''' marked[r][s]
 +
                  marked[r][s] = marked[s][r] = ''true''
 +
                  Q.push(<tex>\langle r, s \rangle</tex>)
 +
    '''return''' marked
 +
 
 +
Основная функция алгоритма.  
 +
'''function''' minimization('''int''' n, '''boolean'''[] isTerminal, '''int'''[][] <tex>\delta</tex>):
 +
    <font color="green">// Шаг 1</font>
 +
    Построим таблицу списков обратных ребер {{---}} <tex>\delta^{-1}</tex> размером <tex>n \times |\Sigma|</tex>.
 +
    <font color="green">// Шаг 2</font>
 +
    Построим массив достижимости состояний из стартового {{---}} reachable размером <tex>n</tex>.
 +
    <font color="green">// Шаги 3 и 4</font>
 +
    '''boolean'''[][] marked = buildTable(n, isTerminal, <tex>\delta^{-1}</tex>)
 +
    <font color="green">// Шаг 5</font>
 +
    '''int'''[] component[n] <font color="green">// По позиции i будем хранить номер компоненты эквивалентности для i-ого состояния.</font>
 +
    fill(component, -1)
 +
    '''for''' i = 0<tex>\ldots</tex>n - 1
 +
      '''if''' '''not''' marked[0][i]
 +
          component[i] = 0
 +
 +
    '''int''' componentsCount = 0
 +
    '''for''' i = 1<tex>\ldots</tex>n - 1
 +
      '''if''' '''not''' reachable[i]
 +
          ''continue''
 +
      '''if''' component[i] == -1
 +
          componentsCount++
 +
          component[i] = componentsCount
 +
          '''for''' j = i + 1<tex>\ldots</tex>n - 1
 +
            '''if''' '''not''' marked[i][j]
 +
                component[j] = componentsCount
 +
    <font color="green">// Шаг 6</font>
 +
    buildDFA(component) <font color="green">// Строим требуемый автомат.</font>
 +
 
 +
==Асимптотика==
 +
Поиск недостижимых состояний с помощью [[Обход_в_глубину,_цвета_вершин | обхода в глубину]] требует <tex>\mathcal{O}(n \cdot |\Sigma|)</tex> времени. Каждую пару мы добавляли в очередь один раз, значит время заполнения таблицы <tex>\mathcal{O}(n^2)</tex>. Разбиение на классы эквивалентности делается за один проход по таблице, то есть за <tex>\mathcal{O}(n^2)</tex>.
 +
 
 +
==Пример работы==
 +
Минимизируем данный автомат:
 +
 
 +
[[Файл:dka.png]]
 +
 
 +
=== Шаг <tex>1</tex> ===
 +
Строим <tex>\delta^{-1}</tex>. Например, <tex>\delta^{-1}(F, 1) = \{C, D, G, F\}</tex>.
 +
 
 +
=== Шаг <tex> 2 </tex> ===
 +
Построили массив достижимости состояний из стартового.
 +
{| border="1" class="wikitable" width="20%" style="color: blue; background-color:#ffffcc;" cellpadding="10"; float: left;"
 +
 
 +
!'''Ø'''
 +
! A
 +
! B
 +
! C
 +
! D
 +
! E
 +
! F
 +
! G
 +
! H
 +
|-
 +
|align="center"|<tex>1</tex>
 +
|align="center"|<tex>1</tex>
 +
|align="center"|<tex>1</tex>
 +
|align="center"|<tex>1</tex>
 +
|align="center"|<tex>0</tex>
 +
|align="center"|<tex>1</tex>
 +
|align="center"|<tex>1</tex>
 +
|align="center"|<tex>1</tex>
 +
|align="center"|<tex>1</tex>
 +
|}
 +
 
 +
=== Шаг <tex> 3 </tex>===
 +
Инициализировали таблицу.
 +
{| border="1" class="wikitable" width="20%" style="color: blue; background-color:#ffffcc;" cellpadding="10"; float: left;"
 +
!
 +
!'''Ø'''
 +
! A
 +
! B
 +
! C
 +
! D
 +
! E
 +
! F
 +
! G
 +
! H
 +
|-
 +
!'''Ø'''
 +
|
 +
|
 +
|
 +
|
 +
|
 +
|
 +
|align="center"| <font color="black">●
 +
|align="center"| <font color="black">●
 +
|
 +
|-
 +
! A
 +
|
 +
|
 +
|
 +
|
 +
|
 +
|
 +
|align="center"| <font color="black">●
 +
|align="center"| <font color="black">●
 +
|
 +
|-
 +
! B
 +
|
 +
|
 +
|
 +
|
 +
|
 +
|
 +
|align="center"| <font color="black">●
 +
|align="center"| <font color="black">●
 +
|
 +
|-
 +
! C
 +
|
 +
|
 +
|
 +
|
 +
|
 +
|
 +
|align="center"| <font color="black">●
 +
|align="center"| <font color="black">●
 +
|
 +
|-
 +
! D
 +
|
 +
|
 +
|
 +
|
 +
|
 +
|
 +
|align="center"| <font color="black">●
 +
|align="center"| <font color="black">●
 +
|
 +
|-
 +
! E
 +
|
 +
|
 +
|
 +
|
 +
|
 +
|
 +
|align="center"| <font color="black">●
 +
|align="center"| <font color="black">●
 +
|
 +
|-
 +
! F
 +
|align="center"| <font color="black">●
 +
|align="center"| <font color="black">●
 +
|align="center"| <font color="black">●
 +
|align="center"| <font color="black">●
 +
|align="center"| <font color="black">●
 +
|align="center"| <font color="black">●
 +
|
 +
|
 +
|align="center"| <font color="black">●
 +
|-
 +
! G
 +
|align="center"| <font color="black">●
 +
|align="center"| <font color="black">●
 +
|align="center"| <font color="black">●
 +
|align="center"| <font color="black">●
 +
|align="center"| <font color="black">●
 +
|align="center"| <font color="black">●
 +
|
 +
|
 +
|align="center"| <font color="black">●
 +
|-
 +
! H
 +
|
 +
|
 +
|
 +
|
 +
|
 +
|
 +
|align="center"| <font color="black">●
 +
|align="center"| <font color="black">●
 +
|
 +
|}
 +
 
 +
Вычислили таблицу.
 +
{| border="1" class="wikitable" width="20%" style="color: blue; background-color:#ffffcc;" cellpadding="10"; float: left;"
 +
!
 +
!'''Ø'''
 +
! A
 +
! B
 +
! C
 +
! D
 +
! E
 +
! F
 +
! G
 +
! H
 +
|-
 +
!'''Ø'''
 +
|
 +
|align="center"| <font color="black">●
 +
|align="center"| <font color="black">●
 +
|align="center"| <font color="black">●
 +
|align="center"| <font color="black">●
 +
|align="center"| <font color="black">●
 +
|align="center"| <font color="black">●
 +
|align="center"| <font color="black">●
 +
|align="center"| <font color="black">●
 +
|-
 +
! A
 +
|align="center"| <font color="black">●
 +
|
 +
|
 +
|align="center"| <font color="black">●
 +
|align="center"| <font color="black">●
 +
|align="center"| <font color="black">●
 +
|align="center"| <font color="black">●
 +
|align="center"| <font color="black">●
 +
|align="center"| <font color="black">●
 +
|-
 +
! B
 +
|align="center"| <font color="black">●
 +
|
 +
|
 +
|align="center"| <font color="black">●
 +
|align="center"| <font color="black">●
 +
|align="center"| <font color="black">●
 +
|align="center"| <font color="black">●
 +
|align="center"| <font color="black">●
 +
|align="center"| <font color="black">●
 +
|-
 +
! C
 +
|align="center"| <font color="black">●
 +
|align="center"| <font color="black">●
 +
|align="center"| <font color="black">●
 +
|
 +
|
 +
|align="center"| <font color="black">●
 +
|align="center"| <font color="black">●
 +
|align="center"| <font color="black">●
 +
|align="center"| <font color="black">●
 +
|-
 +
! D
 +
|align="center"| <font color="black">●
 +
|align="center"| <font color="black">●
 +
|align="center"| <font color="black">●
 +
|
 +
|
 +
|align="center"| <font color="black">●
 +
|align="center"| <font color="black">●
 +
|align="center"| <font color="black">●
 +
|align="center"| <font color="black">●
 +
|-
 +
! E
 +
|align="center"| <font color="black">●
 +
|align="center"| <font color="black">●
 +
|align="center"| <font color="black">●
 +
|align="center"| <font color="black">●
 +
|align="center"| <font color="black">●
 +
|
 +
|align="center"| <font color="black">●
 +
|align="center"| <font color="black">●
 +
|align="center"| <font color="black">●
 +
|-
 +
! F
 +
|align="center"| <font color="black">●
 +
|align="center"| <font color="black">●
 +
|align="center"| <font color="black">●
 +
|align="center"| <font color="black">●
 +
|align="center"| <font color="black">●
 +
|align="center"| <font color="black">●
 +
|
 +
|
 +
|align="center"| <font color="black">●
 +
|-
 +
! G
 +
|align="center"| <font color="black">●
 +
|align="center"| <font color="black">●
 +
|align="center"| <font color="black">●
 +
|align="center"| <font color="black">●
 +
|align="center"| <font color="black">●
 +
|align="center"| <font color="black">●
 +
|
 +
|
 +
|align="center"| <font color="black">●
 +
|-
 +
! H
 +
|align="center"| <font color="black">●
 +
|align="center"| <font color="black">●
 +
|align="center"| <font color="black">●
 +
|align="center"| <font color="black">●
 +
|align="center"| <font color="black">●
 +
|align="center"| <font color="black">●
 +
|align="center"| <font color="black">●
 +
|align="center"| <font color="black">●
 +
|
 +
|}
  
==Время работы алгоритма==
+
=== Шаг <tex> 5 </tex> ===
Каждую пару мы добавляли в очередь один раз, значит время заполнения таблицы <tex>O(n^2)</tex>. Разбиение на классы эквивалентности делается за один проход по таблице, то есть за <tex>O(n^2)</tex>.
+
Из таблицы видно, что классы эквивалентных состояний это <tex> \{A, B\}, \{C, D\}, \{F, G\}, \{E\}, \{H\}</tex>.
  
==Пример==
+
=== Шаг <tex> 6 </tex> ===
Минимизируем данный автомат. <br>
+
Итого получили такой автомат:
[[Файл:dka.jpg]]
 
<br>
 
Будем рассматривать только нижний треугольник таблицы пар различимых состояний. <br>
 
Отметили состояния, различающиеся строкой <tex>\varepsilon</tex>:
 
{| border = "1"
 
|B
 
|
 
|colspan = "6"|
 
|-
 
|C
 
|
 
|
 
|colspan = "5"|
 
|-
 
|D
 
|
 
|
 
|
 
|colspan = "4"|
 
|-
 
|E
 
|
 
|
 
|
 
|
 
|colspan = "3"|
 
|-
 
|F
 
|x
 
|x
 
|x
 
|x
 
|x
 
|colspan = "2"|
 
|-
 
|G
 
|x
 
|x
 
|x
 
|x
 
|x
 
 
|colspan = "1"|
 
|-
 
|H
 
|
 
|
 
|
 
|
 
|
 
|x
 
|x
 
|-
 
|
 
|A
 
|B
 
|C
 
|D
 
|E
 
|F
 
|G
 
|}
 
  
 +
[[Файл:dkaMin.png]]
  
На момент опустошения очереди:
+
== См. также ==  
{| border = "1"
+
* [[Минимизация ДКА, алгоритм Хопкрофта (сложность O(n log n))]]
|B
 
|
 
|colspan = "6"|
 
|-
 
|C
 
|x
 
|x
 
|colspan = "5"|
 
|-
 
|D
 
|x
 
|x
 
|
 
|colspan = "4"|
 
|-
 
|E
 
|x
 
|x
 
|x
 
|x
 
|colspan = "3"|
 
|-
 
|F
 
|x
 
|x
 
|x
 
|x
 
|x
 
|colspan = "2"|
 
|-
 
|G
 
|x
 
|x
 
|x
 
|x
 
|x
 
 
|colspan = "1"|
 
|-
 
|H
 
|x
 
|x
 
|x
 
|x
 
|x
 
|x
 
|x
 
|-
 
|
 
|A
 
|B
 
|C
 
|D
 
|E
 
|F
 
|G
 
|}
 
  
Из таблицы видно, что классы эквивалентных состояний это <tex> \mathcal {f} A, B \mathcal {g}, \mathcal {f} C, D \mathcal {g}, \mathcal {f} F, G \mathcal {g}, \mathcal {f} E \mathcal {g}, \mathcal {f} H \mathcal {g} </tex>. <br>
+
==Источники информации==
Итого получили такой автомат: <br> [[Файл:dkaMin.jpg]]
+
* ''Хопкрофт Д., Мотвани Р., Ульман Д.'' Введение в теорию автоматов, языков и вычислений, 2-е издание. Пер. с англ. — М.: Издательский дом «Вильямс», 2002. — С. 171 - 182. — ISBN 5-8459-0261-4
 +
* [[wikipedia:ru:DFA_minimization | Wikipedia {{---}} DFA minimization]]
 +
* [http://www.eecs.berkeley.edu/~sseshia/172/lectures/Lecture6.pdf Sanjit A. Seshia, "Minimization of DFAs"]
 +
* [http://www.comp.nus.edu.sg/~cs4212/dfa-min.pdf National University of Singapore, "DFA Minimization"]
  
==Источники==
+
[[Категория: Теория формальных языков]]
''Хопкрофт Д., Мотвани Р., Ульман Д.'' Введение в теорию автоматов, языков и вычислений, 2-е издание. Пер. с англ. — М.: Издательский дом «Вильямс», 2002. — С. 171 — 182. — ISBN 5-8459-0261-4
+
[[Категория: Автоматы и регулярные языки]]
 +
[[Категория: Минимизация ДКА ]]

Текущая версия на 19:41, 4 сентября 2022

Задача:
Пусть дан автомат [math]\mathcal{A}[/math]. Требуется построить автомат [math]\mathcal{A}_{min}[/math] с наименьшим количеством состояний, распознающий тот же язык, что и [math]\mathcal{A}[/math].


Алгоритм

Описание

Основная идея алгоритма заключается в том, чтобы разбить состояния на классы эквивалентности — они и будут состояниями минимизированного автомата.

Для реализации алгоритма нам потребуются очередь [math]Q[/math] и таблица [math]marked[/math] размером [math]n \times n[/math], где [math]n[/math] — количество состояний автомата. Будем помечать в таблице пары неэквивалентных состояний и класть их в очередь.

  • В исходном автомате мы имели [math]n[/math] состояний с номерами от [math]0[/math] до [math]n - 1[/math]. Удобно будет увеличить все номера состояний на [math]1[/math] и добавить в исходный автомат вершину [math]0[/math], в которую будут вести по умолчанию все переходы по всем символам (в том числе переходы по всем символам в эту вершину из неё самой), которых не было в исходном автомате, тем самым увеличив количество состояний [math]n[/math] на [math]1[/math]. Теперь стартовое состояние будет иметь номер [math]1[/math].
  • Шаг 1. Построим множество [math]\delta^{-1}[/math], в котором будем хранить списки обратных ребер.
  • Шаг 2. Найдем все достижимые состояния из стартового. Например, с помощью обхода в глубину.
  • Шаг 3. Добавим в очередь [math]Q[/math] пары состояний, различимых строкой [math] \varepsilon [/math], и пометим их в таблице.
  • Шаг 4. Для каждой непомеченной пары [math] \langle u, v \rangle [/math] нужно проверить, что [math]\exists c \in \Sigma[/math] такой, что пара [math]\langle \delta(u, c), \delta(v, c) \rangle[/math] помечена. Тогда мы можем пометить пару [math] \langle u, v \rangle [/math].
Пока [math]Q[/math] не станет пуста, будем делать следующее:
1. Извлечем пару [math] \langle u, v \rangle [/math] из [math]Q[/math].
2. Для каждого символа [math]c \in \Sigma[/math] перебираем пары состояний [math]\langle \delta^{-1}(u, c), \delta^{-1}(v,c) \rangle[/math]. Если находим ещё непомеченную пару, то помечаем её в таблице и кладем в очередь.
В момент опустошения очереди пары состояний, не помеченные в таблице, являются парами эквивалентных состояний.
  • Шаг 5. За один проход по таблице разбиваем пары эквивалентных состояний на классы эквивалентности.
  • Шаг 6. За один проход по списку классов эквивалентности выделяем список новых состояний и переходов между ними.

Стартовым состоянием полученного автомата будет состояние, соответствующее классу эквивалентности, содержащему стартовое состояние исходного автомата.

Терминальными состояниями полученного автомата будут состояния, соответствующие классам эквивалентности, содержащим терминальные состояния исходного автомата.

Корректность

Пусть в результате применения данного алгоритма к автомату [math]A[/math] мы получили автомат [math]\mathcal{A}_{min}[/math]. Докажем, что этот автомат минимальный и единственный с точностью до изоморфизма.

Пусть существует автомат [math]\mathcal{A}'[/math], эквивалентный [math]\mathcal{A}[/math], но с числом состояний меньшим, чем в [math]\mathcal{A}_{min}[/math]. Стартовые состояния [math]s \in \mathcal{A}_{min}[/math] и [math]s' \in \mathcal{A}'[/math] эквивалентны, так как [math]\mathcal{A}_{min}[/math] и [math]\mathcal{A}'[/math] допускают один и тот же язык. Рассмотрим строку [math]\alpha = a_1a_2 \ldots a_{k}[/math], где [math]a_{i} \in \Sigma[/math], такую, что [math] \langle s, \alpha \rangle \vdash^* \langle u, \varepsilon \rangle [/math], [math] \langle s', \alpha \rangle \vdash^* \langle u', \varepsilon \rangle [/math]. Пусть [math]\langle s, a_1 \rangle \vdash \langle l, \varepsilon \rangle [/math] и [math]\langle s', a_1 \rangle \vdash \langle l', \varepsilon \rangle [/math]. Так как [math]s[/math] и [math]s'[/math] эквивалентны, то [math]l[/math] и [math]l'[/math] эквивалентны. Аналогично для всех [math]a_{i}[/math]. В итоге получим, что [math]u[/math] эквивалентно [math]u'[/math]. Значит, для каждого состояния из [math]\mathcal{A}_{min}[/math] существует эквивалентное состояние из [math]\mathcal{A}'[/math].

Состояний в [math]A'[/math] меньше, чем в [math]\mathcal{A}_{min}[/math], значит двум состояниям из [math]\mathcal{A}_{min}[/math] эквивалентно одно состояние из [math]\mathcal{A}'[/math]. Тогда эти два состояния эквивалентны, но автомат [math]\mathcal{A}_{min}[/math] построен так, что в нем нет эквивалентных состояний. Противоречие.

Так как каждому состоянию из [math]\mathcal{A}_{min}[/math] эквивалентно состояние из [math]\mathcal{A}'[/math], то автоматы [math]\mathcal{A}_{min}[/math] и [math]\mathcal{A}'[/math] изоморфны.

Псевдокод

Функция для построения таблицы неэквивалентности.

boolean[][] buildTable(int n, boolean[] isTerminal, vector[][] [math]\delta^{-1}[/math]):
   queue Q
   boolean marked[n][n]
   // Шаг 3
   for i = 0[math]\ldots[/math]n - 1
      for j = 0[math]\ldots[/math]n - 1
         if not marked[i][j] and isTerminal[i] != isTerminal[j]
            marked[i][j] = marked[j][i] = true
            Q.push([math]\langle i, j \rangle[/math])

   // Шаг 4
   while not Q.isEmpty()
      [math]\langle u, v \rangle[/math] = Q.poll()
      for c [math]\in[/math] [math]\Sigma[/math]
         for r [math]\in[/math] [math]\delta^{-1}[/math][u][c]
            for s [math]\in[/math] [math]\delta^{-1}[/math][v][c]	
               if not marked[r][s]
                  marked[r][s] = marked[s][r] = true
                  Q.push([math]\langle r, s \rangle[/math])
   return marked

Основная функция алгоритма.

function minimization(int n, boolean[] isTerminal, int[][] [math]\delta[/math]):
   // Шаг 1
   Построим таблицу списков обратных ребер — [math]\delta^{-1}[/math] размером [math]n \times |\Sigma|[/math].
   // Шаг 2
   Построим массив достижимости состояний из стартового — reachable размером [math]n[/math].
   // Шаги 3 и 4
   boolean[][] marked = buildTable(n, isTerminal, [math]\delta^{-1}[/math])
   // Шаг 5
   int[] component[n] // По позиции i будем хранить номер компоненты эквивалентности для i-ого состояния.
   fill(component, -1)
   for i = 0[math]\ldots[/math]n - 1
      if not marked[0][i]
         component[i] = 0
	
   int componentsCount = 0
   for i = 1[math]\ldots[/math]n - 1
      if not reachable[i]
         continue
      if component[i] == -1
         componentsCount++
         component[i] = componentsCount
         for j = i + 1[math]\ldots[/math]n - 1
            if not marked[i][j]
               component[j] = componentsCount
   // Шаг 6
   buildDFA(component) // Строим требуемый автомат.

Асимптотика

Поиск недостижимых состояний с помощью обхода в глубину требует [math]\mathcal{O}(n \cdot |\Sigma|)[/math] времени. Каждую пару мы добавляли в очередь один раз, значит время заполнения таблицы [math]\mathcal{O}(n^2)[/math]. Разбиение на классы эквивалентности делается за один проход по таблице, то есть за [math]\mathcal{O}(n^2)[/math].

Пример работы

Минимизируем данный автомат:

Dka.png

Шаг [math]1[/math]

Строим [math]\delta^{-1}[/math]. Например, [math]\delta^{-1}(F, 1) = \{C, D, G, F\}[/math].

Шаг [math] 2 [/math]

Построили массив достижимости состояний из стартового.

Ø A B C D E F G H
[math]1[/math] [math]1[/math] [math]1[/math] [math]1[/math] [math]0[/math] [math]1[/math] [math]1[/math] [math]1[/math] [math]1[/math]

Шаг [math] 3 [/math]

Инициализировали таблицу.

Ø A B C D E F G H
Ø
A
B
C
D
E
F
G
H

Вычислили таблицу.

Ø A B C D E F G H
Ø
A
B
C
D
E
F
G
H

Шаг [math] 5 [/math]

Из таблицы видно, что классы эквивалентных состояний это [math] \{A, B\}, \{C, D\}, \{F, G\}, \{E\}, \{H\}[/math].

Шаг [math] 6 [/math]

Итого получили такой автомат:

DkaMin.png

См. также

Источники информации