Анализ свойств регулярных языков (пустота, совпадение, включение, конечность, подсчёт числа слов) — различия между версиями

Версия 18:53, 15 октября 2011

Содержание

1 Пустота
- 1.1 Алгоритм проверки языка на пустоту
2 Совпадение
- 2.1 Алгоритм проверки языков на эквивалентность

Пустота

Пустота регулярного языка — свойство языка не содержать ни одного слова. Язык, содержащий хотя бы одно слово, назовём непустым.

Утверждение:

Регулярный язык является непустым тогда и только тогда, когда в любом соответствующем ему автомате существует путь из стартового состояния в какое-либо из терминальных.

Пусть язык содержит слово [math]w[/math]. Любой автомат [math]A[/math], соответствующий этому языку, должен допускать [math]w[/math]. Тогда при переходе из стартового состояния [math]A[/math] по символам [math]w[/math] получится путь, оканчивающийся в одной из терминальных вершин.

Пусть в автомате существует путь из стартового состояния в одно из допускающих. Рассмотрим последовательность символов на рёбрах, образующих этот путь. Строка из этой последовательности допускается автоматом, а значит, принадлежит языку.

Алгоритм проверки языка на пустоту

Для определения пустоты языка по соответствующему ему автомату проще всего использовать алгоритм обхода в глубину. Язык не является пустым тогда и только тогда, когда при поиске из стартового состояния автомата окажется достижимой хотя бы одна терминальная вершина.

boolean dfs(State v) {
  v.seen = true;
  if (v.isFinal) {
     return false;
  }   
  for (State u : v.next) {
     if (!u.seen && !dfs(u)) {
       return false;
     }
  }
  return true;
}

boolean isEmpty(Automaton a) {
  for (State v : a) {
    v.seen = false;
  }
  return dfs(a.start);
}

Совпадение

Совпадение двух регулярных языков — свойство, при выполнении которого любое слово, принадлежащее одному из языков, принадлежит второму.

Пусть [math]A_{1}[/math] и [math]A_{2}[/math] - детерминированные конечные автоматы, соответствующие языкам [math]L_{1}[/math] и [math]L_{2}[/math] над одним алфавитом [math]\Sigma[/math], соответственно. Совпадение языков на языке конечных автоматов (эквивалентность) означает, что любое слово, допустимое одним автоматом, допускается и другим. Назовём состояния [math]p_{1} \in A_{1}[/math] и [math]p_{2} \in A_{2}[/math] идентичными, если существует строка [math]w[/math] из символов [math]\Sigma[/math], для которой выполняется

,

где [math]s_{1}[/math], [math]s_{2}[/math] - стартовые состояния.

На основе заданного отношения разобьём состояния автоматов на классы эквивалентности: состояния [math]p[/math] и [math]q[/math] принадлежат одному классу тогда и только тогда, когда существует последовательность состояний [math]p_{0}...p_{k}[/math], где [math]p = p_{0}[/math], [math]q = p_{k}[/math] и [math]\forall i = 1..k[/math] [math]p_{i - 1}[/math] идентично [math]p_{i}[/math]. Все состояния, из которых не достигаются допускающие, не влияют на множество слов, допускаемых автоматами, поэтому далее они рассматриваться не будут.

Теорема:

Автоматы и эквивалентны тогда и только тогда, когда в любом классе содержатся или только допускающие, или только недопускающие состояния.

Доказательство:

Пусть в каком-либо классе содержатся допускающее состояние [math]t[/math] и недопускающее [math]u[/math]. По построению классов эквивалентности, существует последовательность [math]p_{0}...p_{k}[/math], где [math]t = p_{0}[/math], [math]u = p_{k}[/math] и [math]\forall i = 1..k[/math] [math]p_{i - 1}[/math] идентично [math]p_{i}[/math]. Тогда найдётся пара [math]p_{j}[/math], [math]p_{j+1}[/math]: [math]p_{j}[/math] является допускающим, а [math]p_{j+1}[/math] - нет. Для определённости, пусть [math]p_{j}[/math] принадлежит первому автомату, а [math]p_{j+1}[/math] - второму. Так как эти состояния идентичны, [math]\exists w[/math]:

,

.

Таким образом, слово [math]w[/math] допускается первым автоматом и не допускается вторым, значит, автоматы неэквивалентны.

Пусть в любом классе содержатся только допускающие или только недопускающие состояния. Рассмотрим любую строку [math]w[/math] и такие состояния [math]u_{1}[/math] и [math]u_{2}[/math], что

,

.

Состояния и идентичны, следовательно, принадлежат одному классу эквивалентности. Таким образом, любая строка оканчивается либо допускающими состояниями в обоих автоматах, либо в обоих не допускается, значит, автоматы эквивалентны.

Утверждение:

Если состояния и принадлежат одному классу эквивалентности, то для любого символа из алфавита и также принадлежат одному классу.

Рассмотрим последовательность , где , и идентично по строке . Тогда для последовательности , где , будет верно: идентично по строке . Таким образом, и также принадлежат одному классу.

По индукции, утверждение верно и для большего числа переходов.

Алгоритм проверки языков на эквивалентность

Первым шагом алгоритма является избавление автоматов от состояний, из которых недостижимы допускающие. Проще всего это реализовать обходом в глубину или в ширину из допускающих состояний по обратным рёбрам. Все непосещённые состояния затем удаляются из автоматов.

Второй шаг - обход в ширину, объединяющий классы эквивалентности. Изначально каждое состояние принадлежит отдельному классу, кроме двух стартовых, объединённых в один класс. Для определения класса по состоянию используется система непересекающихся множеств. Очередь обхода в ширину хранит пары состояний [math]p_{1} \in A_{1}[/math], [math]p_{2} \in A_{2}[/math], для которых существует строка [math]w[/math] (для [math]s_{1}[/math] и [math]s_{2}[/math] равная [math]\epsilon[/math]):

,

.

Для пары состояний изучаются переходы из них по всем символам алфавита. Пусть [math]\delta (p_{1}, c) = q_{1}[/math], [math]\delta (p_{2}, c) = q_{2}[/math]. Если [math]q_{1}[/math] и [math]q_{2}[/math] принадлежат разным классам, их классы объединяются, а пара добавляется в очередь.

@@ Строка 55: / Строка 55: @@
 На основе заданного отношения разобьём состояния автоматов на классы эквивалентности: состояния <tex>p</tex> и <tex>q</tex> принадлежат одному классу тогда и только тогда, когда существует последовательность состояний <tex>p_{0}...p_{k}</tex>, где <tex>p = p_{0}</tex>, <tex>q = p_{k}</tex> и <tex>\forall i = 1..k</tex> <tex>p_{i - 1}</tex> идентично <tex>p_{i}</tex>. Все состояния, из которых не достигаются допускающие, не влияют на множество слов, допускаемых автоматами, поэтому далее они рассматриваться не будут.
-{{Утверждение
+{{Теорема
 |id=
 regEqClasses
@@ Строка 102: / Строка 102: @@
 <tex>\langle s_{2}, w \rangle \rightarrow \langle p_{2}, \epsilon \rangle</tex>.
-Для пары состояний изучаются переходы из них по всем символам алфавита. Пусть <tex>\delta (p_{1}, c) = q_{1}</tex>, <tex>\delta (p_{2}, c) = q_{2}</tex>.
+Для пары состояний изучаются переходы из них по всем символам алфавита. Пусть <tex>\delta (p_{1}, c) = q_{1}</tex>, <tex>\delta (p_{2}, c) = q_{2}</tex>. Если <tex>q_{1}</tex> и <tex>q_{2}</tex> принадлежат разным классам, их классы объединяются, а пара <tex>\langle q_{1}, q_{2} \rangle</tex> добавляется в очередь.

Анализ свойств регулярных языков (пустота, совпадение, включение, конечность, подсчёт числа слов) — различия между версиями

Версия 18:53, 15 октября 2011

Содержание

Пустота

Алгоритм проверки языка на пустоту

Совпадение

Алгоритм проверки языков на эквивалентность

Навигация

Персональные инструменты

Пространства имён

Варианты

Просмотры

Ещё

Поиск

Навигация

Инструменты