Анализ свойств регулярных языков (пустота, совпадение, включение, конечность, подсчёт числа слов) — различия между версиями

Версия 09:58, 21 января 2012

Для различных операций с регулярными языками полезно знать некоторые их свойства. Как правило, в доказательствах этих свойств используется факт эквивалентности автоматных и регулярных языков.

Содержание

1 Пустота регулярного языка
- 1.1 Алгоритм проверки языка на пустоту
  - 1.1.1 Псевдокод
2 Совпадение регулярных языков
3 Включение одного регулярного языка в другой
4 Конечность регулярного языка, подсчёт числа слов
- 4.1 Алгоритм нахождения числа слов в языке
  - 4.1.1 Псевдокод
5 Литература
6 Примечания

Пустота регулярного языка

Определение:

Регулярный язык называется пустым, если он не содержит ни одного слова.

Язык, содержащий хотя бы одно слово, назовём непустым.

Теорема:

Регулярный язык является непустым тогда и только тогда, когда в любом задающем его автомате существует путь из стартового состояния в какое-либо из терминальных.

Доказательство:

[math]\Rightarrow[/math]

Пусть язык содержит слово [math]w[/math]. Любой детерминированный конечный автомат [math]A[/math], задающий этот язык, должен допускать [math]w[/math]. Тогда при переходе из стартового состояния [math]A[/math] по символам [math]w[/math] получится путь, оканчивающийся в одном из терминальных состояний.

[math]\Leftarrow[/math]

Пусть в автомате существует путь из стартового состояния в одно из допускающих. Рассмотрим последовательность символов на переходах, образующих этот путь. Строка из этой последовательности допускается автоматом, а значит, принадлежит языку.

Алгоритм проверки языка на пустоту

Для определения пустоты языка по соответствующему ему автомату проще всего использовать алгоритм обхода в глубину. Язык не является пустым тогда и только тогда, когда при поиске из стартового состояния автомата окажется достижимой хотя бы одна терминальная вершина.

Псевдокод

boolean dfs(State v):
  v.seen = true
  if v.isFinal:
     return false
  for each State u in v.next:
     if !u.seen && !dfs(u):
       return false
  return true

boolean isEmpty(Automaton a):
  for each State v in a:
    v.seen = false
  return dfs(a.start)

Совпадение регулярных языков

Определение:

Два регулярных языка совпадают, если любое слово или содержится в обоих языках, или не содержится ни в одном из них.

Для проверки совпадения языков достаточно запустить алгоритм проверки эквивалентности задающих их автоматов.

Включение одного регулярного языка в другой

Определение:

Регулярный язык входит (включается) в регулярный язык , если любое слово, принадлежащее , принадлежит .

Пусть автомат [math]M_1[/math] задаёт язык [math]L_1[/math], а автомат [math]M_2[/math] — язык [math]L_1 \cap L_2[/math]. Для проверки включения [math]L_1[/math] в [math]L_2[/math] достаточно проверить эквивалентность [math]M_1[/math] и [math]M_2[/math].

Конечность регулярного языка, подсчёт числа слов

Определение:

Регулярный язык называется конечным, если принадлежащее ему множество слов конечно.

Теорема:

Детерминированный конечный автомат задаёт конечный язык тогда и только тогда, когда в не существует состояния , для которого выполняются три условия:

[math]v[/math] достижимо из стартового состояния [math]s[/math];
из [math]v[/math] достижимо какое-либо из допускающих состояний;
из [math]v[/math] по одному или более переходам достижимо [math]v[/math].

Доказательство:

Пусть такое состояние [math]v[/math] существует, а строки [math]x, y, z[/math] таковы, что , [math]t[/math] — допускающее, [math]y[/math] — непустая. Рассмотрим строки вида [math]xy^{k}z, k \in \mathbb{N}[/math]. Их бесконечное количество, и все они, как легко увидеть, допускаются автоматом. Значит, язык бесконечен.

Пусть такого состояния не существует. Тогда любой путь из стартового состояния в какое-либо из допускающих является простым. Количество слов в языке равно количеству таких путей; количество путей, в свою очередь, ограничено , где — количество состояний автомата: — количество перестановок состояний, — количество совокупностей переходов по символам между ними. Таким образом, язык конечен.

Алгоритм нахождения числа слов в языке

Доказанное утверждение позволяет свести задачу поиска числа слов в языке к поиску количества различных путей в ациклическом графе. Сначала с помощью обхода в глубину по обратным рёбрам определим полезные состояния, из которых достижимо хотя бы одно допускающее. Затем найдём любой цикл, состояния которого полезны, достижимый из старта; при нахождении констатируем бесконечность языка. Пусть язык конечен; тогда отсортируем автомат топологически. Введём функцию [math]paths(v)[/math], задающую число различных путей из [math]s[/math] в [math]v[/math]; [math]paths(s) = 1[/math]. Заметим, что если известны значения [math]paths(u)[/math] для всех [math]u[/math], из которых существует переход в [math]v[/math], то . Количеством слов в языке будет сумма [math]paths(t)[/math] для всех допускающих [math]t[/math].

Топологическую сортировку и поиск цикла можно объединить в один обход, но для наглядности они разделены.

Псевдокод

Stack topSort(Automaton a):
  for each State v in a:
    v.seen = false
  Stack sorted = new Stack
  dfsSort(a.start, sorted)
  return sorted

void dfsSort(State v, Stack sorted):
  v.seen = true
  for each State u in v.next:
    if !u.seen:
      dfsSort(u, sorted)
  sorted.push(v)

void reverseDfs(State v):
  v.canReach = true
  for each State u in v.prev:
    if !u.canReach:
      reverseDfs(u)

boolean dfs(State v): // returns true if and only if there is a cycle
  v.color = GREY
  for each State u in v.next:
    if u.color == GREY:
      return true
    if u.canReach && u.color == WHITE && dfs(u):
      return true
  v.color = BLACK
  return false

int words(Automaton a):
  for each State v in a:
    v.canReach = false
  for each State v in a:
    if v.isFinal:
      reverseDfs(v)
  for each State v in a:
    v.color = WHITE
  if dfs(a.start):
    return infinity
  Stack sorted = topSort(a)
  paths = new int[a.statesNumber]
  fill(paths, 0)
  paths[0] = 1
  while !sorted.isEmpty:
    State v = sorted.pop()
    for each State u in v.next:
      paths[u] += paths[v]
  int result = 0
  for each State v in a:
    if v.isFinal:
      result += paths[v]
  return result

Литература

Хопкрофт Д., Мотвани Р., Ульман Д. Введение в теорию автоматов, языков и вычислений, 2-е изд. / Пер. с англ. — Москва: Издательский дом «Вильямс», 2002. — с. 169-177: ISBN 5-8459-0261-4 (рус.)

Примечания

@@ Строка 64: / Строка 64: @@
 }}
-=== Алгоритм проверки на включение ===
+Пусть автомат <tex>M_1</tex> задаёт язык <tex>L_1</tex>, а автомат <tex>M_2</tex> — язык <tex>L_1 \cap L_2</tex>. Для проверки включения <tex>L_1</tex> в <tex>L_2</tex> достаточно проверить [[Эквивалентность_состояний_ДКА|эквивалентность]] <tex>M_1</tex> и <tex>M_2</tex>.
-Алгоритм проверки <tex>L_{1}</tex> на включение в <tex>L_{2}</tex> идентичен алгоритму проверки их совпадения, кроме одной особенности. Могут существовать слова из <tex>L_{2}</tex>, не входящие в <tex>L_{1}</tex>, поэтому существование пар <tex>\langle v \in L_{1}, u \in L_{2} \rangle : eq(v, u) = true, v \notin T_{1}, u \in T_{2}</tex>, где <tex>T_{i}</tex> — множества допускающих состояний, не нарушает факт вхождения <tex>L_{1}</tex> в <tex>L_{2}</tex>. Таким образом, <tex>L_{1}</tex> не входит в <tex>L_{2}</tex> тогда и только тогда, когда после окончания работы алгоритма, идентичного алгоритму проверки на совпадение, не существует такой пары <tex>\langle v, u \rangle</tex>, что <tex>eq(v, u)</tex> возвращает <tex>true</tex>, <tex>v \in T_{1}, u \notin T_{2}</tex>.
-==== Псевдокод ====
- void reverseDfs(State v):
-   v.canReach = true
-   for each State u in v.prev:
-     if !u.canReach:
-       reverseDfs(u)
- void setSink(Automaton a):
-   State sink = new State
-   for each symbol c in a.alphabet:
-     sink.next(c) = sink
-   for each State v in a:
-     if !v.canReach:
-       v = sink
- void bfs(Automaton a, Automaton b, boolean[][] eq)
-   fill(eq, false)
-   eq[a.start][b.start] = true
-   Queue q = new Queue
-   q.add((a.start, b.start))
-   while !q.isEmpty:
-     (v, u) = q.remove()
-     for each symbol c in a.alphabet: // a.alphabet == b.alphabet
-       v' = v.next(c)
-       u' = u.next(c)
-       if !eq[v'][u']:
-         eq[v'][u'] = true
-         q.add((v', u'))
- boolean belongs(Automaton a, Automaton b)
-   for each State v in a:
-     v.canReach = false
-   for each State v in a:
-     if v.isFinal:
-       reverseDfs(v)
-   setSink(a)
-   for each State v in b:
-     v.canReach = false
-   for each State v in b:
-     if v.isFinal:
-       reverseDfs(v)
-   setSink(b)
-   eq = new boolean[a.statesNumber][b.statesNumber]
-   bfs(a, b, eq)
-   for each State v in a:
-     for each State u in b:
-       if eq[v][u] && v.isFinal && !u.isFinal:
-         return false
-   return true
 == Конечность регулярного языка, подсчёт числа слов ==
@@ Строка 147: / Строка 94: @@
 Доказанное утверждение позволяет свести задачу поиска числа слов в языке к поиску количества различных путей в ациклическом графе. Сначала с помощью [[Обход в глубину, цвета вершин|обхода в глубину]] по обратным рёбрам определим '''полезные''' состояния, из которых достижимо хотя бы одно допускающее. Затем найдём любой цикл, состояния которого полезны, достижимый из старта; при нахождении констатируем бесконечность языка. Пусть язык конечен; тогда отсортируем автомат [[Использование обхода в глубину для топологической сортировки|топологически]]. Введём функцию <tex>paths(v)</tex>, задающую число различных путей из <tex>s</tex> в <tex>v</tex>; <tex>paths(s) = 1</tex>. Заметим, что если известны значения <tex>paths(u)</tex> для всех <tex>u</tex>, из которых существует переход в <tex>v</tex>, то <tex>paths(v) = \sum\limits_{u}paths(u)</tex>. Количеством слов в языке будет сумма <tex>paths(t)</tex> для всех допускающих <tex>t</tex>.
-Топологическую сортировку и поиск цикла можно объединить в один обход, но для наглядности они были разделены.
+Топологическую сортировку и поиск цикла можно объединить в один обход, но для наглядности они разделены.
 ==== Псевдокод ====

Анализ свойств регулярных языков (пустота, совпадение, включение, конечность, подсчёт числа слов) — различия между версиями

Версия 09:58, 21 января 2012

Содержание

Пустота регулярного языка

Алгоритм проверки языка на пустоту

Псевдокод

Совпадение регулярных языков

Включение одного регулярного языка в другой

Конечность регулярного языка, подсчёт числа слов

Алгоритм нахождения числа слов в языке

Псевдокод

Литература

Примечания

Навигация

Персональные инструменты

Пространства имён

Варианты

Просмотры

Ещё

Поиск

Навигация

Инструменты