Замкнутость регулярных языков относительно различных операций
Теорема
Теорема: |
Пусть регулярные языки над одним алфавитом . Тогда следующие языки также являются регулярными:
—
|
Доказательство: |
Как известно, классы регулярных и автоматных языков совпадают. Пусть языки и распознаются автоматами и соответственно.
|
Примеры доказательств
Гомоморфизм цепочек
Утверждение: |
гомоморфизм цепочек. Тогда — регулярный. — регулярный , — |
Рассмотрим ДКА, распознающий . Заменим в нем все переходы по символам на переходы по их образам при гомоморфизме. Полученный автомат (с переходами по строкам) распознает в точности и имеет эквивалентный ДКА. |
Утверждение: |
гомоморфизм цепочек. Тогда — регулярный. — регулярный , — |
Рассмотрим ДКА, распознающий . Отследим для каждого состояния и символа строку : и положим в новом автомате (на том же множестве состояний). Автомат с построенной таким образом функцией переходов, очевидно, распознает слова языка и только их. |
Язык half(L)
Определение: |
Определим | как множество первых половин цепочек языка , то есть множество .
Например, если
, то . Заметим, что цепочки нечетной длины не влияют на .Утверждение: |
Пусть регулярный язык. Тогда язык также регулярен. — |
Так как — регулярный язык, то существует ДКА , допускающий его. Рассмотрим строку . Для того, чтобы проверить, что , нам надо убедиться, что существует строка такой же длины, что и , которая, будучи сконкатенированной с , даст строку из , то есть если на вход автомату подать , то в конце обработки мы окажемся в терминальном состоянии. Предположим, что автомат, закончив обработку , находится в состоянии , то есть . Мы должны проверить, что существует строка которая ведет из состояния до какого-нибудь терминального состояния , то есть .Предположим, что мы прошли вершин автомата, то есть . Обозначим за множество всех состояний, с которых можно попасть в терминальные за шагов. Тогда . Если мы сможем отслеживать и , то сможем определять, верно ли, что . Заметим, что . Очевидно мы можем построить зная и : — множество состояний, из которых есть переход в какое-либо состояние из (по единственному символу). Теперь надо найти способ отслеживать и обновлять .Построим ДКА Теперь по индукции не сложно доказать, что , который будет хранить эту информацию в своих состояниях. Определим , то есть каждое состояние — это пара из одиночного состояния из и множества состояний из . Функцию перехода автомата определим так, чтобы если по какой-то строке длины в автомате мы перешли в состояние , то по этой же строке в автомате мы перейдем в состояние , где — множество состояний из , определенное выше. Вспомним приведенную выше функцию . С ее помощью мы можем определить функцию перехода следующим образом: . Начальное состояние . Множество терминальных состояний — . , где . По определению множества терминальных вершин, автомат допускает строку тогда и только тогда, когда . Следовательно, автомат допускает язык .Таким образом, мы построили ДКА, который допускает язык . Следовательно, данный язык является регулярным. |
Язык cycle(L)
Определение: |
Определим | как множество цепочку можно представить в виде , где .
Например, если
, то .Утверждение: |
Пусть регулярный язык. Тогда язык также регулярен. — |
Так как — регулярный язык, то существует допускающий его ДКА . Построим из недетерминированный автомат с следующим образом: рассмотрим состояние -переходами , из которого есть переходы в другие состояния (то есть начиная с можно построить непустое слово, заканчивающееся в терминальной вершине). Тогда если какое-то слово проходит через это состояние, оно может быть зациклено таким образом, что его суффикс, начинающийся с , станет префиксом нового слова, а префикс, заканчивающийся в — суффиксом. Разделим автомат на две части и такие, что будет содержать все вершины, из которых достижима , а — все вершины, которые достижимы из (см. рис. 1). Заметим, что каждая вершина может содержаться в обеих частях одновременно, такое может случиться, если автомат содержит циклы. Теперь перестроим автомат так, что он будет принимать слова "зацикленные" вокруг , то есть начинающиеся с и после достижения терминальной вершины продолжающиеся с (см. рис. 2). Для этого стартовой вершиной сделаем и построим от нее часть . Теперь добавим состояние и соединим с ним все терминальные состояния из с помощью -переходов. Далее построим от часть . Добавим вершину , эквивалентную , и сделаем ее терминальной. Данный автомат принимает слова, зацикленные вокруг выбранной вершины . Мы хотим, чтобы автомат принимал слова, зацикленные вокруг любой такой . Для этого создадим новую стартовую вершину и свяжем ее -переходами со всеми перестроенными автоматами (зацикленными вокруг всех подходящих ), в том числе и с изначальным автоматом. Построенный автомат допускает язык , следовательно, данный язык является регулярным. |
Для лучшего понимания алгоритма перестроения автомата рассмотрим пример.
На рис. 3 представлен автомат, допускающий язык
. На рис. 4 показано, как этот автомат был перестроен. Были добавлены части, зацикленные относительно вершин и . Появилась новая стартовая вершина , которая связана -переходами с изначальным автоматом и его измененными версиями. Данный автомат распознает язык : первые три слова распознает первая часть, которая совпадает с изначальным автоматом; следующие три — вторая, перестроенная относительно вершины ; последнее слово распознает третья часть, зацикленная относительно вершины .
Язык alt(L, M)
Определение: |
Пусть | и . Определим .
Теперь распространим это определение:
Определение: |
Пусть | и — два языка над одним алфавитом . Тогда .
Например, если
и , то .Утверждение: |
Пусть регулярные языки. Тогда также является регулярным. и — |
Так как и — регулярные языки, то существуют ДКА , распознающий язык , и , распознающий язык . Построим автомат , который будет распознавать язык . Идея следующая: каждое состояние этого автомата будем описывать тремя значениями , где , и . Нам нужно организовать чередование переходов по состояниям автоматов, то есть если мы на определенном шаге перешли от одного состояния автомата до другого, то на следующем мы обязаны совершить переход по состояниям автомата . Для этого нам нужно обновлять состояние одного автомата и при этом сохранять состояние другого для следующего перехода. Тут мы будем использовать третье значение: если , то будет двигаться по состояниям первого автомата, то есть значение при переходе в новое состояние автомата поменяется, останется неизменной, станет , если , то, соответственно, все наоборот. То есть у нас будут две функции перехода, выбирать нужную будем в зависимости от четности третьего параметра. Важно, что на каждом шаге мы инвертируем значение , что гарантирует чередование. Определим автомат следующим образом:
|
Чтобы более наглядно показать, как строится автомат
, разберем пример. Пусть и (см. рис. 5). Все состояния нового автомата представлены на рис. 6. Стартовая вершина , множество терминальных вершин — . Мы видим, что построенные по функции переходы на каждом шаге меняют состояние одного из автоматов, а именно того, по которому происходит переход, сохраняя состояние другого для следующего шага. Таким образом, каждый следующий символ получен из автомата, отличного от того, что был использован на предыдущем шаге. Декартово произведение состояний гарантирует, что мы рассмотрим все состояния и переходы изначальных автоматов. Для данного примера мы получаем, что .
См. также
Источники
- Хопкрофт Д., Мотвани Р., Ульман Д. "Введение в теорию автоматов, языков и вычислений", 2-е изд. : Пер. с англ. — М.:Издательский дом «Вильямс», 2002. — С. 149 — ISBN 5-8459-0261-4