Совпадение множества языков МП-автоматов и контекстно-свободных языков

Содержание

1 Построение МП-автомата по заданной КС-грамматике
- 1.1 Пример
2 Построение КС-грамматики по МП-автомату
- 2.1 Пример
3 Эквивалентность языков МП-автоматов и КС-языков
4 Следствия
5 См. также
6 Источники информации

Построение МП-автомата по заданной КС-грамматике

Теорема:

Класс контекстно-свободных языков является подмножеством класса языков, задаваемых автоматами с магазинной памятью , то есть по любой КС-грамматике можно построить МП-автомат, задающий тот же язык, что и исходная грамматика.

Доказательство:

Пусть дана КС-грамматика . Поскольку классы языков, допускаемых МП-автоматами по допускающему состоянию и по пустому стеку, совпадают, достаточно построить автомат с допуском по пустому стеку.

Построим автомат из одного состояния [math]q[/math] с входным алфавитом [math]\Sigma[/math], стековым алфавитом [math]N \cup \Sigma[/math], маркером дна [math]S[/math] и функцией перехода [math]\delta[/math], определённой ниже. Формально , где [math]\delta[/math] задаётся следующим образом:

Добавим такие переходы для каждого терминала и правила вывода

для каждого правила вывода [math]V \rightarrow \gamma \in P[/math] определим ;
для каждого терминала [math]a[/math] определим .

Покажем, что язык, допускаемый автоматом [math]A[/math], совпадает с языком грамматики [math]\Gamma[/math], то есть что :

Пусть [math]S \Rightarrow^* w[/math].

Рассмотрим левосторонний вывод . Обозначим как наибольший префикс , состоящий только из терминалов, а — остаток , то есть , причём , а начинается с нетерминала (либо пустая). С помощью индукции по докажем, что для , где — то, что остаётся после чтения , то есть . Иными словами, переходя по автомату по символам , можно оставить на стеке .

База:
Пусть [math]i = 0[/math].
В этом случае [math]\gamma_0 = S[/math], поэтому . Очевидно, .
Индукционный переход:
Пусть для [math]i \lt n[/math]. [math]\alpha_i[/math] по определению начинается с какого-то нетерминала [math]V[/math] (если [math]\alpha_i = \varepsilon[/math], то получена [math]\gamma_n[/math], а мы предположили, что [math]i \lt n[/math]), то есть [math]\alpha_i = Vq_i[/math] Поскольку мы рассматриваем левосторонний вывод, то переход включает замену нетерминала [math]V[/math] на какую-то цепочку [math]\beta[/math] по правилу [math]V \rightarrow \beta[/math]. Так как , то . В автомате [math]A[/math] по построению присутствует правило перехода , поэтому [math]\alpha_i[/math] на стеке можно заменить на [math]\beta q_i[/math]. Заметим, что [math]\beta q_i[/math] представляет собой конкатенацию нескольких терминалов из [math]w[/math] и [math]\alpha_{i + 1}[/math]. Считывая очередные символы строки [math]w[/math], будем переходить по автомату, убирая терминалы со стека, пока не встретим нетерминал. Таким образом, на стеке окажется [math]\alpha_{i+1}[/math]. Получили, что , а значит, . Индукционный переход доказан.

Заметим, что , поэтому .

Пусть .

Воспользуемся индукцией по числу переходов в автомате и докажем для любой строки и нетерминала , что если , то .

База:
Пусть в автомате один переход.
Если , то [math]x = \varepsilon[/math] и в грамматике присутствует правило [math]M \rightarrow \varepsilon[/math], по которому выводится [math]\varepsilon = x[/math].
Индукционный переход:
Предположим, что автомат [math]A[/math] совершает [math]n[/math] шагов ([math]n \gt 1[/math]). Изначально на вершине стеке находится [math]M[/math], поэтому первый переход совершается по какому-то правилу из первого пункта построения [math]\delta[/math], и на стеке оказывается последовательность из терминалов и нетерминалов [math]Y_1 Y_2 \ldots Y_k[/math]. В процессе следующих [math]n - 1[/math] переходов автомат прочитает строку [math]x[/math] и поочерёдно вытолкнет со стека [math]Y_1 Y_2 \ldots Y_k[/math]. Разобьём [math]w[/math] на подстроки [math]x_1 x_2 \ldots x_k[/math], где [math]x_1[/math] — порция входа, прочитанная до выталкивания [math]Y_1[/math] со стека, [math]x_2[/math] — следующая порция входа, прочитанная до выталкивания [math]Y_2[/math] со стека и так далее. Формально можно заключить, что , причём менее чем за [math]n[/math] шагов. Если [math]Y_i[/math] — нетерминал, то по индукционному предположению имеем, что [math]Y_i \Rightarrow^* x_i[/math]. Если же [math]Y_i[/math] — терминал, то должен совершаться только один переход, в котором проверяется совпадение [math]x_i[/math] и [math]Y_i[/math]. Значит, [math]Y_i \Rightarrow^* x_i[/math] за 0 шагов.
Таким образом, получаем, что .

Подставляя вместо и вместо , получаем, что

Пример

Поскольку доказательство теоремы конструктивно, то используя правила перехода, описанные в ней, можно преобразовать любую КС-грамматику в МП-автомат. Рассмотрим грамматику слов над алфавитом [math]\{0, 1\}[/math], в которых одинаковое количество нулей и единиц:

Множеством терминалов является [math]\Sigma = \{0, 1\}[/math], а нетерминалов — [math]N = \{S\}[/math]. Таким образом, стековый алфавит состоит из [math]0, 1, S[/math]. Функция переходов [math]\delta[/math] определена следующим образом:

(в соответствии с первым пунктом построения )

; (в соответствии со вторым пунктом построения )

Получившийся автомат:

Построение КС-грамматики по МП-автомату

Теорема:

Класс языков, задаваемых автоматами с магазинной памятью , является подмножеством класса контекстно-свободных языков , то есть по любому МП-автомату можно построить КС-грамматику, задающую тот же язык, что и допускаемый автоматом.

Доказательство:

Пусть дан МП-автомат с допуском по пустому стеку . Как отмечалось ранее, предположение о допуске по пустому стеку не умаляет общности. Построим эквивалентную ему КС-грамматику . В качестве нетерминалов будем использовать конструкции вида [math][pXq][/math] (где [math] p, q \in Q[/math], [math]X \in \Pi[/math]), которая неформально означает, что в процессе изменения состояния автомата от [math]p[/math] до [math]q[/math] символ [math]X[/math] удаляется с вершины стека, не затрагивая то, что находится ниже. Также введём стартовый нетерминал [math]S[/math]. Таким образом, .

Правила вывода [math]P[/math] построим следующим образом:

для каждого состояния [math]p \in Q[/math] добавим правило [math]S \rightarrow [q_0 z_0 p][/math];
для каждого перехода сделаем следующее: для всех упорядоченных списков состояний добавим правило , если [math]k \gt 0[/math], и [math][p X r_0] \rightarrow a[/math], если [math]k = 0[/math].

Нетерминал [math][pXq][/math] должен выводить только те строки [math]w[/math], которые переводят автомат из состояния [math](p, X)[/math] в [math](q, \varepsilon)[/math]. Формально это можно записать следующим образом: . Докажем это утверждение:

Пусть .

Докажем, что , используя индукцию по числу переходов в автомате.

База:
Пусть выполняется только один переход.
Тогда длина [math]w[/math] не больше единицы и , поэтому правило [math][pXq] \rightarrow w[/math] по построению должно присутствовать в [math]P[/math].
Индукционный переход:
Предположим, что за [math]n \gt 1[/math] шагов. Первый переход имеет вид , где [math]w = ax[/math] ([math]a[/math] — символ из [math]\Sigma[/math] или [math]\varepsilon[/math]). Значит, . По построению в грамматике должно присутствовать правило для любой последовательности состояний [math][r_1, \ldots r_k][/math]. Пусть [math]x = w_1 w_2 \ldots w_k[/math], где [math]w_i[/math] — входная цепочка, которая прочитывается до удаления [math]\gamma_i[/math] со стека, то есть найдётся такая последовательность состояний [math][r_1, \ldots r_k][/math], что , причём заканчивается всё в [math]q = r_k[/math]. Заметим, что все эти выводы содержат менее [math]n[/math] переходов, а значит, по индукционному предположению для всех [math]i[/math].
Собирая вышесказанное, получаем . Так как [math]r_k = q[/math], то [math][pXq] \Rightarrow^* w[/math], тем самым индукционный переход доказан.

Пусть [math][pXq] \Rightarrow^* w[/math].

Докажем, что , используя индукцию по числу шагов в порождении.

База:
Пусть [math][pXq] \Rightarrow^* w[/math] за один шаг.
Тогда в [math]\Gamma[/math] должно быть правило вывода [math][pXq] \rightarrow w[/math], а значит, в автомате должен быть переход и [math]w[/math] не может иметь длину больше единицы. Таким образом, .
Индукционный переход:
Предположим, что [math][pXq] \Rightarrow^* w [/math] за [math]n \gt 1[/math] шагов. По построению вывод должен иметь вид , где [math]r_k = q[/math] и . Вновь представим [math]w[/math] в виде [math]w = a w_1 w_2 \ldots w_k[/math] так, что . Так как все эти выводы содержат менее [math]n[/math] шагов, то по индукционному предположению для всех [math]i[/math] выполнено . Собирая всё вместе, получаем . Так как и [math]r_k = q[/math], то в итоге .

Таким образом, мы доказали, что . Заметим, что тогда и только тогда, когда найдётся , что . По доказанному выше это равносильно тому, что , то есть что допускает по пустому стеку. Суммируя всё вышесказанное, получаем, что построенная грамматика порождает слово тогда и только тогда, когда оно допускается автоматом .

Пример

Пусть у нас имеется МП-автомат , функция [math]\delta[/math] задана следующим образом:

Так как стековый алфавит [math]A[/math] содержит лишь один символ и одно состояние, то в построенной грамматике будет лишь 2 нетерминала:

[math]S[/math] — стартовый нетерминал.

[math][qZq][/math] — единственная тройка, которую можно собрать из состояний автомата и символов стекового алфавита.

Также грамматика имеет следующие правила вывода:

Единственной продукцией для [math]S[/math] является [math]S \rightarrow [qZq][/math]. Но если бы у автомата было [math]n[/math] состояний, то тут бы имелось и [math]n[/math] продукций.
Из того факта, что [math]\delta(q, i, Z)[/math] содержит [math](q, ZZ)[/math], получаем правило вывода . Если бы у автомата было [math]n[/math] состояний, то такой переход порождал бы [math]n^2[/math] продукций.
Из получаем правило вывода [math][qZq] \rightarrow e[/math]

Для удобства тройку [math][qZq][/math] можно заменить символом [math]A[/math], в таком случае правила вывода в грамматике будут следующие:

Упростим грамматику, заменив [math]A[/math] на [math]S[/math] (очевидно, она не поменяется), и получим в результате

Эквивалентность языков МП-автоматов и КС-языков

Теорема (об эквивалентности языков МП-автоматов и КС-языков):

Множество языков, допускаемых МП-автоматами, совпадает с множеством контекстно-свободных языков.

Доказательство:

Первая теорема гласит, что , а вторая — что . Таким образом, .

Следствия

Утверждение:

Для любого МП-автомата с допуском по пустому стеку существует эквивалентный МП-автомат с одним состоянием.

Построим КС-грамматику по данному автомату, затем по полученной грамматике построим МП-автомат, как указано выше. Заметим, что этот автомат будет иметь одно состояние, что и требовалось доказать.

Утверждение:

Для любого МП-автомата с допуском по пустому стеку существует эквивалентный МП-автомат, в любом переходе которого на стек кладётся не больше двух символов.

Построим КС-грамматику по данному автомату и приведём её к нормальной форме Хомского. Затем по полученной грамматике построим МП-автомат, как указано выше. Заметим, что в нормальной форме Хомского правые части всех правил имеют длину не больше двух, поэтому в любом переходе в полученном автомате на стек кладётся не больше двух символов.

Утверждение:

Для любого МП-автомата существует эквивалентный МП-автомат с допуском по пустому стеку без -переходов.

Построим КС-грамматику по данному автомату, затем по полученной грамматике построим МП-автомат, как указано выше. Заметим, что этот автомат не будет иметь -переходов, что и требовалось доказать.

См. также

Источники информации

Wikipedia — PDA and context-free languages
Введение в теорию автоматов, языков и вычислений / Хопкрофт Д., Мотвани Р., Ульман Д. — М.:Издательский дом «Вильямс», 2002. с. 251. — ISBN 5-8459-0261-4

Совпадение множества языков МП-автоматов и контекстно-свободных языков

Содержание

Построение МП-автомата по заданной КС-грамматике

Пример

Построение КС-грамматики по МП-автомату

Пример

Эквивалентность языков МП-автоматов и КС-языков

Следствия

См. также

Источники информации

Навигация

Персональные инструменты

Пространства имён

Варианты

Просмотры

Ещё

Поиск

Навигация

Инструменты