Совпадение множества языков МП-автоматов и контекстно-свободных языков

Содержание

1 Построение МП-автомата по заданной КС-грамматике
- 1.1 Пример
2 Построение КС-грамматики по МП-автомату
- 2.1 Пример
3 Эквивалентность языков МП-автоматов и КС-языков
4 Замечания
5 Литература

Построение МП-автомата по заданной КС-грамматике

Теорема:

Класс контекстно-свободных языков () является подмножеством класса языков, задаваемых автоматами с магазинной памятью (), то есть по любой КС-грамматике можно построить МП-автомат, задающий тот же язык, что и исходная грамматика.

Доказательство:

Пусть дана КС-грамматика . Поскольку классы языков, допускаемых МП-автоматами по допускающему состоянию и по пустому стеку, совпадают, достаточно построить автомат с допуском по пустому стеку.

Построим автомат из одного состояния [math]q[/math] с входным алфавитом [math]\Sigma[/math], стековым алфавитом [math]N \cup \Sigma[/math], маркером дна [math]S[/math] и функцией перехода [math]\delta[/math], определённой ниже. Формально , где [math]\delta[/math] задаётся следующим образом:

1) для каждого правила вывода [math]V \rightarrow \gamma \in P[/math] определим ;

2) для каждого терминала [math]a[/math] определим .

Покажем, что язык, допускаемый автоматом [math]A[/math], совпадает с языком грамматики [math]\Gamma[/math], то есть что :

Пусть [math]S \Rightarrow^* w[/math]. Рассмотрим левосторонний вывод [math]S = \gamma_0 \Rightarrow \gamma_1 \Rightarrow ... \Rightarrow \gamma_n=w[/math]. Обозначим как [math]v_i[/math] наибольший префикс [math]\gamma_i[/math], состоящий только из терминалов, а [math]\alpha_i[/math] — остаток [math]\gamma_i[/math], то есть [math]\gamma_i = v_i\alpha_i[/math], причём [math]v_i \in \Sigma^*[/math], а [math]\alpha_i[/math] начинается с нетерминала (либо пустая). С помощью индукции по [math]i[/math] докажем, что [math](q, w, S) \vdash^* (q, x_i, \alpha_i)[/math] для [math]i \leq n[/math], где [math]x_i[/math] — то, что остаётся после чтения [math]v_i[/math], то есть [math]v_ix_i = w[/math]. Иными словами, переходя по автомату по символам [math]v_i[/math], можно оставить на стеке [math]\alpha_i[/math].
- База ([math]i = 0[/math]):
  В этом случае [math]\gamma_0 = S[/math], поэтому . Очевидно, .
- Индукционный переход:
  Пусть для [math]i \lt n[/math]. [math]\alpha_i[/math] по определению начинается с какого-то нетерминала [math]V[/math] (если [math]\alpha_i = \varepsilon[/math], то получена [math]\gamma_n[/math], а мы предположили, что [math]i \lt n[/math]), то есть [math]\alpha_i = Vq_i[/math] Поскольку мы рассматриваем левосторонний вывод, то переход включает замену нетерминала [math]V[/math] на какую-то цепочку [math]\beta[/math] по правилу [math]V \rightarrow \beta[/math]. Так как , то . В автомате [math]A[/math] по построению присутствует правило перехода , поэтому [math]\alpha_i[/math] на стеке можно заменить на [math]\beta q_i[/math]. Заметим, что [math]\beta q_i[/math] представляет собой конкатенацию нескольких терминалов из [math]w[/math] и [math]\alpha_{i + 1}[/math]. Считывая очередные символы строки [math]w[/math], будем переходить по автомату, убирая терминалы со стека, пока не встретим нетерминал. Таким образом, на стеке окажется [math]\alpha_{i+1}[/math]. Получили, что , а значит, . Индукционный переход доказан.

Заметим, что , поэтому .

Пусть [math](q, w, S) \vdash^* (q, \varepsilon, \varepsilon)[/math]. Воспользуемся индукцией по числу переходов в автомате и докажем для любой строки [math]x[/math] и маркера дна [math]M \in N[/math], что если [math](q, x, M) \vdash^* (q, \varepsilon, \varepsilon)[/math], то [math]M \Rightarrow^* x[/math].
- База (1 переход):
  Если , то [math]x = \varepsilon[/math] и в грамматике присутствует правило [math]M \rightarrow \varepsilon[/math], по которому выводится [math]\varepsilon = x[/math].
- Индукционный переход:
  Предположим, что автомат [math]A[/math] совершает [math]n[/math] шагов ([math]n \gt 1[/math]). Изначально на вершине стеке находится [math]M[/math], поэтому первый переход совершается по одному из правил первого типа, и на стеке оказывается последовательность из терминалов и нетерминалов [math]Y_1 Y_2 \ldots Y_k[/math]. В процессе следующих [math]n - 1[/math] переходов автомат прочитает строку [math]x[/math] и поочерёдно вытолкнет со стека [math]Y_1 Y_2 \ldots Y_k[/math]. Разобьём [math]w[/math] на подстроки [math]x_1 x_2 \ldots x_k[/math], где [math]x_1[/math] — порция входа, прочитанная до выталкивания [math]Y_1[/math] со стека, [math]x_2[/math] — следующая порция входа, прочитанная до выталкивания [math]Y_2[/math] со стека и так далее. Формально можно заключить, что , причём менее чем за [math]n[/math] шагов. Если [math]Y_i[/math] — нетерминал, то по индукционному предположению имеем, что [math]Y_i \Rightarrow^* x_i[/math]. Если же [math]Y_i[/math] — терминал, то должен совершаться только один переход, в котором проверяется совпадение [math]x_i[/math] и [math]Y_i[/math]. Значит, [math]Y_i \Rightarrow^* x_i[/math] за 0 шагов.
  Таким образом, получаем, что .

Подставляя вместо и вместо , получаем, что

Пример

Преобразуем грамматику выражений в МП-автомат. Пусть дана грамматика:

,
.

Множеством входных символов является [math] \{a,b,1,0,(,),+,*\} [/math]. Эти символы вместе с переменными [math] I,E [/math] образуют магазинный алфавит. Функция переходов определена следующим образом:

a)

b)

c) ; ; ; .

Пункты a,b образованы по первому правилу построения функции переходов, а пункт c по второму.

Построение КС-грамматики по МП-автомату

Теорема:

Класс языков, задаваемых автоматами с магазинной памятью (), является подмножеством класса контекстно-свободных языков (), то есть по любому МП-автомату можно построить КС-грамматику, задающую тот же язык, что и допускаемый автоматом.

Доказательство:

Пусть дан МП-автомат с допуском по пустому стеку . Как отмечалось ранее, предположение о допуске по пустому стеку не умаляет общности. Построим эквивалентную ему КС-грамматику . В качестве нетерминалов будем использовать конструкции вида [math][pXq][/math] (где [math] p, q \in Q[/math], [math]X \in \Pi[/math]), которая неформально означает, что в процессе изменения состояния автомата от [math]p[/math] до [math]q[/math] символ [math]X[/math] окончательно удаляется из стека. Также введём стартовый нетерминал [math]S[/math]. Таким образом, .

Правила вывода [math]P[/math] построим следующим образом:

1) для каждого состояния [math]p \in Q[/math] добавим правило [math]S \rightarrow [q_0 z_0 p][/math];

2) для каждого перехода сделаем следующее: для всех упорядоченных списков состояний добавим правило , если [math]k \gt 0[/math], и [math][p X r_0] \rightarrow a[/math], если [math]k = 0[/math].

Нетерминал [math][pXq][/math], должен выводить только те строки [math]w[/math], которые переводят автомат из состояния [math](p, X)[/math] в [math](q, \varepsilon)[/math]. Формально это можно записать следующим образом: . Докажем это утверждение:

Пусть [math](p, w, X) \vdash^* (q, \varepsilon, \varepsilon)[/math]. Докажем, что [math][pXq] \Rightarrow^* w[/math], используя индукцию по числу переходов в автомате.
- База (1 переход):
  Раз выполняется только один переход, то длина [math]w[/math] не больше единицы и , поэтому правило [math][pXq] \rightarrow w[/math] по построению должно присутствовать в [math]P[/math].
- Индукционный переход:
  Предположим, что за [math]n \gt 1[/math] шагов. Первый переход имеет вид , где [math]w = ax[/math] ([math]a[/math] — символ из [math]\Sigma[/math] или [math]\varepsilon[/math]). Значит, . По построению в грамматике должно присутствовать правило для любой последовательности состояний [math]\{r_i\}[/math]. Пусть [math]x = w_1 w_2 \ldots w_k[/math], где [math]w_i[/math] — входная цепочка, которая прочитывается до удаления [math]\gamma_i[/math] со стека, то есть найдётся такая последовательность состояний [math]\{r_i\}[/math], что , причём заканчивается всё в [math]q = r_k[/math]. Заметим, что все эти выводы содержат менее [math]n[/math] переходов, а значит, по индукционному предположению для всех [math]i[/math].
  Собирая вышесказанное, получаем . Так как [math]r_k = q[/math], то [math][pXq] \Rightarrow^* w[/math], тем самым индукционный переход доказан.
Пусть [math][pXq] \Rightarrow^* w[/math]. Докажем, что [math](p, w, X) \vdash^* (q, \varepsilon, \varepsilon)[/math], используя индукцию по числу шагов в порождении.
- База (1 шаг):
  Если [math][pXq] \Rightarrow^* w[/math] за один шаг, то в [math]\Gamma[/math] должно быть правило вывода [math][pXq] \rightarrow w[/math], а значит, в автомате должен быть переход и [math]w[/math] не может иметь длину больше единицы. Таким образом, .
- Индукционный переход:
  Предположим, что [math][pXq] \Rightarrow^* w [/math] за [math]n \gt 1[/math] шагов. По построению вывод должен иметь вид , где [math]r_k = q[/math] и . Вновь представим [math]w[/math] в виде [math]w = a w_1 w_2 \ldots w_k[/math] так, что . Так как все эти выводы содержат менее [math]n[/math] шагов, то по индукционному предположению для всех [math]i[/math] выполнено . Собирая всё вместе, получаем . Так как и [math]r_k = q[/math], то в итоге .

Таким образом, мы доказали, что . Заметим, что тогда и только тогда, когда найдётся , что . По доказаному выше это равносильно тому, что , то есть что допускает по пустому стеку. Суммируя всё вышесказанное, получаем, что построенная грамматика порождает слово тогда и только тогда, когда оно допускается автоматом .

Пример

Пусть у нас имеется , функция [math] \delta [/math] задана следующим образом:

[math] \delta(q,i,Z)=\{(q,ZZ)\}[/math],
.

Так как [math] P [/math] имеет один магазинный символ и одно состояние, то грамматика строится просто. У нас будет всего две переменные:

a) [math] S [/math] — стартовый символ.
b) [math] [qZq] [/math] — единственная тройка, которую можно собрать из наших состояний и магазинных символов.

Также грамматика имеет следующие продукции:

1. Единственной продукцией для [math] S [/math] является [math] S \rightarrow [qZq] [/math]. Но если бы у автомата было [math] n [/math] состояний, то тут бы имелось и [math] n [/math] продукций.
2. Из того факта, что [math] \delta(q,i,Z) [/math] содержит [math] (q,ZZ)[/math], получаем продукцию . Если бы у автомата было n состояний, то такое правило порождало бы [math] n^2 [/math] продукций.
3. Из получаем продукцию

Для удобства тройку [math] [qZq] [/math] можно заменить символом [math] A [/math], в таком случае грамматика состоит из следующих продукций:

[math] S \rightarrow A[/math]

В действительности можно заметить, что [math]S[/math] и [math]A[/math] порождают одни и те же цепочки, поэтому их можно обозначить одинаково, итого:

Эквивалентность языков МП-автоматов и КС-языков

Теорема (об эквивалентности языков МП-автоматов и КС-языков):

Множество языков, допускаемых МП-автоматами, совпадает с множеством контекстно-свободных языков.

Доказательство:

Первая теорема гласит, что , а вторая — что . Таким образом, .

Замечания

Утверждение:

Для любого МП-автомата с допуском по пустому стеку существует эквивалентный МП-автомат с одним состоянием.

Построим КС-грамматику по данному автомату, затем по полученной грамматике построим МП-автомат, как указано выше. Заметим, что этот автомат будет иметь одно состояние, что и требовалось доказать.

Утверждение:

Для любого МП-автомата с допуском по пустому стеку существует эквивалентный МП-автомат, в любом переходе которого на стек кладётся не больше двух символов.

Построим КС-грамматику по данному автомату и приведём её к нормальной форме Хомского. Затем по полученной грамматике построим МП-автомат, как указано выше. Заметим, что в нормальной форме Хомского правые части всех правил имеют длину не больше двух, поэтому в любом переходе в полученном автомате на стек кладётся не больше двух символов.

Утверждение:

Для любого МП-автомата существует эквивалентный МП-автомат с допуском по пустому стеку без -переходов.

Построим КС-грамматику по данному автомату, затем по полученной грамматике построим МП-автомат, как указано выше. Заметим, что этот автомат не будет иметь -переходов, что и требовалось доказать.

Литература

Хопкрофт Д., Мотвани Р., Ульман Д. Введение в теорию автоматов, языков и вычислений, 2-е изд. : Пер. с англ. — М.:Издательский дом «Вильямс», 2002. — С. 251.

Совпадение множества языков МП-автоматов и контекстно-свободных языков

Содержание

Построение МП-автомата по заданной КС-грамматике

Пример

Построение КС-грамматики по МП-автомату

Пример

Эквивалентность языков МП-автоматов и КС-языков

Замечания

Литература

Навигация

Персональные инструменты

Пространства имён

Варианты

Просмотры

Ещё

Поиск

Навигация

Инструменты