Замкнутость КС-языков относительно различных операций — различия между версиями

Версия 19:40, 6 ноября 2016

В отличие от регулярных языков, КС-языки не замкнуты относительно всех теоретико-множественных операций. К примеру, дополнение и пересечение КС-языков не обязательно являются КС-языками.

Здесь и далее считаем, что [math] L_1 [/math] и [math] L_2 [/math] — КС-языки.

Содержание

1 Операции с КС-языками
2 Операции над КС-языком и регулярным языком
- 2.1 Пересечение
- 2.2 Разность
3 См. также
4 Источники информации

Операции с КС-языками

Объединение

Утверждение:

является КС-языком.

Построим КС-грамматику для языка [math] L_1 \cup L_2 [/math]. Для этого рассмотрим соответствующие КС-грамматики для языков [math] L_1 [/math] и [math] L_2 [/math]. Пусть стартовые символы в них имеют имена [math] S [/math] и [math] T [/math] соответственно. Тогда стартовый символ для [math] L_1 \cup L_2 [/math] обозначим за [math] S' [/math] и добавим правило [math] S' \to S\,|\,T [/math].

Покажем, что .

[math]\Rightarrow[/math]

Поскольку и есть правило , то, по определению получаем, что . Аналогично и для .

[math]\Leftarrow [/math]

Пусть . Поскольку — единственные правила, в которых нетерминал присутствует в правой части, то это означает, что либо , либо .

Конкатенация

Утверждение:

— КС-язык.

Аналогично предыдущему случаю построим КС-грамматику для языка . Для этого добавим правило , где и — стартовые символы языков и соответственно.

Замыкание Клини

Утверждение:

— КС-язык.

Если — стартовый символ КС-грамматики для языка , то добавим в КС-грамматику для языка новый стартовый символ и правила .

Прямой и обратный гомоморфизмы

Утверждение:

КС-языки замкнуты относительно прямого гомоморфизма.

Построим КС-грамматику, в которой каждый символ заменим на .

Утверждение:

КС-языки замкнуты относительно обратного гомоморфизма.

Для доказательства замкнутости обратного гомоморфизма будем делать аналогично доказательству для регулярных языков. Построим МП-автомат для на основе МП-автомата для языка [math] L [/math] (назовем его [math] M [/math]). Новый автомат [math] M' [/math] будет действовать следующим образом:

Если входное слово закончилось, допускаем или не допускаем его по допускающему состоянию.
Считываем символ [math] c [/math].
Сохраняем [math] h(c) [/math] в буфере (входная лента для автомата [math] M [/math]).
Запускаем [math] M [/math] на слове, находящемся в буфере.
После того, как [math] M [/math] обработал весь буфер, переходим к пункту 1.

Если рассмотреть более формально, пусть , тогда .

, где [math] x [/math] — суффикс (не обязательно собственный) некоторой цепочки [math] h(c) [/math] для символа [math] c \in \Sigma [/math]. Таким образом, первый компонент состояния [math] M' [/math] является состоянием [math] M [/math], а второй — компонентом буфера.
[math] \delta' [/math] определяется следующими правилами:
- . Когда буфер пуст, [math] M' [/math] может прочитать свой следующий входной символ [math] c [/math] и поместить [math] h(c) [/math] в буфер.
- Если , то . Таким образом, [math] M' [/math] всегда имеет возможность имитации перехода [math] M [/math], используя голову буфера. Если [math] b \in T [/math], то буфер должен быть непустым, но если [math] b = \varepsilon [/math], то буфер может быть пустым.
Начальным состоянием [math] M' [/math] является [math] (s, \varepsilon) [/math], т.е. [math] M' [/math] стартует в начальном состоянии [math] M [/math] с пустым буфером.
Допускающими состояниями [math] M' [/math] являются состояния [math] (q, \varepsilon)[/math], где [math] q \in T [/math].

Таким образом получаем, что , то есть автомат допускает те и только те слова, которые принадлежат языку .

Разворот

Утверждение:

контекстно-свободна.

Для того, чтобы построить [math] L^{R} [/math], необходимо развернуть все правые части правил грамматики для [math] L [/math].

Покажем, что . Докажем ([math]\Rightarrow[/math]) индукцией по длине порождения в грамматике [math]L[/math]. В обратную сторону ([math]\Leftarrow[/math]) рассуждения аналогичны.

База. .

В грамматике [math]L[/math] существует правило [math]A \rightarrow w[/math] и, так как мы развернули все правые части правил, то .

Предположение индукции. Пусть менее чем за [math]n[/math] шагов, тогда .

Переход. Пусть в порождении шагов, . Тогда оно имеет вид , где . Цепочку можно разбить на , где . Так как каждое из порождений содержит менее шагов, к ним можно применить предположение индукции и заключить, что . Так как , то , откуда следует, что .

Пример разворота:

Пусть задана КС-грамматика [math]G[/math] для языка [math]L = a^i b^j c^i[/math] со следующими правилами:

[math] B \to aBc \mid A [/math]

В таком случае КС-грамматика [math]G^R[/math] для языка [math]L^R = c^i b^j a^i [/math] выглядит следующим образом:

[math] B \to cBa \mid A [/math]

Дополнение, пересечение и разность

В отличие от регулярных языков, дополнение до КС-языка, пересечение КС-языков и разность КС-языков может не быть КС-языком.

Утверждение:

Язык тандемных повторов не является КС-языком.

Это доказывается с помощью леммы о разрастании.

Утверждение:

Дополнение к языку тандемных повторов является КС-языком.

Для упрощения рассмотрим этот язык на бинарном алфавите [math]\Sigma = \{a,b\}[/math]. Для [math] \overline{L} [/math] можно составить следующую КС-грамматику [math]G[/math]:

[math]S \to AB \mid BA[/math]
[math]S \to A \mid B[/math]
[math]S \to \varepsilon [/math]

Докажем этот факт.

Сначала заметим, что нетерминал [math]A[/math] порождает слова нечётной длины с центральным символом [math]a[/math]. В свою очередь нетерминал [math]B[/math] порождает слова нечётной длины с центральным символом [math]b[/math]. Таким образом, правило [math]S \to A \mid B[/math] порождает все возможные слова нечётной длины.

Докажем, что все слова, порождённые [math]G[/math], есть в [math]\overline{L}[/math].

[math]\varepsilon[/math], а также все слова нечётной длины не являются тандемными повторами.

Рассмотрим произвольное слово чётной длины, сгенерированное при помощи правила [math]S \to AB [/math]. Пусть его часть, соответствующая [math]A[/math], имеет длину [math]2N+1[/math], а часть, соответствующая [math]B[/math], — длину [math]2M+1[/math].

Таким образом, мы получили слово длины [math]2N+2M+2[/math]. Если оно является тандемным повтором, то символ, стоящий на позиции [math]N+1[/math], должен быть равен символу на позиции [math]2N+M+2[/math]. Но по построению это не так.

Для правила [math]S \to BA [/math] доказательство аналогично.

Докажем, что все слова из [math]\overline{L}[/math] порождаются [math]G[/math].

С помощью [math]G[/math] можно вывести [math] \varepsilon[/math], а также любое слово нечётной длины.

Далее рассмотрим произвольное слово чётной длины из [math]\overline{L}[/math]. Докажем, что его можно разбить на два слова нечётной длины, имеющие различные центральные символы. Предположим, что это не так, то есть такого разбиения нет.

Пусть это слово имеет длину [math]2N[/math]. Тогда рассмотрим все его префиксы нечётной длины. Их центры находятся на позициях [math]1, 2, \ldots ,N[/math], а центры соответствующих им суффиксов — на позициях [math]N+1, N+2, \ldots ,2N[/math]. Поскольку искомого разбиения не существует, то получается, что символ на позиции [math]1[/math] равен символу на позиции [math]N+1[/math], символ на позиции [math]2[/math] равен символу на позиции [math]N+2[/math], и так далее. Следовательно, первая половина слова равна его второй половине, т.е. оно является тандемных повтором.

Получили противоречие, следовательно любое слово чётной длины из можно разделить на два слова нечётной длины с различными центральными символами. В свою очередь, такие слова могут быть сгенерированы при помощи грамматики и соединены при помощи правила .

Утверждение:

Если , то не является КС-языком.

По замкнутости КС-языков относительно конкатенации получаем, что [math] L_1 [/math] и [math] L_2 [/math] являются КС-языками.

Но , что по лемме о разрастании для КС-языков не является КС-языком.

Для разности достаточно заметить, что , поэтому разность КС-языков также необязательно является КС-языком.

Более того, задачи определения того, является ли дополнение КС-языка КС-языком и проверки непустоты пересечения КС-языков являются алгоритмически неразрешимыми.

Половины тандемных повторов

Определение:

Операция [math] \mathrm{half} [/math] также не сохраняет КС-язык таковым. Покажем это на примере.

Рассмотрим язык .

Заметим, что он может быть сгенерирован при помощи следующей КС-грамматики:

[math] S \to AbBbBbAb [/math]
[math] B \to a \mid aB[/math]
[math] A \to b \mid aAa[/math]

Докажем, что [math] \mathrm{half}(L) [/math] не является КС-языком.

Пусть . Отсюда следует, что:

[math] n = l [/math]
[math] n = k [/math]
[math] m = k [/math]

А значит, [math] n = l = k = m [/math], и , и по лемме о разрастании КС-языком не является.

Операции над КС-языком и регулярным языком

Пересечение

Тем не менее, хоть пересечение двух КС-языков не обязательно является КС-языком, но пересечение КС-языка и регулярного языка — всегда КС-язык. Для доказательства этого построим МП-автомат для пересечения регулярного языка и КС-языка.

Пусть регулярный язык задан своим ДКА, а КС-язык — своим МП-автоматом c допуском по допускающему состоянию. Построим прямое произведение этих автоматов так же, как строилось прямое произведение для двух ДКА.

Более формально, пусть [math] R [/math] — регулярный язык, заданный своим ДКА , и [math] L [/math] — КС-язык, заданный своим МП-автоматом: . Тогда прямым произведением назовем следующий автомат:

. Иначе говоря, состояние в новом автомате — пара из состояния первого автомата и состояния второго автомата.
Стековый алфавит [math] \Gamma [/math] остается неизменным.
. Допускающие состояния нового автомата — пары состояний, где оба состояния были допускающими в своем автомате.
. При этом на стек кладется то, что положил бы изначальный МП-автомат при совершении перехода из состояния [math] q_2 [/math],

видя на ленте символ [math] c [/math] и символ [math] d [/math] на вершине стека.

Этот автомат использует в качестве состояний пары из двух состояний каждого автомата, а за операции со стеком отвечает только МП-автомат. Слово допускается этим автоматом [math] \iff [/math] слово допускается и ДКА и МП-автоматом, то есть язык данного автомата совпадает с [math] R \cap L [/math].

Разность

Разность КС-языка и регулярного языка выражается следующим образом: , а, поскольку регулярные языки замкнуты относительно дополнения, то разность можно выразить через пересечение.

См. также

Источники информации

Хопкрофт Д., Мотвани Р., Ульман Д. — Введение в теорию автоматов, языков и вычислений, 2-е изд. : Пер. с англ. — Москва, Издательский дом «Вильямс», 2002. — C. 302-304 : ISBN 5-8459-0261-4 (рус.)

@@ Строка 13: / Строка 13: @@
 Построим [[Контекстно-свободные грамматики, вывод, лево- и правосторонний вывод, дерево разбора|КС-грамматику]] для языка <tex> L_1 \cup L_2 </tex>. Для этого рассмотрим соответствующие КС-грамматики для языков <tex> L_1 </tex> и <tex> L_2 </tex>. Пусть стартовые символы в них имеют имена <tex> S </tex> и <tex> T </tex> соответственно. Тогда стартовый символ для <tex> L_1 \cup L_2 </tex> обозначим за <tex> S' </tex> и добавим правило <tex> S' \to S\,|\,T </tex>.
-Покажем, что <tex> S' \Rightarrow^{*} w \iff S \Rightarrow^{*} w \lor T \Rightarrow^{*} w </tex>. В левую сторону: поскольку <tex> S \Rightarrow^{*} w </tex> и есть правило <tex> S' \to S </tex>, то, по определению <tex> \Rightarrow^{*} </tex> получаем, что <tex> S' \Rightarrow^{*} w </tex>. Аналогично и для <tex> T </tex>.
+Покажем, что <tex> S' \Rightarrow^{*} w \iff S \Rightarrow^{*} w \lor T \Rightarrow^{*} w </tex>.
-В обратную сторону, пусть <tex> S' \Rightarrow^{*} w </tex>. Поскольку <tex> S' \to S\,|\,T </tex> — единственные правила, в которых нетерминал <tex> S' </tex> присутствует в правой части, то это означает, что либо <tex> S' \Rightarrow S \Rightarrow^{*} w </tex>, либо <tex> S' \Rightarrow T \Rightarrow^{*} w </tex>, что и требовалось доказать.
+<tex>\Rightarrow</tex>
+: Поскольку <tex> S \Rightarrow^{*} w </tex> и есть правило <tex> S' \to S </tex>, то, по определению <tex> \Rightarrow^{*} </tex> получаем, что <tex> S' \Rightarrow^{*} w </tex>. Аналогично и для <tex> T </tex>.
+<tex>\Leftarrow </tex>
+: Пусть <tex> S' \Rightarrow^{*} w </tex>. Поскольку <tex> S' \to S\,|\,T </tex> — единственные правила, в которых нетерминал <tex> S' </tex> присутствует в правой части, то это означает, что либо <tex> S' \Rightarrow S \Rightarrow^{*} w </tex>, либо <tex> S' \Rightarrow T \Rightarrow^{*} w </tex>.
 }}
@@ Строка 24: / Строка 28: @@
 |statement=  <tex> L_1 L_2 </tex> — КС-язык.
 |proof=Аналогично предыдущему случаю построим КС-грамматику для языка <tex> L_1 L_2 </tex>. Для этого добавим правило <tex> S' \to S T </tex>, где <tex> S </tex> и <tex> T </tex> — стартовые символы языков <tex> L_1 </tex> и <tex> L_2 </tex> соответственно.
-Остальное доказательство аналогично случаю с объединением.
 }}
@@ Строка 34: / Строка 37: @@
 }}
-=== Прямой и обратный гомоморфизм ===
+=== [[Основные определения, связанные со строками#Гомоморфизм языков | Прямой и обратный гомоморфизмы]] ===
-[[Файл:Homo.png|300px|thumb|]]
+[[Файл:Homo.png|300px|thumb|right]]
+{{ Утверждение
-В случае с [[Основные определения: алфавит, слово, язык, конкатенация, свободный моноид слов; операции над языками#Гомоморфизм языков|прямым гомоморфизмом]] всё просто: строится КС-грамматика, в которой каждый символ <tex> x \in \Sigma </tex> заменяется на <tex> h(x) </tex>.
+|statement= КС-языки замкнуты относительно прямого гомоморфизма.
+|proof=
+Построим КС-грамматику, в которой каждый символ <tex> x \in \Sigma </tex> заменим на <tex> h(x) </tex>.
+}}
+{{ Утверждение
+|statement= КС-языки замкнуты относительно обратного гомоморфизма.
+|proof=
 Для доказательства замкнутости [[Основные определения: алфавит, слово, язык, конкатенация, свободный моноид слов; операции над языками#Гомоморфизм языков|обратного гомоморфизма]] будем делать аналогично [[Замкнутость регулярных языков относительно различных операций|доказательству]] для регулярных языков. Построим [[Автоматы с магазинной памятью|МП-автомат]] для <tex> h^{-1}(L) = \{ w \mid h(w) \in L \} </tex> на основе МП-автомата для языка <tex> L </tex> (назовем его <tex> M </tex>). Новый автомат <tex> M' </tex> будет действовать следующим образом:
@@ Строка 56: / Строка 65: @@
 * Допускающими состояниями <tex> M' </tex> являются состояния <tex> (q, \varepsilon)</tex>, где <tex> q \in T </tex>.
 Таким образом получаем, что <tex>(s, h(w), Z_0) \vdash_M^{*} (p, \varepsilon, \gamma) \Leftrightarrow ((s, \varepsilon), w, Z_0) \vdash_{M'}^{*} ((p, \varepsilon), \varepsilon, \gamma)</tex>, то есть автомат <tex> M' </tex> допускает те и только те слова, которые принадлежат языку <tex> h^{-1}(L) </tex>.
+}}
 === Разворот ===
-Для того, чтобы построить КС-грамматику для языка <tex> L^{R} = \{ w^{R} \mid w \in L \} </tex>, необходимо развернуть все правые части правил грамматики для <tex> L </tex>.
+{{ Утверждение
+|statement= <tex> L^{R} = \{ w^{R} \mid w \in L \}</tex> контекстно-свободна.
+|proof=
+Для того, чтобы построить  <tex> L^{R} </tex>, необходимо развернуть все правые части правил грамматики для <tex> L </tex>.
 Покажем, что <tex>w \in L \iff w^{R} \in L^{R}</tex>. Докажем (<tex>\Rightarrow</tex>) индукцией по длине порождения в грамматике <tex>L</tex>. В обратную сторону (<tex>\Leftarrow</tex>) рассуждения аналогичны.
@@ Строка 70: / Строка 82: @@
 '''Переход'''. Пусть в порождении <tex>n</tex> шагов, <tex>n > 1</tex>. Тогда оно имеет вид <tex>A \underset{L}{\Rightarrow}Y_1 Y_2...Y_m \underset{L}{\Rightarrow}^*w</tex>, где <tex> Y_i \in N \cup \Sigma </tex>. Цепочку <tex> w </tex> можно разбить на <tex>w_1 w_2...w_m</tex>, где <tex> Y_i \underset{L}{\Rightarrow}^*w_i</tex>. Так как каждое из порождений <tex> Y_i \underset{L}{\Rightarrow}^*w_i </tex> содержит менее <tex> n </tex> шагов, к ним можно применить предположение индукции и заключить, что <tex> Y_i \underset{L^{R}}{\Rightarrow}^*w_i^{R} </tex>. Так как <tex>A \underset{L}{\Rightarrow}Y_1 Y_2...Y_m</tex>, то <tex>A \underset{L^{R}}{\Rightarrow}Y_m Y_{m - 1}...Y_1</tex>, откуда следует, что <tex> A \underset{L^{R}}{\Rightarrow}^* w^{R} </tex>.
+}}
 '''Пример разворота''':
@@ Строка 89: / Строка 101: @@
 {{ Утверждение
-|statement= Язык тандемных повторов <tex> L = \{ww \mid w \in \Sigma^{*} \} </tex> не является КС-языком, однако <tex> \overline{L} </tex> — КС-язык.
+|statement= Язык тандемных повторов <tex> L = \{ww \mid w \in \Sigma^{*} \} </tex> не является КС-языком.
+|proof=
+Это доказывается с помощью [[Лемма о разрастании для КС-грамматик|леммы о разрастании]].
+}}
+{{ Утверждение
+|statement= Дополнение к языку тандемных повторов <tex>\overline{L}</tex> является КС-языком.
 |proof=
 Для упрощения рассмотрим этот язык на бинарном алфавите <tex>\Sigma = \{a,b\}</tex>.
-То, что <tex> L </tex> — не КС-язык, доказывается с помощью [[Лемма о разрастании для КС-грамматик|леммы о разрастании]].
 Для <tex> \overline{L} </tex> можно составить следующую [[Контекстно-свободные грамматики, вывод, лево- и правосторонний вывод, дерево разбора|КС-грамматику]] <tex>G</tex>:

Замкнутость КС-языков относительно различных операций — различия между версиями

Версия 19:40, 6 ноября 2016

Содержание

Операции с КС-языками

Объединение

Конкатенация

Замыкание Клини

Прямой и обратный гомоморфизмы

Разворот

Дополнение, пересечение и разность

Половины тандемных повторов

Операции над КС-языком и регулярным языком

Пересечение

Разность

См. также

Источники информации

Навигация

Персональные инструменты

Пространства имён

Варианты

Просмотры

Ещё

Поиск

Навигация

Инструменты