Замкнутость КС-языков относительно различных операций — различия между версиями
AMaltsev (обсуждение | вклад) м (Отмена правки 55807 участника AMaltsev (обсуждение)) |
м (rollbackEdits.php mass rollback) |
||
(не показано 12 промежуточных версий 4 участников) | |||
Строка 11: | Строка 11: | ||
|proof= | |proof= | ||
− | Построим [[Контекстно-свободные грамматики, вывод, лево- и правосторонний вывод, дерево разбора|КС-грамматику]] для языка <tex> L_1 \cup L_2 </tex>. Для этого рассмотрим соответствующие КС-грамматики для языков <tex> L_1 </tex> и <tex> L_2 </tex>. Пусть стартовые символы в них имеют имена <tex> S </tex> и <tex> T </tex> соответственно. Тогда стартовый символ для <tex> L_1 \cup L_2 </tex> обозначим за <tex> S' </tex> и добавим правило <tex> S' \to S\ | + | Построим [[Контекстно-свободные грамматики, вывод, лево- и правосторонний вывод, дерево разбора|КС-грамматику]] для языка <tex> L_1 \cup L_2 </tex>. Для этого рассмотрим соответствующие КС-грамматики для языков <tex> L_1 </tex> и <tex> L_2 </tex>. Пусть стартовые символы в них имеют имена <tex> S </tex> и <tex> T </tex> соответственно. Тогда стартовый символ для <tex> L_1 \cup L_2 </tex> обозначим за <tex> S' </tex> и добавим правило <tex> S' \to S \mid T </tex>. |
Покажем, что <tex> S' \Rightarrow^{*} w \iff S \Rightarrow^{*} w \lor T \Rightarrow^{*} w </tex>. | Покажем, что <tex> S' \Rightarrow^{*} w \iff S \Rightarrow^{*} w \lor T \Rightarrow^{*} w </tex>. | ||
Строка 19: | Строка 19: | ||
<tex>\Leftarrow </tex> | <tex>\Leftarrow </tex> | ||
− | : Пусть <tex> S' \Rightarrow^{*} w </tex>. Поскольку <tex> S' \to S\ | + | : Пусть <tex> S' \Rightarrow^{*} w </tex>. Поскольку <tex> S' \to S \mid T </tex> — единственные правила, в которых нетерминал <tex> S' </tex> присутствует в правой части, то это означает, что либо <tex> S' \Rightarrow S \Rightarrow^{*} w </tex>, либо <tex> S' \Rightarrow T \Rightarrow^{*} w </tex>. |
}} | }} | ||
Строка 34: | Строка 34: | ||
{{ Утверждение | {{ Утверждение | ||
|statement= <tex> L^{*} = \bigcup\limits_{i = 0}^{\infty} L^i </tex> — КС-язык. | |statement= <tex> L^{*} = \bigcup\limits_{i = 0}^{\infty} L^i </tex> — КС-язык. | ||
− | |proof=Если <tex> S </tex> — стартовый символ КС-грамматики для языка <tex> L </tex>, то добавим в КС-грамматику для языка <tex> L^{*} </tex> новый стартовый символ <tex> S' </tex> и правила <tex> S' \to S S' \ | + | |proof=Если <tex> S </tex> — стартовый символ КС-грамматики для языка <tex> L </tex>, то добавим в КС-грамматику для языка <tex> L^{*} </tex> новый стартовый символ <tex> S' </tex> и правила <tex> S' \to S S' \mid \varepsilon </tex>. |
}} | }} | ||
− | === [[Основные определения, связанные со строками#Гомоморфизм языков | Прямой | + | ===Гомоморфизмы === |
+ | ==== [[Основные определения, связанные со строками#Гомоморфизм языков | Прямой гомоморфизм]] ==== | ||
{{ Утверждение | {{ Утверждение | ||
|statement= КС-языки замкнуты относительно прямого гомоморфизма. | |statement= КС-языки замкнуты относительно прямого гомоморфизма. | ||
|proof= | |proof= | ||
− | Построим КС-грамматику, в которой каждый символ <tex> x \in \Sigma </tex> заменим на <tex> h(x) </tex>. | + | Построим КС-грамматику, в которой каждый символ <tex> x \in \Sigma </tex> заменим на <tex> \mathrm{h}(x) </tex>. |
}} | }} | ||
− | + | ==== [[Основные определения, связанные со строками#Гомоморфизм языков | Обратный гомоморфизм]] ==== | |
{{ Утверждение | {{ Утверждение | ||
− | |statement= КС-языки замкнуты относительно | + | |statement= КС-языки замкнуты относительно обратного гомоморфизма. |
|proof= | |proof= | ||
[[Файл:Homo.png|300px|right|frameless]] | [[Файл:Homo.png|300px|right|frameless]] | ||
− | Докажем аналогично соответствующему утверждению для регулярных языков. Построим [[Автоматы с магазинной памятью|МП-автомат]] для <tex> h^{-1}(L) = \{ w \mid h(w) \in L \} </tex> на основе МП-автомата для языка <tex> L </tex> (назовем его <tex> M </tex>). Новый автомат <tex> M' </tex> будет действовать следующим образом: | + | Докажем аналогично соответствующему утверждению для регулярных языков. Построим [[Автоматы с магазинной памятью|МП-автомат]] для <tex> \mathrm{h^{-1}}(L) = \{ w \mid \mathrm{h}(w) \in L \} </tex> на основе МП-автомата для языка <tex> L </tex> (назовем его <tex> M </tex>). Новый автомат <tex> M' </tex> будет действовать следующим образом: |
# Если входное слово закончилось, допускаем или не допускаем его [[МП-автоматы, допуск по пустому стеку и по допускающему состоянию, эквивалентность|по допускающему состоянию]]. | # Если входное слово закончилось, допускаем или не допускаем его [[МП-автоматы, допуск по пустому стеку и по допускающему состоянию, эквивалентность|по допускающему состоянию]]. | ||
# Считываем символ <tex> c </tex>. | # Считываем символ <tex> c </tex>. | ||
− | # Сохраняем <tex> h(c) </tex> в буфере (входная лента для автомата <tex> M </tex>). | + | # Сохраняем <tex> \mathrm{h}(c) </tex> в буфере (входная лента для автомата <tex> M </tex>). |
# Запускаем <tex> M </tex> на слове, находящемся в буфере. | # Запускаем <tex> M </tex> на слове, находящемся в буфере. | ||
# После того, как <tex> M </tex> обработал весь буфер, переходим к пункту 1. | # После того, как <tex> M </tex> обработал весь буфер, переходим к пункту 1. | ||
Строка 61: | Строка 62: | ||
* <tex> Q' = \{ (q, x) \mid q \in Q \} </tex>, где <tex> x </tex> — суффикс (не обязательно собственный) некоторой цепочки <tex> h(c) </tex> для символа <tex> c \in \Sigma </tex>. Таким образом, первый компонент состояния <tex> M' </tex> является состоянием <tex> M </tex>, а второй — компонентом буфера. | * <tex> Q' = \{ (q, x) \mid q \in Q \} </tex>, где <tex> x </tex> — суффикс (не обязательно собственный) некоторой цепочки <tex> h(c) </tex> для символа <tex> c \in \Sigma </tex>. Таким образом, первый компонент состояния <tex> M' </tex> является состоянием <tex> M </tex>, а второй — компонентом буфера. | ||
* <tex> \delta' </tex> определяется следующими правилами: | * <tex> \delta' </tex> определяется следующими правилами: | ||
− | ** <tex> \delta'((q, \varepsilon), c, X) = \{((q, h(c)), X) \mid c \in \Sigma, q \in Q, X \in \Gamma \}</tex>. Когда буфер пуст, <tex> M' </tex> может прочитать свой следующий входной символ <tex> c </tex> и поместить <tex> h(c) </tex> в буфер. | + | ** <tex> \delta'((q, \varepsilon), c, X) = \{((q, \mathrm{h}(c)), X) \mid c \in \Sigma, q \in Q, X \in \Gamma \}</tex>. Когда буфер пуст, <tex> M' </tex> может прочитать свой следующий входной символ <tex> c </tex> и поместить <tex> \mathrm{h}(c) </tex> в буфер. |
** Если <tex> (p, \gamma) \in \delta(q, b, X), b \in T \cup \varepsilon </tex>, то <tex> ((p, x), \gamma) \in \delta'((q, bx), \varepsilon, X) </tex>. Таким образом, <tex> M' </tex> всегда имеет возможность имитации перехода <tex> M </tex>, используя голову буфера. Если <tex> b \in T </tex>, то буфер должен быть непустым, но если <tex> b = \varepsilon </tex>, то буфер может быть пустым. | ** Если <tex> (p, \gamma) \in \delta(q, b, X), b \in T \cup \varepsilon </tex>, то <tex> ((p, x), \gamma) \in \delta'((q, bx), \varepsilon, X) </tex>. Таким образом, <tex> M' </tex> всегда имеет возможность имитации перехода <tex> M </tex>, используя голову буфера. Если <tex> b \in T </tex>, то буфер должен быть непустым, но если <tex> b = \varepsilon </tex>, то буфер может быть пустым. | ||
* Начальным состоянием <tex> M' </tex> является <tex> (s, \varepsilon) </tex>, т.е. <tex> M' </tex> стартует в начальном состоянии <tex> M </tex> с пустым буфером. | * Начальным состоянием <tex> M' </tex> является <tex> (s, \varepsilon) </tex>, т.е. <tex> M' </tex> стартует в начальном состоянии <tex> M </tex> с пустым буфером. | ||
* Допускающими состояниями <tex> M' </tex> являются состояния <tex> (q, \varepsilon)</tex>, где <tex> q \in T </tex>. | * Допускающими состояниями <tex> M' </tex> являются состояния <tex> (q, \varepsilon)</tex>, где <tex> q \in T </tex>. | ||
− | Таким образом получаем, что <tex>(s, h(w), Z_0) \vdash_M^{*} (p, \varepsilon, \gamma) \Leftrightarrow ((s, \varepsilon), w, Z_0) \vdash_{M'}^{*} ((p, \varepsilon), \varepsilon, \gamma)</tex>, то есть автомат <tex> M' </tex> допускает те и только те слова, которые принадлежат языку <tex> h^{-1}(L) </tex>. | + | Таким образом получаем, что <tex>(s, \mathrm{h}(w), Z_0) \vdash_M^{*} (p, \varepsilon, \gamma) \Leftrightarrow ((s, \varepsilon), w, Z_0) \vdash_{M'}^{*} ((p, \varepsilon), \varepsilon, \gamma)</tex>, то есть автомат <tex> M' </tex> допускает те и только те слова, которые принадлежат языку <tex> \mathrm{h^{-1}}(L) </tex>. |
}} | }} | ||
+ | |||
=== Разворот === | === Разворот === | ||
{{ Утверждение | {{ Утверждение | ||
− | |statement= <tex> L^{R} = \{ w^{R} \mid w \in L \}</tex> контекстно- | + | |statement= <tex> L^{R} = \{ w^{R} \mid w \in L \}</tex> контекстно-свободен. |
|proof= | |proof= | ||
Для того, чтобы построить <tex> L^{R} </tex>, необходимо развернуть все правые части правил грамматики для <tex> L </tex>. | Для того, чтобы построить <tex> L^{R} </tex>, необходимо развернуть все правые части правил грамматики для <tex> L </tex>. | ||
Строка 85: | Строка 87: | ||
:'''Переход'''. | :'''Переход'''. | ||
− | :: Пусть в порождении <tex>n</tex> шагов, <tex>n > 1</tex>. Тогда оно имеет вид <tex>A \underset{L}{\Rightarrow}Y_1 Y_2 | + | :: Пусть в порождении <tex>n</tex> шагов, <tex>n > 1</tex>. Тогда оно имеет вид <tex>A \underset{L}{\Rightarrow}Y_1 Y_2 \ldots Y_m \underset{L}{\Rightarrow}^*w</tex>, где <tex> Y_i \in N \cup \Sigma </tex>. Цепочку <tex> w </tex> можно разбить на <tex>w_1 w_2 \ldots w_m</tex>, где <tex> Y_i \underset{L}{\Rightarrow}^*w_i</tex>. Так как каждое из порождений <tex> Y_i \underset{L}{\Rightarrow}^*w_i </tex> содержит менее <tex> n </tex> шагов, к ним можно применить предположение индукции и заключить, что <tex> Y_i \underset{L^{R}}{\Rightarrow}^*w_i^{R} </tex>. Так как <tex>A \underset{L}{\Rightarrow}Y_1 Y_2 \ldots Y_m</tex>, то <tex>A \underset{L^{R}}{\Rightarrow}Y_m Y_{m - 1} \ldots Y_1</tex>, откуда следует, что <tex> A \underset{L^{R}}{\Rightarrow}^* w^{R} </tex>. |
<tex>\Leftarrow</tex> | <tex>\Leftarrow</tex> | ||
Строка 102: | Строка 104: | ||
* <tex> B \to cBa \mid A </tex> | * <tex> B \to cBa \mid A </tex> | ||
− | + | === Дополнение к языку тандемных повторов === | |
− | === Дополнение | ||
− | |||
− | |||
{{ Утверждение | {{ Утверждение | ||
Строка 152: | Строка 151: | ||
}} | }} | ||
+ | === Пересечение === | ||
{{ Утверждение | {{ Утверждение | ||
|statement= Если <tex> L_1 = a^i b^i c^j , L_2 = a^i b^j c^j </tex>, то <tex> L_1 \cap L_2 </tex> не является КС-языком. | |statement= Если <tex> L_1 = a^i b^i c^j , L_2 = a^i b^j c^j </tex>, то <tex> L_1 \cap L_2 </tex> не является КС-языком. | ||
|proof= | |proof= | ||
− | <tex> L_1 = \{ a^i b^i \} | + | <tex> L_1 = \{ a^i b^i \} \{ c^j \}, L_2 = \{ a^i \} \{ b^j c^j \} </tex> |
По замкнутости КС-языков относительно конкатенации получаем, что <tex> L_1 </tex> и <tex> L_2 </tex> являются КС-языками. | По замкнутости КС-языков относительно конкатенации получаем, что <tex> L_1 </tex> и <tex> L_2 </tex> являются КС-языками. | ||
− | Но <tex> L_1 \cap L_2 = \{ a^i b^i c^i \mid i \in \mathbb{N} \} </tex>, | + | Но <tex> L_1 \cap L_2 = \{ a^i b^i c^i \mid i \in \mathbb{N} \} </tex>, который по [[Лемма о разрастании для КС-грамматик|лемме о разрастании]] для КС-языков не является КС-языком. |
}} | }} | ||
+ | |||
+ | === Разность === | ||
{{ Утверждение | {{ Утверждение | ||
|statement= КС-языки не замкнуты относительно разности. | |statement= КС-языки не замкнуты относительно разности. | ||
|proof= | |proof= | ||
− | + | <tex> L_1 \setminus L_2 = L_1 \cap \overline{L_2} </tex> | |
+ | |||
}} | }} | ||
Более того, задачи определения того, является ли дополнение КС-языка КС-языком и проверки непустоты пересечения КС-языков являются алгоритмически [[Разрешимые (рекурсивные) языки|неразрешимыми]]. | Более того, задачи определения того, является ли дополнение КС-языка КС-языком и проверки непустоты пересечения КС-языков являются алгоритмически [[Разрешимые (рекурсивные) языки|неразрешимыми]]. | ||
Строка 176: | Строка 179: | ||
}} | }} | ||
− | Операция <tex> \mathrm{half} </tex> | + | {{ Утверждение |
− | + | |statement= Операция <tex> \mathrm{half} </tex> не сохраняет КС-язык таковым. | |
− | Рассмотрим язык <tex> L = \{ a^n b a^n b a^m b a^l b a^k b a^k b \} </tex>. | + | |proof= |
+ | Покажем это на примере. Рассмотрим язык <tex> L = \{ a^n b a^n b a^m b a^l b a^k b a^k b \} </tex>. | ||
Заметим, что он может быть сгенерирован при помощи следующей КС-грамматики: | Заметим, что он может быть сгенерирован при помощи следующей КС-грамматики: | ||
Строка 194: | Строка 198: | ||
А значит, <tex> n = l = k = m </tex>, и <tex> \mathrm{half}(L) = \{ a^n b a^n b a^n b \} </tex>, и по [[Лемма о разрастании для КС-грамматик|лемме о разрастании]] КС-языком не является. | А значит, <tex> n = l = k = m </tex>, и <tex> \mathrm{half}(L) = \{ a^n b a^n b a^n b \} </tex>, и по [[Лемма о разрастании для КС-грамматик|лемме о разрастании]] КС-языком не является. | ||
− | + | }} | |
== Операции над КС-языком и регулярным языком == | == Операции над КС-языком и регулярным языком == | ||
Строка 234: | Строка 238: | ||
[[Категория: Теория формальных языков]] | [[Категория: Теория формальных языков]] | ||
[[Категория: Контекстно-свободные грамматики]] | [[Категория: Контекстно-свободные грамматики]] | ||
+ | [[Категория: Базовые понятия о грамматиках]] |
Текущая версия на 19:29, 4 сентября 2022
В отличие от регулярных языков, КС-языки не замкнуты относительно всех теоретико-множественных операций. К примеру, дополнение и пересечение КС-языков не обязательно являются КС-языками.
Здесь и далее считаем, что
и — КС-языки.Содержание
Операции с КС-языками
Объединение
Утверждение: |
является КС-языком. |
Построим КС-грамматику для языка . Для этого рассмотрим соответствующие КС-грамматики для языков и . Пусть стартовые символы в них имеют имена и соответственно. Тогда стартовый символ для обозначим за и добавим правило . Покажем, что .
|
Конкатенация
Утверждение: |
— КС-язык. |
Аналогично предыдущему случаю построим КС-грамматику для языка | . Для этого добавим правило , где и — стартовые символы языков и соответственно.
Замыкание Клини
Утверждение: |
— КС-язык. |
Если | — стартовый символ КС-грамматики для языка , то добавим в КС-грамматику для языка новый стартовый символ и правила .
Гомоморфизмы
Прямой гомоморфизм
Утверждение: |
КС-языки замкнуты относительно прямого гомоморфизма. |
Построим КС-грамматику, в которой каждый символ | заменим на .
Обратный гомоморфизм
Утверждение: |
КС-языки замкнуты относительно обратного гомоморфизма. |
Докажем аналогично соответствующему утверждению для регулярных языков. Построим МП-автомат для на основе МП-автомата для языка (назовем его ). Новый автомат будет действовать следующим образом:
Если рассмотреть более формально, пусть , тогда .
|
Разворот
Утверждение: |
контекстно-свободен. |
Для того, чтобы построить , необходимо развернуть все правые части правил грамматики для .Покажем, что .
|
Пример разворота:
Пусть задана КС-грамматика
для языка со следующими правилами:В таком случае КС-грамматика
для языка выглядит следующим образом:Дополнение к языку тандемных повторов
Утверждение: |
Язык тандемных повторов не является КС-языком. |
Это доказывается с помощью леммы о разрастании. |
Утверждение: |
Дополнение к языку тандемных повторов является КС-языком. |
Для упрощения рассмотрим этот язык на бинарном алфавите КС-грамматику : . Для можно составить следующуюДокажем этот факт. Сначала заметим, что нетерминал порождает слова нечётной длины с центральным символом . В свою очередь нетерминал порождает слова нечётной длины с центральным символом . Таким образом, правило порождает все возможные слова нечётной длины.Докажем, что все слова, порождённые , есть в ., а также все слова нечётной длины не являются тандемными повторами. Рассмотрим произвольное слово чётной длины, сгенерированное при помощи правила . Пусть его часть, соответствующая , имеет длину , а часть, соответствующая , — длину .Таким образом, мы получили слово длины . Если оно является тандемным повтором, то символ, стоящий на позиции , должен быть равен символу на позиции . Но по построению это не так.Для правила доказательство аналогично.Докажем, что все слова из порождаются .С помощью можно вывести , а также любое слово нечётной длины.Далее рассмотрим произвольное слово чётной длины из . Докажем, что его можно разбить на два слова нечётной длины, имеющие различные центральные символы. Предположим, что это не так, то есть такого разбиения нет.Пусть это слово имеет длину Получили противоречие, следовательно любое слово чётной длины из . Тогда рассмотрим все его префиксы нечётной длины. Их центры находятся на позициях , а центры соответствующих им суффиксов — на позициях . Поскольку искомого разбиения не существует, то получается, что символ на позиции равен символу на позиции , символ на позиции равен символу на позиции , и так далее. Следовательно, первая половина слова равна его второй половине, т.е. оно является тандемных повтором. можно разделить на два слова нечётной длины с различными центральными символами. В свою очередь, такие слова могут быть сгенерированы при помощи грамматики и соединены при помощи правила . |
Пересечение
Утверждение: |
Если , то не является КС-языком. |
По замкнутости КС-языков относительно конкатенации получаем, что Но и являются КС-языками. , который по лемме о разрастании для КС-языков не является КС-языком. |
Разность
Утверждение: |
КС-языки не замкнуты относительно разности. |
Более того, задачи определения того, является ли дополнение КС-языка КС-языком и проверки непустоты пересечения КС-языков являются алгоритмически неразрешимыми.
Половины тандемных повторов
Определение: |
Утверждение: |
Операция не сохраняет КС-язык таковым. |
Покажем это на примере. Рассмотрим язык .Заметим, что он может быть сгенерирован при помощи следующей КС-грамматики: Докажем, что не является КС-языком.Пусть . Отсюда следует, что: |
Операции над КС-языком и регулярным языком
Пересечение
Утверждение: |
Пересечение КС-языка и регулярного языка — КС-язык. |
Построим МП-автомат для пересечения регулярного языка и КС-языка. Пусть регулярный язык задан своим ДКА, а КС-язык — своим МП-автоматом c допуском по допускающему состоянию. Построим прямое произведение этих автоматов так же, как строилось прямое произведение для двух ДКА. Более формально, пусть — регулярный язык, заданный своим ДКА , и — КС-язык, заданный своим МП-автоматом: . Тогда прямым произведением назовем следующий автомат:
видя на ленте символ Этот автомат использует в качестве состояний пары из двух состояний каждого автомата, а за операции со стеком отвечает только МП-автомат. Слово допускается этим автоматом и символ на вершине стека. слово допускается и ДКА и МП-автоматом, то есть язык данного автомата совпадает с . |
Разность
Утверждение: |
Разность КС-языка и регулярного языка — КС-язык. |
Регулярные языки замкнуты относительно дополнения, следовательно разность можно выразить через пересечение. |
См. также
- Контекстно-свободные грамматики, вывод, лево- и правосторонний вывод, дерево разбора
- Замкнутость регулярных языков относительно различных операций
- Основные определения, связанные со строками
Источники информации
- Хопкрофт Д., Мотвани Р., Ульман Д. — Введение в теорию автоматов, языков и вычислений, 2-е изд. : Пер. с англ. — Москва, Издательский дом «Вильямс», 2002. — C. 302-304 : ISBN 5-8459-0261-4 (рус.)