Основные определения: алфавит, слово, язык, конкатенация, свободный моноид слов; операции над языками — различия между версиями
|  (→Гомоморфизм языков) | Shersh (обсуждение | вклад)   (определения образа и прообраза) | ||
| Строка 85: | Строка 85: | ||
| {{Определение | {{Определение | ||
| |definition= | |definition= | ||
| − | '''Образом  | + | '''Образом языка''' <tex>L \subset \Sigma_1^* </tex> при гомоморфизме <tex>\varphi: \Sigma_1^* \to \Sigma_2^*</tex> (иногда называют '''прямым гомоморфизмом''') называется язык <tex>M = \varphi(L) \overset{\underset{\mathrm{def}}{}}{=} \{ \varphi(x) \mid x \in L \}</tex>. <br> | 
| − | Заметим, что <tex>\varphi</tex> будет [[гомоморфизмом моноидов]] <tex>\langle L, \cdot, \varepsilon \rangle</tex> и <tex>\langle M, \cdot, \varepsilon \rangle</tex> | + | Заметим, что <tex>\varphi</tex> будет [[Моноид#defmonhom | гомоморфизмом моноидов]] <tex>\langle L, \cdot, \varepsilon \rangle</tex> и <tex>\langle M, \cdot, \varepsilon \rangle</tex> | 
| }} | }} | ||
| − | + | {{Определение | |
| + | |definition= | ||
| + | '''Прообразом языка''' <tex>M \subset \Sigma_2^*</tex> при гомоморфизме <tex>\varphi: \Sigma_1^* \to \Sigma_2^*</tex> (иногда называют '''обратным гомоморфизмом''') называется язык <tex>L = \varphi^{-1}(M) \overset{\underset{\mathrm{def}}{}}{=} \{ x \mid \varphi(x) \in M \}</tex>. | ||
| + | }} | ||
| === Примеры === | === Примеры === | ||
Версия 14:29, 16 ноября 2013
Содержание
Базовые определения
| Определение: | 
| Алфавит (англ. alphabet) — конечное непустое множество элементов, называемых символами (англ. symbols). Условимся обозначать алфавит большой греческой буквой . | 
Наиболее часто используются следующие алфавиты:
- — бинарный или двоичный алфавит.
- — множество строчных букв английского алфавита.
| Определение: | 
| Слово (англ. string) или цепочка — конечная последовательность символов некоторого алфавита. | 
| Определение: | 
| Пустая цепочка — цепочка, не содержащая ни одного символа. Эту цепочку, обозначаемую , можно рассматривать как цепочку в любом алфавите. | 
| Определение: | 
| Длина цепочки — число символов в цепочке. Длину некоторой цепочки обычно обозначают . | 
| Определение: | 
| — множество цепочек длины над алфавитом . | 
| Определение: | 
| — множество всех цепочек над алфавитом . | 
| Определение: | 
| Язык (англ. language) над алфавитом — некоторое подмножество . Иногда такие языки называют формальными (англ. formal), чтобы подчеркнуть отличие от языков в привычном смысле. | 
Отметим, что язык в  не обязательно должен содержать цепочки, в которые входят все символы . Поэтому, если известно, что  является языком над , то можно утверждать, что  — это язык над любым алфавитом, являющимся надмножеством .
| Определение: | 
| Пусть . Тогда или обозначает их конкатенацию (англ. concatenation), т.е. цепочку, в которой последовательно записаны цепочки и . | 
Множество строк с операцией конкатенации образует свободный моноид.
Операции над языками
Пусть и — языки. Тогда над ними можно определить следующие операции.
- Теоретико-множественные операции:
- — объединение,
- — пересечение,
- — разность,
- — дополнение.
 
- Конкатенация: .
- Конкатенация с обратным языком: ; конкатенация с обратным словом: .
- Степень языка:
- Замыкание Клини: .
- Гомоморфизм
Примеры
- — язык состоит из последовательностей нулей, последовательностей единиц и пустой строки.
- — аналогично предыдущему, но не содержит пустую строку.
- — содержит все двоичные векторы и пустую строку.
- Если — язык десятичных представлений всех простых чисел, то язык будет содержать десятичные представления простых чисел, не начинающихся с тройки.
- .
Гомоморфизм языков
| Определение: | 
| Пусть даны два алфавита . Гомоморфизмом называется такое отображение , что: 
 | 
| Определение: | 
| Образом языка  при гомоморфизме  (иногда называют прямым гомоморфизмом) называется язык . Заметим, что будет гомоморфизмом моноидов и | 
| Определение: | 
| Прообразом языка при гомоморфизме (иногда называют обратным гомоморфизмом) называется язык . | 
Примеры
- TODO тривиальный гомоморфизм — отобразить все в пустую строку
- TODO гомоморфизм который цепочечный или как его там — где задается на , то есть каждый символ заменяется строчкой, это относительно которого регулярный замкнут
- TODO какой-нибудь смешной гомоморфизм, например, стирающий все символы 'b' из слов языка L.
- TODO ну и для обратного гомоморфизма тоже какой-нибудь интересный пример
Ссылки
- Wikipedia — Formal language
- Wikipedia — Kleene star
- Wikipedia — String homomorphism
- Википедия — Формальный язык
- Википедия — Звезда Клини
- M.Lothaire "Combinatorics on words"
- Хопкрофт Д., Мотвани Р., Ульман Д. Введение в теорию автоматов, языков и вычислений, 2-е изд. : Пер. с англ. — М.:Издательский дом «Вильямс», 2002. — С. 45.
