Основные определения: алфавит, слово, язык, конкатенация, свободный моноид слов; операции над языками — различия между версиями
Kirelagin (обсуждение | вклад) (Примеры) |
|||
Строка 53: | Строка 53: | ||
Таким образом, мы получаем '''свободный [[Моноид|моноид]] слов'''. | Таким образом, мы получаем '''свободный [[Моноид|моноид]] слов'''. | ||
+ | |||
+ | == Операции над языками == | ||
+ | Пусть <tex>L</tex> и <tex>M</tex> {{---}} [[Основные определения: алфавит, слово, язык, конкатенация, свободный моноид слов#deflanguage|языки]]. Тогда над ними можно определить следующие операции. | ||
+ | #Теоретико-множественные операции: | ||
+ | #* <tex>L \cup M</tex> {{---}} объединение, | ||
+ | #* <tex>L \cap M </tex> {{---}} пересечение, | ||
+ | #* <tex>L \setminus M</tex> {{---}} разность, | ||
+ | #* <tex>\overline{L}=\Sigma^* \setminus L</tex> {{---}} дополнение. | ||
+ | #Конкатенация <tex>LM=\left\{\alpha\beta|\alpha \in L, \beta \in M\right\}</tex>. | ||
+ | #Степень языка <tex>L^k=\begin{cases} | ||
+ | \{\varepsilon\}, k = 0\\ | ||
+ | LL^{k-1}, k > 0. | ||
+ | \end{cases} | ||
+ | </tex> | ||
+ | #Замыкание Клини <tex>L^*=\bigcup\limits_{i=0}^{\infty}L^i</tex>. | ||
+ | |||
+ | === Примеры === | ||
+ | * <tex>(\{0\}^*) \cup (\{1\}^*)</tex> — язык состоит из последовательностей нулей, последовательностей единиц и пустого слово. | ||
+ | * <tex>(\{0\}\{0\}^*) \cup (\{1\}\{1\}^*)</tex> — аналогично предыдущему, но не содержит пустое слово. | ||
+ | * <tex>(\{0\} \cup \{1\})^* = \{0, 1\}^*</tex> — содержит все двоичные векторы и пустую строку. | ||
+ | * Если <tex>L_p</tex> — язык строковых представлений всех простых чисел, то язык <tex>(L_p \setminus (\{3\}\{1,2,3,4,5,6,7,8,9,0\}^*))</tex> будет содержать строковые представления простых чисел, не начинающихся с тройки. | ||
+ | |||
+ | |||
+ | [[Категория: Теория формальных языков]] | ||
+ | [[Категория: Автоматы и регулярные языки]] | ||
[[Категория: Теория формальных языков]] | [[Категория: Теория формальных языков]] | ||
[[Категория: Автоматы и регулярные языки]] | [[Категория: Автоматы и регулярные языки]] |
Версия 07:38, 21 января 2012
Определение: |
Алфавит — конечное непустое множество. Условимся обозначать алфавит символом | .
Наиболее часто используются следующие алфавиты:
- — бинарный или двоичный алфавит.
- — множество строчных букв английского алфавита.
Определение: |
Слово (цепочка) — конечная последовательность символов некоторого алфавита. |
Определение: |
Пустая цепочка — цепочка, не содержащая ни одного символа. Эту цепочку, обозначаемую | , можно рассматривать как цепочку в любом алфавите.
Определение: |
Длина цепочки — число символов в цепочке. Длину некоторой цепочки | обычно обозначают .
Определение: |
— множество цепочек длины над алфавитом . |
Определение: |
— множество всех цепочек над алфавитом . |
Определение: |
Язык над алфавитом | — некоторое подмножество . Иногда такие язык называют формальными, чтобы подчеркнуть отличие от языков в привычном смысле.
Отметим, что язык в не обязательно должен содержать цепочки, в которые входят все символы . Поэтому, если известно, что является языком над , то можно утверждать, что — это язык над любым алфавитом, являющимся надмножеством .
Определение: |
Пусть | . Тогда обозначает их конкатенацию, т.е. цепочку, в которой последовательно записаны цепочки x и y.
Свойства
Таким образом, мы получаем свободный моноид слов.
Операции над языками
Пусть языки. Тогда над ними можно определить следующие операции.
и —- Теоретико-множественные операции:
- — объединение,
- — пересечение,
- — разность,
- — дополнение.
- Конкатенация .
- Степень языка
- Замыкание Клини .
Примеры
- — язык состоит из последовательностей нулей, последовательностей единиц и пустого слово.
- — аналогично предыдущему, но не содержит пустое слово.
- — содержит все двоичные векторы и пустую строку.
- Если — язык строковых представлений всех простых чисел, то язык будет содержать строковые представления простых чисел, не начинающихся с тройки.