Основные определения: алфавит, слово, язык, конкатенация, свободный моноид слов; операции над языками — различия между версиями
м |
|||
Строка 6: | Строка 6: | ||
'''Степени алфавита''' | '''Степени алфавита''' | ||
− | Если <tex>\Sigma</tex> - некоторый алфавит, то можно выразить множество всех цепочек определенной длины, состоящих из символов данного алфавита, используя знак степени. Определим <tex>\Sigma^k</tex>, как множество всех цепочек длины <tex>k</tex>, состоящих из символов алфавита <tex>\Sigma</tex>. | + | Если <tex>\Sigma</tex> - некоторый алфавит, то можно выразить множество всех цепочек определенной длины, состоящих из символов данного алфавита, используя знак степени. Определим <tex>\Sigma^k</tex>, как множество всех цепочек длины <tex>k</tex>, состоящих из символов алфавита <tex>\Sigma</tex>. Определим <tex>\Sigma^*</tex>, как <tex>\Sigma^*=\left\{\Sigma^0, \Sigma^1, \Sigma^2, ...\right\}<\tex> |
'''Конкатенация слов''' | '''Конкатенация слов''' |
Версия 01:37, 8 октября 2010
Алфавит - конечное непустое множество символов. Условимся обозначать алфавиты символом
.Слово, или цепочка - это конечная последовательность символов некоторого алфавита. Например, 01101 - это цепочка в бинарном алфавите
. Цепочка 111 это тоже цепочка в этом алфавите. Пустая цепочка - это цепочка, не содержащая ни одного символа. Эту цепочку обозначаемую , можно рассматривать как цепочку в любом алфавите. Длина цепочки - число символов в цепочке.Степени алфавита Если
- некоторый алфавит, то можно выразить множество всех цепочек определенной длины, состоящих из символов данного алфавита, используя знак степени. Определим , как множество всех цепочек длины , состоящих из символов алфавита . Определим , как и - цепочки. Тогда обозначает их конкатенацию (соединение), т.е. цепочку, в которой последовательно записаны цепочки x и y.Свойства
- Ассоциотивность
- нейтральный элемент
Таким образом мы получаемсвободный моноид слов.
Слово
является префиксом , если для некоторого .Слово
является суффиксом , если для некоторого .Слово
является подстрокой , если для некоторого , .(
, могут быть пустыми)
Язык - множество строчек, каждая из которых принадлежит , где - некоторый фиксированный алфавит. Если - алфавит, и , то - это язык над , или в . Отметим, что язык в не обязательно должен содержать цепочки, в которые входят все символы . Поэтому, если известно, что является языком в , то можно утверждать, что - это язык над любым алфавитом, содержащим .