Основные определения: алфавит, слово, язык, конкатенация, свободный моноид слов; операции над языками — различия между версиями
м |
м |
||
Строка 27: | Строка 27: | ||
− | '''Язык''' - множество строчек, каждая из которых принадлежит <tex>\Sigma^*</tex>, где <tex>\Sigma</tex> - некоторый фиксированный алфавит. Если <tex>\Sigma</tex> - алфавит, и <tex> | + | '''Язык''' - множество строчек, каждая из которых принадлежит <tex>\Sigma^*</tex>, где <tex>\Sigma</tex> - некоторый фиксированный алфавит. Если <tex>\Sigma</tex> - алфавит, и <tex>L \subseteq \Sigma^*</tex>, то <tex>L</tex> - это ''язык над'' <tex>\Sigma</tex>, или ''в'' <tex>\Sigma</tex>. Отметим, что язык в <tex>\Sigma</tex> не обязательно должен содержать цепочка, в которые входят все символы <tex>\Sigma</tex>. Поэтому, если известно, что <tex>L</tex> является языком в <tex>\Sigma</tex>, то можно утверждать, что <tex>L</tex> - это язык над любым алфавитом, содержащим <tex>\Sigma</tex>. |
Версия 00:31, 8 октября 2010
Алфавит - конечное непустое множество символов. Условимся обозначать алфавиты символом
.Слово, или цепочка - это конечная последовательность символов некоторого алфавита. Например, 01101 - это цепочка в бинарном алфавите
. Цепочка 111 это тоже цепочка в этом алфавите. Пустая цепочка - это цепочка, не содержащая ни одного символа. Эту цепочку обозначаемую , можно рассматривать как цепочку в любом алфавите. Длина цепочки - число символов в цепочке.Степени алфавита Если
- некоторый алфавит, то можно выразить множество всех цепочек определенной длины, состоящих из символов данного алфавита, используя знак степени. Определим , как множество всех цепочек длины k, состоящих из символов алфавита .Конкатенация слов Пусть x и y - цепочки. Тогда xy обозначает их конкатенацию (соединение), т.е. цепочку, в которой последовательно записаны цепочки x и y.
Свойства
- Ассоциотивность
- нейтральный элемент
Таким образом мы получаемсвободный моноид слов.
Слово
является префиксом , если для некоторого .Слово
является суффиксом , если для некоторого .Слово
является подстрокой , если для некоторого , .(
, могут быть пустыми)
Язык - множество строчек, каждая из которых принадлежит , где - некоторый фиксированный алфавит. Если - алфавит, и , то - это язык над , или в . Отметим, что язык в не обязательно должен содержать цепочка, в которые входят все символы . Поэтому, если известно, что является языком в , то можно утверждать, что - это язык над любым алфавитом, содержащим .