|
|
(не показано 69 промежуточных версий 7 участников) |
Строка 1: |
Строка 1: |
− | ==Алфавит и Слово==
| + | #перенаправление [[Основные определения, связанные со строками]] |
− | | |
− | | |
− | '''Алфавит''' - конечное непустое множество символов. Условимся обозначать алфавиты символом <tex>\Sigma</tex>.
| |
− |
| |
− | '''Слово''', или '''цепочка''' - это конечная последовательность символов некоторого алфавита. Например, 01101 - это цепочка в бинарном алфавите <tex>\Sigma = {0,1}</tex>. Цепочка 111 это тоже цепочка в этом алфавите.
| |
− | ''Пустая цепочка'' - это цепочка, не содержащая ни одного символа. Эту цепочку обозначаемую <tex> \varepsilon </tex>, можно рассматривать как цепочку в любом алфавите.
| |
− | ''Длина цепочки'' - число позиций для символов в цепочке.
| |
− | '''Степени алфавита'''
| |
− | Если <tex>\Sigma</tex> - некоторый алфавит, то можно выразить множество всех цепочек определенной длины, состоящих из символов данного алфавита, используя знак степени. Определим <tex>\Sigma^k</tex>, как множество всех цепочек длины k, состоящих из символов алфавита <tex>\Sigma</tex>.
| |
− | | |
− | '''Конкатенация слов'''
| |
− | Пусть x и y - цепочки. Тогда xy обозначает их ''конкатенацию'' (соединение), т.е. цепочку, в которой последовательно записаны цепочки x и y.
| |
− | | |
− | ''Свойства''
| |
− | | |
− | * Ассоциотивность <tex>(\alpha\beta)\gamma=\alpha(\beta\gamma)</tex>
| |
− | * <tex>\exists </tex> нейтральный элемент <tex>\alpha\varepsilon=\varepsilon\alpha=\alpha</tex>
| |
− | | |
− | Таким образом мы получаем''свободный моноид слов''.
| |
− | | |
− | Слово <tex>\alpha</tex> является '''префиксом''' <tex>\beta</tex>, если <tex>\beta = \alpha\gamma</tex> для некоторого <tex>\gamma</tex>.
| |
− | | |
− | Слово <tex>\alpha</tex> является '''суффиксом''' <tex>\beta</tex>, если <tex>\beta = \gamma\alpha</tex> для некоторого <tex>\gamma</tex>.
| |
− | | |
− | Слово <tex>\alpha</tex> является '''подстрокой''' <tex>\beta</tex>, если <tex>\beta = \gamma\alpha\delta</tex> для некоторого <tex>\gamma,\delta</tex>.
| |
− |
| |
− | (\gamma, \delta могут быть пустыми)
| |
− | | |
− | ==Язык==
| |
− | '''Язык''' - множество строчек, каждая из которых принадлежит <tex>\Sigma^*</tex>, где <tex>\Sigma</tex> - некоторый фиксированный алфавит. Если <tex>\Sigma</tex> - алфавит, и <tex>\L \subseteq Sigma^*</tex>, то <tex>L</tex> - это ''язык над'' <tex>\Sigma</tex>, или ''в'' <tex>\Sigma</tex>. Отметим, что язык в <tex>\Sigma</tex> не обязательно должен содержать цепочка, в которые входят все символы <tex>\Sigma</tex>. Поэтому, если известно, что <tex>L</tex> является языком в <tex>\Sigma</tex>, то можно утверждать, что <tex>L</tex> - это язык над любым алфавитом, содержащим <tex>\Sigma</tex>.
| |
− | | |
− | '''Операции над языками'''
| |
− | 1)
| |
− | * <tex>L \cup M</tex> - ''объединение''
| |
− | * <tex>L \cap M </tex> - ''пересечение''
| |
− | * <tex>L \setminus M</tex> - ''разность''
| |
− | | |
− | 2)
| |
− | ''Дополнение языка''
| |
− | <tex> \setminus L=L \varepsilon^* \setminus L</tex>
| |
− | | |
− | 3)
| |
− | ''Конкатенация''
| |
− | <tex>LM={\alpha\beta|\alpha \in L, \beta \in M}</tex>
| |
− | Если язык состоит из одного слова<tex>{\alpha}</tex>, то для упрощения записи его можно обозначить, как \alpha. Тогда можно определить L\alpha и L\eps
| |
− | | |
− | 4)
| |
− | ''Конкатенация с обратным словом''
| |
− | <tex>Lс^{-1}={\alpha|\alpha c \subset L}</tex>
| |
− | | |
− | 5)
| |
− | ''Замыкание Клини''
| |
− | <tex>L^*=\bigcup_{i=0}^{\infty}L^i</tex>
| |
− | <tex>L^i=LL^{i-1}</tex>
| |
− | | |
− | <tex>L^1=L</tex>
| |
− | | |
− | <tex>L^0={\varepsilon}</tex>
| |
− | | |
− | '''Пример''':
| |
− | <tex>L={a,ab}</tex>
| |
− | <tex>L^*={\varepsilon,a,ab,aa,aab,aba,abab,...}</tex>
| |