Основные определения: алфавит, слово, язык, конкатенация, свободный моноид слов; операции над языками

Материал из Викиконспекты
Перейти к: навигация, поиск

Алфавит и Слово

Алфавит - конечное непустое множество символов. Условимся обозначать алфавиты символом [math]\Sigma[/math].

Слово, или цепочка - это конечная последовательность символов некоторого алфавита. Например, 01101 - это цепочка в бинарном алфавите [math]\Sigma = {0,1}[/math]. Цепочка 111 это тоже цепочка в этом алфавите. Пустая цепочка - это цепочка, не содержащая ни одного символа. Эту цепочку обозначаемую [math] \varepsilon [/math], можно рассматривать как цепочку в любом алфавите. Длина цепочки - число позиций для символов в цепочке. Степени алфавита Если [math]\Sigma[/math] - некоторый алфавит, то можно выразить множество всех цепочек определенной длины, состоящих из символов данного алфавита, используя знак степени. Определим [math]\Sigma^k[/math], как множество всех цепочек длины k, состоящих из символов алфавита [math]\Sigma[/math].

Конкатенация слов Пусть x и y - цепочки. Тогда xy обозначает их конкатенацию (соединение), т.е. цепочку, в которой последовательно записаны цепочки x и y.

Свойства

  • Ассоциотивность [math](\alpha\beta)\gamma=\alpha(\beta\gamma)[/math]
  • [math]\exists [/math] нейтральный элемент [math]\alpha\varepsilon=\varepsilon\alpha=\alpha[/math]

Таким образом мы получаемсвободный моноид слов.

Слово [math]\alpha[/math] является префиксом [math]\beta[/math], если [math]\beta = \alpha\gamma[/math] для некоторого [math]\gamma[/math].

Слово [math]\alpha[/math] является суффиксом [math]\beta[/math], если [math]\beta = \gamma\alpha[/math] для некоторого [math]\gamma[/math].

Слово [math]\alpha[/math] является подстрокой [math]\beta[/math], если [math]\beta = \gamma\alpha\delta[/math] для некоторого [math]\gamma[/math], [math]\delta[/math].

([math]\gamma\lt \tex\gt , \lt tex\gt \delta\lt \tex\gt могут быть пустыми) ==Язык== '''Язык''' - множество строчек, каждая из которых принадлежит \lt tex\gt \Sigma^*[/math], где [math]\Sigma[/math] - некоторый фиксированный алфавит. Если [math]\Sigma[/math] - алфавит, и [math]\L \subseteq Sigma^*[/math], то [math]L[/math] - это язык над [math]\Sigma[/math], или в [math]\Sigma[/math]. Отметим, что язык в [math]\Sigma[/math] не обязательно должен содержать цепочка, в которые входят все символы [math]\Sigma[/math]. Поэтому, если известно, что [math]L[/math] является языком в [math]\Sigma[/math], то можно утверждать, что [math]L[/math] - это язык над любым алфавитом, содержащим [math]\Sigma[/math].

Операции над языками 1)

  • [math]L \cup M[/math] - объединение
  • [math]L \cap M [/math] - пересечение
  • [math]L \setminus M[/math] - разность

2) Дополнение языка [math] \setminus L=L \varepsilon^* \setminus L[/math]

3) Конкатенация [math]LM=\left\{\alpha\beta|\alpha \in L, \beta \in M\right\}[/math] Если язык состоит из одного слова[math]{\alpha}[/math], то для упрощения записи его можно обозначить, как \alpha. Тогда можно определить L\alpha и L\eps

4) Конкатенация с обратным словом [math]Lс^{-1}=\left\{\alpha|\alpha c \subset L\right\}[/math]

5) Замыкание Клини [math]L^*=\bigcup_{i=0}^{\infty}L^i[/math] [math]L^i=LL^{i-1}[/math]

[math]L^1=L[/math]

[math]L^0=\left\{\varepsilon\right\}[/math]

Пример: [math]L=\left\{a,ab\right\}[/math] [math]L^*=\left\{\varepsilon,a,ab,aa,aab,aba,abab,...\right\}[/math]