Основные определения: алфавит, слово, язык, конкатенация, свободный моноид слов; операции над языками

Материал из Викиконспекты
Перейти к: навигация, поиск
Определение:
Алфавит — конечное непустое множество символов. Условимся обозначать алфавит символом [math]\Sigma[/math].

Наиболее часто используются следующие алфавиты:

  1. [math]\Sigma=\{0, 1\}[/math] — бинарный или двоичный алфавит.
  2. [math]\Sigma=\{a, b, ...,z\}[/math] — множество строчных букв английского алфавита.
Определение:
Слово (цепочка) — это конечная последовательность символов некоторого алфавита.


Определение:
Пустая цепочка — цепочка, не содержащая ни одного символа. Эту цепочку, обозначаемую [math] \varepsilon [/math], можно рассматривать как цепочку в любом алфавите.


Определение:
Длина цепочки — число символов в цепочке. Длину некоторой цепочки [math]w[/math] обычно обозначают [math]|w|[/math].


Определение:
Степени алфавита Если [math]\Sigma[/math] — некоторый алфавит, то можно выразить множество всех цепочек определенной длины, состоящих из символов данного алфавита, используя знак степени. Определим [math]\Sigma^k[/math] как множество всех цепочек длины [math]k[/math], состоящих из символов алфавита [math]\Sigma[/math]. Множество всех цепочек над алфавитом [math]\Sigma[/math] принято обозначать [math]\Sigma^*[/math], то есть [math]\Sigma^*=\{\Sigma^0, \Sigma^1, \Sigma^2, ...\}[/math].


Определение:
Конкатенация слов Пусть [math]x[/math] и [math]y[/math] — цепочки. Тогда [math]xy[/math] обозначает их конкатенацию, т.е. цепочку, в которой последовательно записаны цепочки x и y.


Свойства

  • Ассоциотивность [math](\alpha\beta)\gamma=\alpha(\beta\gamma)[/math]
  • [math]\exists \varepsilon [/math] (нейтральный элемент) такой, что [math]\alpha\varepsilon=\varepsilon\alpha=\alpha[/math]

Таким образом мы получаем свободный моноид слов.


Определение:
Слово [math]\alpha[/math] является префиксом [math]\beta[/math], если [math]\exists \gamma : \beta = \alpha\gamma[/math].


Определение:
Слово [math]\alpha[/math] является суффиксом [math]\beta[/math], если [math]\exists \gamma : \beta = \gamma\alpha[/math].


Определение:
Слово [math]\alpha[/math] является подстрокой [math]\beta[/math], если [math]\exists \gamma, \delta : \beta = \gamma\alpha\delta[/math].



Определение:
Язык — множество цепочек, каждая из которых принадлежит [math]\Sigma^*[/math], где [math]\Sigma[/math] — некоторый фиксированный алфавит.


Если [math]\Sigma[/math] — алфавит и [math]L \subseteq \Sigma^*[/math], то [math]L[/math] — это язык над [math]\Sigma[/math], или в [math]\Sigma[/math]. Отметим, что язык в [math]\Sigma[/math] не обязательно должен содержать цепочки, в которые входят все символы [math]\Sigma[/math]. Поэтому, если известно, что [math]L[/math] является языком в [math]\Sigma[/math], то можно утверждать, что [math]L[/math] — это язык над любым алфавитом, содержащим [math]\Sigma[/math].