Регулярные языки: два определения и их эквивалентность — различия между версиями

Материал из Викиконспекты
Перейти к: навигация, поиск
Строка 1: Строка 1:
 
== Регулярные языки: два определения и их эквивалентность ==
 
== Регулярные языки: два определения и их эквивалентность ==
 
{{Определение
 
{{Определение
|id = Reg1
+
|id = REG1
 
|definition =
 
|definition =
'''Множество регулярных языков''' <tex>\mathrm{Reg}</tex> над алфавитом <tex> \Sigma = \left\{c_1, c_2, \ldots, c_k \right\} </tex> {{---}} множество, которое может быть получено из языков, каждый из которых содержит единственное слово {{---}} <tex>c_i</tex> или <tex>\varepsilon</tex>, и пустого языка при помощи последовательных применений операций объединения, конкатенации или замыкания Клини и никаких других, то есть:
+
'''Множество регулярных языков''' <tex>\mathrm{REG}</tex> над алфавитом <tex> \Sigma = \left\{c_1, c_2, \ldots, c_k \right\} </tex> {{---}} множество, которое может быть получено из языков, каждый из которых содержит единственное слово {{---}} <tex>c_i</tex> или <tex>\varepsilon</tex>, и пустого языка при помощи последовательных применений операций объединения, конкатенации или замыкания Клини и никаких других, то есть:
 
* Определим регулярные языки нулевого уровня как <tex> \mathrm{R_0}=\left\{\varnothing, \left\{\varepsilon \right\}, \left\{c_1 \right\}, \left\{c_2 \right\} , \ldots, \left\{c_k \right\} \right\} </tex>.
 
* Определим регулярные языки нулевого уровня как <tex> \mathrm{R_0}=\left\{\varnothing, \left\{\varepsilon \right\}, \left\{c_1 \right\}, \left\{c_2 \right\} , \ldots, \left\{c_k \right\} \right\} </tex>.
 
* Регулярные языки ненулевого уровня определим рекуррентным соотношением: <tex> \mathrm{R_{i+1}} = \mathrm{R_i} \cup \left\{L_1 \cup L_2, L_1L_2, L_1^* | L_1, L_2 \in \mathrm{R_i}\right\} </tex>.
 
* Регулярные языки ненулевого уровня определим рекуррентным соотношением: <tex> \mathrm{R_{i+1}} = \mathrm{R_i} \cup \left\{L_1 \cup L_2, L_1L_2, L_1^* | L_1, L_2 \in \mathrm{R_i}\right\} </tex>.
* Тогда <tex>\mathrm{Reg} = \bigcup\limits_{i=0}^{\infty}\mathrm{R_i}</tex>.
+
* Тогда <tex>\mathrm{REG} = \bigcup\limits_{i=0}^{\infty}\mathrm{R_i}</tex>.
 
}}
 
}}
  
Строка 27: Строка 27:
  
 
{{Определение
 
{{Определение
|id = Reg2
+
|id = REG2
 
|definition =
 
|definition =
 
Пусть задан алфавит <tex> \Sigma = \left\{c_1, c_2, \ldots ,c_k \right\} </tex>.
 
Пусть задан алфавит <tex> \Sigma = \left\{c_1, c_2, \ldots ,c_k \right\} </tex>.
Строка 34: Строка 34:
 
#<tex>\mathrm{R_0} \subset \mathrm{R}</tex>, где <tex>\mathrm{R_0}=\left\{\varnothing, \left\{\varepsilon \right\}, \left\{c_1 \right\}, \left\{c_2 \right\}, \ldots, \left\{c_k \right\} \right\}</tex>,
 
#<tex>\mathrm{R_0} \subset \mathrm{R}</tex>, где <tex>\mathrm{R_0}=\left\{\varnothing, \left\{\varepsilon \right\}, \left\{c_1 \right\}, \left\{c_2 \right\}, \ldots, \left\{c_k \right\} \right\}</tex>,
 
#<tex> L_1, L_2 \in \mathrm{R} \Rightarrow L_1 \cup L_2 \in \mathrm{R}, L_1L_2 \in \mathrm{R}, L_1^* \in \mathrm{R}</tex>.
 
#<tex> L_1, L_2 \in \mathrm{R} \Rightarrow L_1 \cup L_2 \in \mathrm{R}, L_1L_2 \in \mathrm{R}, L_1^* \in \mathrm{R}</tex>.
Семейство всех надрегулярных множеств обозначим <tex> \mathrm{REG} </tex>.
 
  
Тогда '''множеством регулярных языков''' <tex> \mathrm{Reg'} </tex> над алфавитом <tex> \Sigma = \left\{c_1, c_2, ... ,c_k \right\} </tex> называется пересечение всех надрегулярных множеств: <tex> \mathrm{Reg'}=\bigcap\limits_{\mathrm{R} \in \mathrm{REG}}\mathrm{R} </tex>.
+
Тогда '''множеством регулярных языков''' <tex> \mathrm{REG'} </tex> над алфавитом <tex> \Sigma = \left\{c_1, c_2, ... ,c_k \right\} </tex> называется пересечение всех надрегулярных множеств.
 
}}
 
}}
  
 
{{Теорема
 
{{Теорема
 
|statement=
 
|statement=
Определения множеств [[#Reg1 | <tex>\mathrm{Reg}</tex>]] и [[#Reg2 | <tex>\mathrm{Reg'}</tex>]] эквивалентны.
+
Классы языков [[#REG1 | <tex>\mathrm{REG}</tex>]] и [[#REG2 | <tex>\mathrm{REG'}</tex>]] над одинаковым алфавитом совпадают.
 
|proof=
 
|proof=
Докажем, что <tex>\mathrm{Reg} \subseteq \mathrm{Reg'}</tex> и <tex>\mathrm{Reg'} \subseteq \mathrm{Reg}</tex>.
+
Докажем, что <tex>\mathrm{REG} \subseteq \mathrm{REG'}</tex> и <tex>\mathrm{REG'} \subseteq \mathrm{REG}</tex>.
  
*'''<tex>\mathrm{Reg} \subseteq \mathrm{Reg'}</tex>'''
+
*'''<tex>\mathrm{REG} \subseteq \mathrm{REG'}</tex>'''
По определению <tex>\mathrm{Reg} = \bigcup\limits_{i=0}^{\infty}\mathrm{R_i}</tex>. Покажем, что <tex>\bigcup\limits_{i=0}^{\infty}\mathrm{R_i} \subseteq \mathrm{R}</tex>,  где <tex>\mathrm{R}</tex> {{---}} любое надрегулярное множество. Для этого докажем по индукции по <tex>i</tex>, что <tex>\mathrm{R_i} \subseteq \mathrm{R}</tex> для любого <tex>i</tex>.
+
По определению <tex>\mathrm{REG} = \bigcup\limits_{i=0}^{\infty}\mathrm{R_i}</tex>. Покажем, что <tex>\bigcup\limits_{i=0}^{\infty}\mathrm{R_i} \subseteq \mathrm{R}</tex>,  где <tex>\mathrm{R}</tex> {{---}} любое надрегулярное множество. Для этого докажем по индукции по <tex>i</tex>, что <tex>\mathrm{R_i} \subseteq \mathrm{R}</tex> для любого <tex>i</tex>.
 
# База: <tex>i = 0</tex>.
 
# База: <tex>i = 0</tex>.
 
#: <tex>\mathrm{R_0} \subseteq \mathrm{R}</tex> по определению надрегулярного множества.
 
#: <tex>\mathrm{R_0} \subseteq \mathrm{R}</tex> по определению надрегулярного множества.
 
# Переход: известно, что <tex>\mathrm{R_i} \subseteq \mathrm{R}</tex>, докажем, что <tex>\mathrm{R_{i + 1}} \subseteq \mathrm{R}</tex>.
 
# Переход: известно, что <tex>\mathrm{R_i} \subseteq \mathrm{R}</tex>, докажем, что <tex>\mathrm{R_{i + 1}} \subseteq \mathrm{R}</tex>.
 
#: По определению надрегулярного множества для любых <tex>L_1, L_2 \in \mathrm{R_i} \subseteq \mathrm{R}</tex> верны утверждения: <tex>L_1 \cup L_2 \in \mathrm{R}, L_1L_2 \in \mathrm{R}, L_1^* \in \mathrm{R}</tex>. То есть: <tex>\left\{L_1 \cup L_2, L_1L_2, L_1^* | L_1, L_2 \in \mathrm{R_i}\right\} \subseteq \mathrm{R}</tex>. Вспоминая [[#Reg1 | определение]] <tex>\mathrm{R_{i + 1}}</tex> и предположение индукции (<tex>\mathrm{R_i} \subseteq \mathrm{R}</tex>), получаем, что <tex>\mathrm{R_{i + 1}} \subseteq \mathrm{R}</tex>.
 
#: По определению надрегулярного множества для любых <tex>L_1, L_2 \in \mathrm{R_i} \subseteq \mathrm{R}</tex> верны утверждения: <tex>L_1 \cup L_2 \in \mathrm{R}, L_1L_2 \in \mathrm{R}, L_1^* \in \mathrm{R}</tex>. То есть: <tex>\left\{L_1 \cup L_2, L_1L_2, L_1^* | L_1, L_2 \in \mathrm{R_i}\right\} \subseteq \mathrm{R}</tex>. Вспоминая [[#Reg1 | определение]] <tex>\mathrm{R_{i + 1}}</tex> и предположение индукции (<tex>\mathrm{R_i} \subseteq \mathrm{R}</tex>), получаем, что <tex>\mathrm{R_{i + 1}} \subseteq \mathrm{R}</tex>.
Так как <tex>\mathrm{Reg} \subseteq R</tex> для любого надрегулярного множества <tex>R</tex>, получаем, что <tex> \mathrm{Reg} \subseteq \mathrm{Reg'} </tex>.
+
Так как <tex>\mathrm{REG} \subseteq R</tex> для любого надрегулярного множества <tex>R</tex>, получаем, что <tex> \mathrm{REG} \subseteq \mathrm{REG'} </tex>.
  
*'''<tex> \mathrm{Reg'} \subseteq \mathrm{Reg} </tex>'''
+
*'''<tex> \mathrm{REG'} \subseteq \mathrm{REG} </tex>'''
Докажем, что <tex> \mathrm{Reg} </tex> является надрегулярным множеством. Для этого проверим, выполняются ли свойства надрегулярного множества на нём:  
+
Докажем, что <tex> \mathrm{REG} </tex> является надрегулярным множеством. Для этого проверим, выполняются ли свойства надрегулярного множества на нём:  
# <tex> \mathrm{R_0}\subseteq \mathrm{Reg} </tex> {{---}} выполнено (по определению <tex> \mathrm{Reg} </tex>).
+
# <tex> \mathrm{R_0}\subseteq \mathrm{REG} </tex> {{---}} выполнено (по определению <tex> \mathrm{REG} </tex>).
# Рассмотрим <tex> L_1, L_2 \in \mathrm{Reg} </tex>. Так как <tex> \mathrm{Reg} = \bigcup\limits_{i=0}^{\infty}\mathrm{R_i}</tex>, то найдутся такие индексы <tex>i</tex> и <tex>j</tex>, что <tex>L_1 \in \mathrm{R_i}</tex> и <tex>L_2 \in \mathrm{R_j}</tex>. Тогда из определения <tex> \mathrm{Reg} </tex> следует, что <tex> L_1L_2 \in \mathrm{R_{max(i, j) + 1}}, L_1 \cup L_2\in \mathrm{R_{max(i, j) + 1}}, L_1^* \in \mathrm{R_{i + 1}}</tex>. Так как <tex> \mathrm{Reg} = \bigcup\limits_{i=0}^{\infty}R_i</tex>, то получаем, что <tex> L_1L_2 \in \mathrm{Reg}, L_1 \cup L_2\in \mathrm{Reg}, L_1^* \in \mathrm{Reg} </tex>. Следовательно, второе свойство также выполнено.
+
# Рассмотрим <tex> L_1, L_2 \in \mathrm{REG} </tex>. Так как <tex> \mathrm{REG} = \bigcup\limits_{i=0}^{\infty}\mathrm{R_i}</tex>, то найдутся такие индексы <tex>i</tex> и <tex>j</tex>, что <tex>L_1 \in \mathrm{R_i}</tex> и <tex>L_2 \in \mathrm{R_j}</tex>. Тогда из определения <tex> \mathrm{REG} </tex> следует, что <tex> L_1L_2 \in \mathrm{R_{max(i, j) + 1}}, L_1 \cup L_2\in \mathrm{R_{max(i, j) + 1}}, L_1^* \in \mathrm{R_{i + 1}}</tex>. Так как <tex> \mathrm{REG} = \bigcup\limits_{i=0}^{\infty}R_i</tex>, то получаем, что <tex> L_1L_2 \in \mathrm{REG}, L_1 \cup L_2\in \mathrm{REG}, L_1^* \in \mathrm{REG} </tex>. Следовательно, второе свойство также выполнено.
Значит, <tex> \mathrm{Reg} </tex> {{---}} надрегулярное множество. А так как <tex> \mathrm{Reg'}=\bigcap\limits_{\mathrm{R} \in \mathrm{REG}}\mathrm{R}</tex>, то <tex> \mathrm{Reg'} \subseteq \mathrm{Reg} </tex>.
+
Значит, <tex> \mathrm{REG} </tex> {{---}} надрегулярное множество. А так как <tex> \mathrm{REG'}</tex> является пересечением всех надрегулярных множеств, то <tex> \mathrm{REG'} \subseteq \mathrm{REG} </tex>.
 
}}
 
}}
  
 
[[Категория: Теория формальных языков]]
 
[[Категория: Теория формальных языков]]
 
[[Категория: Автоматы и регулярные языки]]
 
[[Категория: Автоматы и регулярные языки]]

Версия 11:58, 21 октября 2013

Регулярные языки: два определения и их эквивалентность

Определение:
Множество регулярных языков [math]\mathrm{REG}[/math] над алфавитом [math] \Sigma = \left\{c_1, c_2, \ldots, c_k \right\} [/math] — множество, которое может быть получено из языков, каждый из которых содержит единственное слово — [math]c_i[/math] или [math]\varepsilon[/math], и пустого языка при помощи последовательных применений операций объединения, конкатенации или замыкания Клини и никаких других, то есть:
  • Определим регулярные языки нулевого уровня как [math] \mathrm{R_0}=\left\{\varnothing, \left\{\varepsilon \right\}, \left\{c_1 \right\}, \left\{c_2 \right\} , \ldots, \left\{c_k \right\} \right\} [/math].
  • Регулярные языки ненулевого уровня определим рекуррентным соотношением: [math] \mathrm{R_{i+1}} = \mathrm{R_i} \cup \left\{L_1 \cup L_2, L_1L_2, L_1^* | L_1, L_2 \in \mathrm{R_i}\right\} [/math].
  • Тогда [math]\mathrm{REG} = \bigcup\limits_{i=0}^{\infty}\mathrm{R_i}[/math].


Определение:
Регулярное выражение над алфавитом [math] \Sigma = \left\{c_1, c_2, \ldots ,c_k \right\} [/math] — способ порождения языка над [math]\Sigma[/math]. Определяется рекурсивно следующим образом:
  • Для любого [math]i[/math] слово [math]c_i[/math] является регулярным выражением, задающим язык из одного слова [math]c_i[/math].
  • [math]\varepsilon[/math] является регулярным выражением, задающим язык из одной пустой строки, а [math]\varnothing[/math] — пустой язык.
  • Если [math]\alpha_1[/math] и [math]\alpha_2[/math] являются регулярными выражениями, задающими языки [math]L_1[/math] и [math]L_2[/math] соответственно, то [math](\alpha_1)|(\alpha_2)[/math] — регулярное выражение, задающее [math]L_1 \bigcup L_2[/math].
  • Если [math]\alpha_1[/math] и [math]\alpha_2[/math] являются регулярными выражениями, задающими языки [math]L_1[/math] и [math]L_2[/math] соответственно, то [math](\alpha_1)(\alpha_2)[/math] — регулярное выражение, задающее [math]L_1L_2[/math].
  • Если [math]\alpha_1[/math] является регулярным выражением, задающим язык [math]L_1[/math], то [math](\alpha_1)^*[/math] — регулярное выражение, задающее [math]L_1^*[/math].
  • Операции указаны в порядке возрастания приоритета, при этом скобки повышают приоритет аналогично арифметическим выражениям.


Утверждение:
По построению очевидно, что множество языков, порождаемых регулярными выражениями, совпадает со множеством регулярных языков.


Определение:
Пусть задан алфавит [math] \Sigma = \left\{c_1, c_2, \ldots ,c_k \right\} [/math].

Множество [math]\mathrm{R}[/math] будем называть надрегулярным, если:

  1. [math]\mathrm{R_0} \subset \mathrm{R}[/math], где [math]\mathrm{R_0}=\left\{\varnothing, \left\{\varepsilon \right\}, \left\{c_1 \right\}, \left\{c_2 \right\}, \ldots, \left\{c_k \right\} \right\}[/math],
  2. [math] L_1, L_2 \in \mathrm{R} \Rightarrow L_1 \cup L_2 \in \mathrm{R}, L_1L_2 \in \mathrm{R}, L_1^* \in \mathrm{R}[/math].
Тогда множеством регулярных языков [math] \mathrm{REG'} [/math] над алфавитом [math] \Sigma = \left\{c_1, c_2, ... ,c_k \right\} [/math] называется пересечение всех надрегулярных множеств.


Теорема:
Классы языков [math]\mathrm{REG}[/math] и [math]\mathrm{REG'}[/math] над одинаковым алфавитом совпадают.
Доказательство:
[math]\triangleright[/math]

Докажем, что [math]\mathrm{REG} \subseteq \mathrm{REG'}[/math] и [math]\mathrm{REG'} \subseteq \mathrm{REG}[/math].

  • [math]\mathrm{REG} \subseteq \mathrm{REG'}[/math]

По определению [math]\mathrm{REG} = \bigcup\limits_{i=0}^{\infty}\mathrm{R_i}[/math]. Покажем, что [math]\bigcup\limits_{i=0}^{\infty}\mathrm{R_i} \subseteq \mathrm{R}[/math], где [math]\mathrm{R}[/math] — любое надрегулярное множество. Для этого докажем по индукции по [math]i[/math], что [math]\mathrm{R_i} \subseteq \mathrm{R}[/math] для любого [math]i[/math].

  1. База: [math]i = 0[/math].
    [math]\mathrm{R_0} \subseteq \mathrm{R}[/math] по определению надрегулярного множества.
  2. Переход: известно, что [math]\mathrm{R_i} \subseteq \mathrm{R}[/math], докажем, что [math]\mathrm{R_{i + 1}} \subseteq \mathrm{R}[/math].
    По определению надрегулярного множества для любых [math]L_1, L_2 \in \mathrm{R_i} \subseteq \mathrm{R}[/math] верны утверждения: [math]L_1 \cup L_2 \in \mathrm{R}, L_1L_2 \in \mathrm{R}, L_1^* \in \mathrm{R}[/math]. То есть: [math]\left\{L_1 \cup L_2, L_1L_2, L_1^* | L_1, L_2 \in \mathrm{R_i}\right\} \subseteq \mathrm{R}[/math]. Вспоминая определение [math]\mathrm{R_{i + 1}}[/math] и предположение индукции ([math]\mathrm{R_i} \subseteq \mathrm{R}[/math]), получаем, что [math]\mathrm{R_{i + 1}} \subseteq \mathrm{R}[/math].

Так как [math]\mathrm{REG} \subseteq R[/math] для любого надрегулярного множества [math]R[/math], получаем, что [math] \mathrm{REG} \subseteq \mathrm{REG'} [/math].

  • [math] \mathrm{REG'} \subseteq \mathrm{REG} [/math]

Докажем, что [math] \mathrm{REG} [/math] является надрегулярным множеством. Для этого проверим, выполняются ли свойства надрегулярного множества на нём:

  1. [math] \mathrm{R_0}\subseteq \mathrm{REG} [/math] — выполнено (по определению [math] \mathrm{REG} [/math]).
  2. Рассмотрим [math] L_1, L_2 \in \mathrm{REG} [/math]. Так как [math] \mathrm{REG} = \bigcup\limits_{i=0}^{\infty}\mathrm{R_i}[/math], то найдутся такие индексы [math]i[/math] и [math]j[/math], что [math]L_1 \in \mathrm{R_i}[/math] и [math]L_2 \in \mathrm{R_j}[/math]. Тогда из определения [math] \mathrm{REG} [/math] следует, что [math] L_1L_2 \in \mathrm{R_{max(i, j) + 1}}, L_1 \cup L_2\in \mathrm{R_{max(i, j) + 1}}, L_1^* \in \mathrm{R_{i + 1}}[/math]. Так как [math] \mathrm{REG} = \bigcup\limits_{i=0}^{\infty}R_i[/math], то получаем, что [math] L_1L_2 \in \mathrm{REG}, L_1 \cup L_2\in \mathrm{REG}, L_1^* \in \mathrm{REG} [/math]. Следовательно, второе свойство также выполнено.
Значит, [math] \mathrm{REG} [/math] — надрегулярное множество. А так как [math] \mathrm{REG'}[/math] является пересечением всех надрегулярных множеств, то [math] \mathrm{REG'} \subseteq \mathrm{REG} [/math].
[math]\triangleleft[/math]