Изменения

Доказательство нерегулярности языков: лемма о разрастании

6261 байт добавлено, 09:24, 14 марта 2018

Нет описания правки

'''Лемма о разрастании'''~~<ref>Лемму также часто называют~~ (лемма о накачке, англ. ''~~леммой о накачке~~pumping lemma''~~.</ref>~~ ) — лемма, позволяющая во многих случаях проверить, является ли данный язык [[Регулярные языки: два определения и их эквивалентность|регулярным]].~~__TOC__~~== Лемма о разрастании ==

{{Лемма

|id= ==lemma==

[[Файл:Consp_lemma.png||left|240px|]] Пусть <tex>L</tex> — регулярный язык над алфавитом <tex>\Sigma</tex>. Поскольку [[Теорема Клини (совпадение классов автоматных и регулярных языков)|регулярный язык является автоматным]], то найдётся автомат <tex>A</tex>, допускающий язык <tex>L</tex>. Пусть <tex>n</tex> — размер автомата. Докажем, что <tex>n</tex> удовлетворяет условию леммы.

<br/>Возьмём произвольное слово <tex>\omega</tex> длины не меньше <tex>n</tex> из языка <tex>L</tex>. Рассмотрим переходы в автомате <tex>\langle s,\omega\rangle \vdash\langle u_1, \omega[0]^{-1}\omega\rangle\vdash\dots\vdash\langle u_{l},\varepsilon\rangle, \: l\geqslant n</tex>. Так как <tex>l</tex> не меньше количества состояний в автомате <tex>n</tex>, то в переходах будет совпадение. Пусть <tex>u_i</tex> и <tex>u_j</tex> — первое совпадение. Тогда, повторяя участок слова <tex>\omega</tex>, который отвечает за переход от <tex>u_i</tex> к <tex>u_j</tex>, получаем слово, допускаемое автоматом. То есть, если верно <tex>\langle s, xyz\rangle \vdash^*\langle u_i, yz\rangle\vdash^*\langle u_j, z\rangle\vdash^*\langle u_l, \varepsilon\rangle</tex>, то тогда верно <tex>\langle s, xy^kz\rangle \vdash^*\langle u_i, y^kz\rangle\vdash^*\langle u_j, y^{k-1}z\rangle\vdash^*\langle u_j, z\rangle\vdash^*\langle u_l, \varepsilon\rangle</tex>. Тогда автомат <tex>A</tex> допускает слово <tex>xy^kz</tex>, следовательно <tex>xy^kz</tex> принадлежит регулярному языку <tex>L</tex>.<br />

Наконец, поскольку <tex>u_i</tex> и <tex>u_j</tex> — первое совпадение, среди состояний <tex>s, u_1, \ldots, u_i, \ldots, u_{j-1}</tex> нет повторяющихся. Значит, выполняется требование <tex>|xy| \le leqslant n</tex>.

}}

'''Замечание.''' Условие леммы не является достаточным для регулярности языка. ''(См. [[#Пример ~~доказательства без использования леммы~~нерегулярного языка, для которого выполняется лемма о разрастании|пример 2]])'' == Лемма о разрастании в общем виде =={{Лемма|id= ==lemma==|about=о разрастании, о накачке в общем виде|statement=Если язык <tex>L</tex> является регулярным, то существует число <tex>n \geqslant 1</tex> такое что для любого слова <tex>uwv</tex> из языка <tex>L</tex>, где <tex>|w| \geqslant n</tex> может быть записано в форме <tex>uwv = uxyzv</tex>,где слова <tex>x</tex>, <tex>y</tex> и <tex>z</tex> такие, что <tex>|xy| \leqslant n</tex>, <tex>|y| \geqslant 1</tex> и <tex>uxy^izv</tex> принадлежит языку <tex>L</tex> для любого целого числа <tex>i \geqslant 0</tex>.|proof=Исходя из формулировки леммы в общем виде, стандартная версия леммы, которая описана выше, является особым случаем, в котором строки <tex>u</tex> и <tex>v</tex> пусты. Доказательство леммы в общем виде аналогично доказательству стандартной версии леммы, с тем отличием, что строки <tex>u</tex> и <tex>v</tex> теперь могут быть как не пусты, так и пусты. }}'''Замечание.''' Поскольку лемма в общем виде накладывает более жесткие требования на язык, то она может быть использована для доказательства нерегулярности многих других языков, таких как <tex> L =\{ a^mb^nc^n : m \geqslant 1 , n \geqslant 1 \}</tex>. == Использование леммы для доказательства нерегулярности языков == Для доказательства нерегулярности языка часто удобно использовать отрицание леммы о разрастании. Пусть <tex>L</tex> — язык над алфавитом <tex>\Sigma</tex>. Если для любого натурального <tex>n</tex> найдётся такое слово <tex>\omega</tex> из данного языка, что его длина будет не меньше <tex> n</tex> и при любом разбиении на три слова <tex>x,y,z</tex> такие, что <tex>y</tex> непустое и длина <tex>xy</tex> не больше <tex>n</tex>, существует такое <tex>k</tex>, что <tex>xy^kz \notin L</tex>, то язык <tex>L</tex> нерегулярный.

Рассмотрим такой подход на примере языка правильных скобочных последовательностей. Для фиксированного <tex>n</tex> предъявляем слово <tex>\omega=(^n)^n</tex>. Пусть <tex>\omega</tex> как-то разбили на <tex>x, y, z</tex>. Так как <tex>|xy|\leqslant n</tex>, то <tex>y= ~~Доказательства нерегулярности языков~~ (^b</tex>, где <tex>b > 0</tex>. Для любого такого разбиения берём <tex>k=2</tex> и получаем <tex>xy^kz=~~Для доказательства нерегулярности языка можно использовать свойства регулярных и автоматных языков~~(^{n+b})^n</tex>, что не является правильной скобочной последовательностью. Значит, язык правильных скобочных последовательностей нерегулярен.

~~Часто удобно использовать отрицание леммы~~ == Пример нерегулярного языка, для которого выполняется лемма о разрастании. Пусть <tex>L</tex> — язык над алфавитом <tex>\Sigma</tex>. Если для любого натурального <tex>n</tex> найдётся такое слово <tex>\omega</tex> из данного языка, что его длина будет не меньше <tex> n</tex> и при любом разбиении на три слова <tex>x,y,z</tex> такие, что <tex>y</tex> непустое и длина <tex>xy</tex> не больше <tex>n</tex>, существует такое <tex>k</tex>, что <tex>xy^kz \notin L</tex>, то язык <tex>L</tex> нерегулярный.===== Пример ~~доказательства с использованием~~ языка, удовлетворяющего стандартной версии леммы ===Рассмотрим следующий язык ~~правильных скобочных последовательностей. Для фиксированного <tex>n</tex> предъявляем слово~~ : <tex>L= \~~omega=(~~{ a^{i}b^n){j}c^~~n</tex>. Пусть <tex>~~{k} \mid i \~~omega</tex> как-то разбили на <tex>x~~ne 1, yj \geqslant 0, ~~z</tex>. Так как <tex>|xy|~~k \~~leqslant n</tex>, то <tex>y=(^b</tex>, где <tex>b >~~ geqslant 0~~</tex>. Для любого такого разбиения берём <tex>k=2</tex> и получаем <tex>xy~~\} \cup \{ ab^~~kz=(~~{i}c^{~~n+b~~i} \mid i \geqslant 1\}~~)^n~~</tex>, что не является правильной скобочной последовательностью. Значит, язык правильных скобочных последовательностей нерегулярен.

~~=== Пример доказательства без использования леммы ===~~'''Докажем ~~нерегулярность языка~~ , что он нерегулярный.''' Для этого рассмотрим вспомогательный язык <tex>0L'= \{ ab^~~a 1~~{i}c^~~b 2^b, a~~ {i} \mid i \geqslant 1~~, b~~ \~~geqslant 0~~}</tex> и докажем его нерегулярность. Воспользуемся предложенным в предыдущем пункте подходом. Для фиксированного <tex>n</tex> выберем слово <tex>\omega=ab^nc^n</tex>. Заметим, что ~~здесь условие леммы о накачке выполнено~~ при любом разбиении <tex>\omega</tex> на <tex>~~(n = 1~~x, ~~x = \varepsilon~~y, z</tex> слово <tex> y ~~= 0~~</tex> не пусто (по условию леммы)и содержит только символы <tex> a </tex> и <tex> b </tex>(согласно выбранному слову и условию из леммы <tex>|xy|\leqslant n</tex>). ~~{{TODO|t=предыдущее утверждение — неправда~~Это означает, ~~возьмем~~ что при <tex>k=0</tex> слово <tex>xy^kz</tex> либо не содержит символа <tex> a </tex>, ~~получим~~ либо количество символов <tex>~~1^b2^~~b</tex> меньше <tex> n </tex>. В обоих случаях полученное слово не ~~в языке}}~~принадлежит языку. Значит язык <tex> L' </tex> нерегулярный.

Предположим, что язык <tex> L </tex> регулярный. Заметим, что <tex>L' = L \cap \{ab^{*}c^{*}\} </tex>. В силу того, что пересечение регулярных языков регулярно, имеем в правой части равенства регулярный язык. При этом в левой части стоит язык, нерегулярность которого была доказана ранее. Значит наше предположение неверно, и язык <tex> L </tex> нерегулярный. '''Докажем ~~нерегулярность языка с помощью свойств ДКА~~, что язык удовлетворяет лемме о разрастании.''' Выберем в лемме <tex> n = 2 </tex>. ~~Пусть для языка существует автомат~~ Это означает, что длина рассматриваемых слов не меньше <tex>A2 </tex> c (иными словами <tex>i + j + k\geqslant 2 \,</tex> ~~состояниями~~). ~~Пусть после~~ Для каждого случая значений <tex> i, j, k </tex>aвыберем соответствующие слова <tex> x, y </tex> ~~нулей на вход поступило~~ и <tex>kz </tex> ~~единиц~~из леммы. ~~При помощи рассуждений~~Легко проверить, ~~аналогичных приведенным~~ что в ~~доказательстве~~ каждом из приведенных ниже случаев условие леммывыполняется: # <tex> i = 0, ~~получаем~~j = 0, ~~что с момента завершения считывания нулей до последнего считывания единицы автомат посетит~~ k \geqslant 2 </tex>. Слово имеет вид <tex>\omega=c^k</tex>. Выберем <tex>x = \varepsilon, y = c, z = c^{k + -1}</tex> ~~состояние~~.# <tex> i = 0, j \geqslant 1, тk \geqslant 0 </tex>. еСлово имеет вид <tex>\omega=b^jc^k</tex>. ~~хотя бы в одном из них он окажется дважды~~Выберем <tex> x = \varepsilon, y = b, z = b^{j-1}c^k</tex>. ~~Пусть при первом посещении этого состояния автомат считал~~ # <tex>i= 1, j \geqslant 1, j = k </tex>. Слово имеет вид <tex>\omega=ab^jc^j</tex> ~~единиц~~. Выберем <tex> x = \varepsilon, y = a, ~~при втором —~~ z = b^jc^j</tex>.# <tex>i = 2, j\geqslant 1, k \geqslant 1 </tex>. ~~Поскольку~~ Слово имеет вид <tex>\omega=aab^jc^k</tex>. Выберем <tex>0x = \varepsilon, y = aa, z = b^jc^a k</tex>.# <tex> i \geqslant 3, j \geqslant 1, k \geqslant 1</tex>. Слово имеет вид <tex>\omega=aaaa^{i 2-3}b^jc^k</tex>. Выберем <tex> x = \varepsilon, y = a, z = aaa^{i-3}b^jc^k</tex> ~~принимается автоматом~~. '''Таким образом''', а язык <tex>L </tex> удовлетворяет второй части леммы и при этом является нерегулярным, что доказывает тот факт, что лемма о разрастании '''не''' является достаточным для регулярности языка. ===Пример языка, удовлетворяющего лемме в общем виде===Рассмотрим другой пример. <tex>L_1 = \{ uvwxy \mid u, y \in \{ 0,1 ,2,3 \}^a * \wedge v,w,x \in \{ 0,1,2,3 \} \wedge ( v = w \vee v = x \vee x =w) \}</tex> <tex>L_2 = \{ w \mid w \in \{ 0,1^j ,2,3 \}^i* \wedge</tex> <tex>\dfrac{1}{7}</tex> из символов слова <tex>w</tex> является символом <tex>3 \} </tex> <tex>L = L_1 \cup L_2</tex> '''Докажем, что он нерегулярный.''' Предположим, что некоторая строка языка <tex>L</tex> имеет длину <tex>n=5</tex> ~~— не принимается~~. Поскольку в алфавите всего четыре символа, то ~~при подаче автомату~~как минимум два символа из пяти в этой строке будут одинаковыми, и они разделены максимум тремя символами::Если дубликаты разделены нулями или единицами, ~~находящемуся~~ накачаем один из двух остальных символов в ~~этом состоянии~~строке, которые не повлияют на подстроку, которая содержит дубликаты.:Если дубликаты разделены двойками или тройками, накачаем <tex>2</tex> символа, разделяющих их. Накачка также уменьшает или увеличивает результат во время создания подстроки размера <tex>i3</tex> ~~двоек~~, ~~автомат~~которая содержит <tex>2</tex> продублированных символа.Второе условие языка <tex>L</tex> обеспечивает, ~~с одной стороны~~что <tex>L</tex> — нерегулярный, ~~должен оказаться~~ то есть в ~~допускающем состоянии~~нем бесконечное число строк, ~~с другой —~~ которые принадлежат <tex>L</tex>, но не могут быть получены путям разрастания некоторой меньшей строки в ~~недопускающем~~<tex>L</tex>.

== См. также ==

* [[Лемма о разрастании для КС-грамматик]]

* [[~~Интерпретация булевых формул~~ Булевые формулы с кванторами как ~~игр~~ игры для двух игроков]] == ~~Примечания~~ Источники информации ==~~<references~~* [http://>~~== Литература ==~~en.wikipedia.org/wiki/Pumping_lemma_for_regular_languages Wikipedia — Pumping lemma for regular languages]* ''Хопкрофт Д., Мотвани Р., Ульман Д.'' — Введение в теорию автоматов, языков и вычислений, 2-е изд. : Пер. с англ. — М.:Издательский дом «Вильямс», 2002. — С. 144. — ISBN 5-8459-0261-4

[[Категория: Теория формальных языков]]

[[Категория: Автоматы и регулярные языки]]

[[Категория: Свойства конечных автоматов]]

Анонимный участник

94.19.239.249

Изменения

Доказательство нерегулярности языков: лемма о разрастании

Навигация

Персональные инструменты

Пространства имён

Варианты

Просмотры

Ещё

Поиск

Навигация

Инструменты