Доказательство нерегулярности языков: лемма о разрастании

Лемма о разрастании (лемма о накачке, англ. pumping lemma) — лемма, позволяющая во многих случаях проверить, является ли данный язык регулярным.

Содержание

1 Лемма о разрастании
2 Лемма о разрастании в общем виде
3 Использование леммы для доказательства нерегулярности языков
4 Пример нерегулярного языка, для которого выполняется лемма о разрастании
- 4.1 Пример языка, удовлетворяющего стандартной версии леммы
- 4.2 Пример языка, удовлетворяющего лемме в общем виде
5 См. также
6 Источники информации

Лемма о разрастании

Лемма (о разрастании, о накачке):

Пусть — регулярный язык над алфавитом , тогда существует такое , что для любого слова длины не меньше найдутся слова , для которых верно: и .

Доказательство:

Пусть — регулярный язык над алфавитом . Поскольку регулярный язык является автоматным, то найдётся автомат , допускающий язык . Пусть — размер автомата. Докажем, что удовлетворяет условию леммы.

Возьмём произвольное слово [math]\omega[/math] длины не меньше [math]n[/math] из языка [math]L[/math]. Рассмотрим переходы в автомате . Так как [math]l[/math] не меньше количества состояний в автомате [math]n[/math], то в переходах будет совпадение. Пусть [math]u_i[/math] и [math]u_j[/math] — первое совпадение. Тогда, повторяя участок слова [math]\omega[/math], который отвечает за переход от [math]u_i[/math] к [math]u_j[/math], получаем слово, допускаемое автоматом. То есть, если верно , то тогда верно . Тогда автомат [math]A[/math] допускает слово [math]xy^kz[/math], следовательно [math]xy^kz[/math] принадлежит регулярному языку [math]L[/math].

Наконец, поскольку и — первое совпадение, среди состояний нет повторяющихся. Значит, выполняется требование .

Замечание. Условие леммы не является достаточным для регулярности языка. (См. пример)

Лемма о разрастании в общем виде

Лемма (о разрастании, о накачке в общем виде):

Если язык является регулярным, то существует число такое что для любого слова из языка , где может быть записано в форме , где слова , и такие, что , и принадлежит языку для любого целого числа .

Доказательство:

Исходя из формулировки леммы в общем виде, стандартная версия леммы, которая описана выше, является особым случаем, в котором строки [math]u[/math] и [math]v[/math] пусты.

Доказательство леммы в общем виде аналогично доказательству стандартной версии леммы, с тем отличием, что строки и теперь могут быть как не пусты, так и пусты.

Замечание. Поскольку лемма в общем виде накладывает более жесткие требования на язык, то она может быть использована для доказательства нерегулярности многих других языков, таких как .

Использование леммы для доказательства нерегулярности языков

Для доказательства нерегулярности языка часто удобно использовать отрицание леммы о разрастании. Пусть [math]L[/math] — язык над алфавитом [math]\Sigma[/math]. Если для любого натурального [math]n[/math] найдётся такое слово [math]\omega[/math] из данного языка, что его длина будет не меньше [math] n[/math] и при любом разбиении на три слова [math]x,y,z[/math] такие, что [math]y[/math] непустое и длина [math]xy[/math] не больше [math]n[/math], существует такое [math]k[/math], что [math]xy^kz \notin L[/math], то язык [math]L[/math] нерегулярный.

Рассмотрим такой подход на примере языка правильных скобочных последовательностей. Для фиксированного [math]n[/math] предъявляем слово [math]\omega=(^n)^n[/math]. Пусть [math]\omega[/math] как-то разбили на [math]x, y, z[/math]. Так как [math]|xy|\leqslant n[/math], то [math]y=(^b[/math], где [math]b \gt 0[/math]. Для любого такого разбиения берём [math]k=2[/math] и получаем [math]xy^kz=(^{n+b})^n[/math], что не является правильной скобочной последовательностью. Значит, язык правильных скобочных последовательностей нерегулярен.

Пример нерегулярного языка, для которого выполняется лемма о разрастании

Пример языка, удовлетворяющего стандартной версии леммы

Рассмотрим следующий язык:

Докажем, что он нерегулярный. Для этого рассмотрим вспомогательный язык и докажем его нерегулярность. Воспользуемся предложенным в предыдущем пункте подходом. Для фиксированного [math]n[/math] выберем слово [math]\omega=ab^nc^n[/math]. Заметим, что при любом разбиении [math]\omega[/math] на [math]x, y, z[/math] слово [math] y [/math] не пусто (по условию леммы) и содержит только символы [math] a [/math] и [math] b [/math] (согласно выбранному слову и условию из леммы [math]|xy|\leqslant n[/math]). Это означает, что при [math] k = 0 [/math] слово [math]xy^kz[/math] либо не содержит символа [math] a [/math], либо количество символов [math] b[/math] меньше [math] n [/math]. В обоих случаях полученное слово не принадлежит языку. Значит язык [math] L' [/math] нерегулярный.

Предположим, что язык [math] L [/math] регулярный. Заметим, что . В силу того, что пересечение регулярных языков регулярно, имеем в правой части равенства регулярный язык. При этом в левой части стоит язык, нерегулярность которого была доказана ранее. Значит наше предположение неверно, и язык [math] L [/math] нерегулярный.

Докажем, что язык удовлетворяет лемме о разрастании. Выберем в лемме [math] n = 2 [/math]. Это означает, что длина рассматриваемых слов не меньше [math] 2 [/math] (иными словами [math] i + j + k \geqslant 2 \,[/math]). Для каждого случая значений [math] i, j, k [/math] выберем соответствующие слова [math] x, y [/math] и [math] z [/math] из леммы. Легко проверить, что в каждом из приведенных ниже случаев условие леммы выполняется:

. Слово имеет вид [math]\omega=c^k[/math]. Выберем .
. Слово имеет вид [math]\omega=b^jc^k[/math]. Выберем .
. Слово имеет вид [math]\omega=ab^jc^j[/math]. Выберем .
. Слово имеет вид [math]\omega=aab^jc^k[/math]. Выберем .
. Слово имеет вид [math]\omega=aaaa^{i-3}b^jc^k[/math]. Выберем .

Таким образом, язык [math] L [/math] удовлетворяет второй части леммы и при этом является нерегулярным, что доказывает тот факт, что лемма о разрастании не является достаточным для регулярности языка.

Пример языка, удовлетворяющего лемме в общем виде

Рассмотрим другой пример.

[math]\dfrac{1}{7}[/math] из символов слова [math]w[/math] является символом [math]3 \} [/math]

[math]L = L_1 \cup L_2[/math]

Докажем, что он нерегулярный. Предположим, что некоторая строка языка [math]L[/math] имеет длину [math]n=5[/math]. Поскольку в алфавите всего четыре символа, то как минимум два символа из пяти в этой строке будут одинаковыми, и они разделены максимум тремя символами:

Если дубликаты разделены нулями или единицами, накачаем один из двух остальных символов в строке, которые не повлияют на подстроку, которая содержит дубликаты.

Если дубликаты разделены двойками или тройками, накачаем символа, разделяющих их. Накачка также уменьшает или увеличивает результат во время создания подстроки размера , которая содержит продублированных символа.

Второе условие языка [math]L[/math] обеспечивает, что [math]L[/math] — нерегулярный, то есть в нем бесконечное число строк, которые принадлежат [math]L[/math], но не могут быть получены путям разрастания некоторой меньшей строки в [math]L[/math].

См. также

Источники информации

Wikipedia — Pumping lemma for regular languages
Хопкрофт Д., Мотвани Р., Ульман Д. — Введение в теорию автоматов, языков и вычислений, 2-е изд. : Пер. с англ. — М.:Издательский дом «Вильямс», 2002. — С. 144. — ISBN 5-8459-0261-4

Доказательство нерегулярности языков: лемма о разрастании

Содержание

Лемма о разрастании

Лемма о разрастании в общем виде

Использование леммы для доказательства нерегулярности языков

Пример нерегулярного языка, для которого выполняется лемма о разрастании

Пример языка, удовлетворяющего стандартной версии леммы

Пример языка, удовлетворяющего лемме в общем виде

См. также

Источники информации

Навигация

Персональные инструменты

Пространства имён

Варианты

Просмотры

Ещё

Поиск

Навигация

Инструменты