Решение уравнений в регулярных выражениях

Уравнения в регулярных выражениях

Поскольку алгебра регулярных выражений является частным случаем алгебры Клини, то и соответствующие уравнения можно рассматривать как уравнения алгебры Клини. Сама эта алгебра классически используется в теории формальных языков, но также была применена к алгоритмам поиска пути в графах^[1], нахождения выпуклой оболочки^[2]. В компиляторах она может быть использована для доказательства корректности методик оптимизации циклов^[3].

Решение уравнений в регулярных выражениях

Пусть [math]X[/math] — некий язык, для которого выполняется равенство [math]X = \alpha X + \beta [/math], где [math]\alpha,\,\beta[/math] — некие регулярные выражения над неким алфавитом [math]A[/math].

Утверждение:

Пусть уравнение имеет вид если , тогда — единственное решение если , тогда — решение для

[math] 1) [/math] Пусть [math]\varepsilon \notin \alpha [/math]. Тогда [math]\forall i \geqslant 0: [/math] выражение , следовательно . Докажем это индукцией по [math]i[/math]: при [math]i = 0[/math] из начального равенства [math]\beta \subset X[/math], и если [math]\alpha^{i} \beta \subset X[/math], то .

Пусть существует такой, что [math] z [/math] — самое короткое; тогда где .

Тогда короче [math]z[/math], противоречие, тогда не существует самого короткого [math]z[/math], значит не существует никакого.

Пусть . Тогда можно представить этот язык в виде , а исходное равенство преобразуется в . Теперь мы можем взять в качестве базы индукции не просто , а любой язык , или, что то же самое, любой , и дальше показать , а потом отсутствие самого короткого . Заметим, что , тогда .

Решение системы уравнений в регулярных выражениях

Пусть система уравнений имеет вид:

Метод решения

Выразим [math]X_1[/math] из первого уравнения и подставим во второе уравнение: [math]+ \beta_2[/math].

Пусть , , тогда уравнение примет вид [math]X_2=a X_2 + b[/math]. Его решением будет [math]a^{*} b[/math]. Подставим в следующее уравнение выраженный [math]X_2[/math].

Далее выполняя схожие итерации получим уравнение [math]X_n = a' X_n + b'[/math], где , тогда .

Далее подставляя в полученные в ходе итераций уравнения найденный [math] X_i [/math], обратной прогонкой найдем [math]X_1 \dots X_{n-1} [/math].

Пример решения системы уравнений в регулярных выражениях

Пусть нам нужно найти регулярное выражение, соответствующее языку [math]L_0[/math], слова которого интерпретируются как последовательности чисел [math]0, 1, 2[/math], а языку удовлетворяют слова, сумма чисел в которых делится на 3. Тогда доопределив языки [math]L_1, L_2[/math], сумма чисел в словах из [math]L_i[/math] равна [math]3 - i[/math] по модулю [math]3[/math], получим систему уравнений в регулярных выражениях:

Поскольку нам нужно найти только [math]L_0[/math], чтобы избежать обратной прогонки, начнём выражать языки с [math]L_2[/math].

Примечания

См. также

Альтернативное доказательство теоремы Клини (через систему уравнений в регулярных выражениях)

Источники информации

[1] R.C. Backhouse, B.A. Carre: Regular algebra applied to path-finding problems. J. Institute of Mathematics and its applications 15, 161-186 (1975)

[2] K. Clenaghan: Calculational graph algorithmics: reconciling two approaches with dynamic algebra. CWI Amsterdam, Report CS-R9518, 1995

[3] M.C. Patron, D. Kozen: Certification of compiler optimizations using Kleene algebra with tests, Report 99-1779, Computer Science Department, Cornell University, Dec. 1999.

[1]

[2]

[3]

Решение уравнений в регулярных выражениях

Уравнения в регулярных выражениях