Нормальная форма Куроды

Определение:

Грамматика представлена в нормальной форме Куроды (англ. Kuroda normal form), если каждое правило имеет одну из четырех форм:

[math]AB \rightarrow CD[/math]
[math]A \rightarrow BC[/math]
[math]A \rightarrow B[/math]
[math]A \rightarrow a[/math] или [math]A \rightarrow \varepsilon[/math]

Где — нетерминалы, — терминал.

Определение:

Грамматика представлена в нормальной форме Пенттонена (англ. Penttonen normal form), если каждое правило имеет одну из трех форм:

[math]AB \rightarrow AC[/math]
[math]A \rightarrow BC[/math]
[math]A \rightarrow a[/math] или [math]A \rightarrow \varepsilon[/math]

Где — нетерминалы, — терминал.

Также грамматику Пенттонена называют односторонней нормальной формой (англ. one-sided normal form). Как можно заметить, она является частным случаем нормальной формы Куроды: когда [math]A = C[/math] в первом правиле определения. Для каждой контестно-зависимой грамматики существует слабо эквивалентная ей грамматика в форме Пенттонена.

Лемма (об удалении терминалов):

Для любой грамматики может быть построена грамматика такая, что:

все правила в [math]P'[/math] имеет вид [math]\alpha \rightarrow \beta[/math] где [math]\alpha \in (N')^+[/math] и [math]\beta \in (N')^*[/math] или [math]A \rightarrow a[/math], где [math]A \in N', a \in \Sigma[/math],
[math]L(\Gamma') = L(\Gamma)[/math]

Кроме того, если контекстно-свободна или контекстно-зависима, то и будет соответственно контекстно-свободной или контекстно-зависимой.

Доказательство:

Каждому терминалу [math]a[/math] поставим в соотвествие новый символ [math]a'[/math], которого нет в [math]N \cup \Sigma[/math], такой что [math]a' \neq b'[/math] для разных терминалов [math]a[/math] и [math]b[/math].

Пусть .

Пусть [math]\alpha = x_1x_2 \ldots x_n[/math] — часть правила, тогда , где для [math]1 \leqslant i \leqslant n[/math].

Построим грамматику , где .

Покажем, что [math]L(\Gamma') = L(\Gamma)[/math].

Пусть [math]w \in L(\Gamma)[/math]. Тогда в [math]\Gamma[/math] существует вывод .

Согласно конструкции [math]P'[/math], в [math]\Gamma'[/math] существует вывод .

Для в переходах используем правило [math]\alpha' \rightarrow \beta'[/math], так как правило [math]\alpha \rightarrow \beta[/math] было использовано при выводе [math]w_i \Rightarrow w_{i + 1}[/math].

Для в переходах [math]v_j \Rightarrow v_{j + 1}[/math] используем правила вида [math]a' \rightarrow a[/math].

Заменяем разрешенные в [math]w'[/math] символы на новые и получаем, что [math]w \in L(\Gamma')[/math]. Тогда .

Пусть [math]x \in L(\Gamma')[/math]. Тогда в [math]\Gamma'[/math] существует вывод [math]S \Rightarrow^* x[/math]. Мы можем поменять порядок применения правил в этом выводе: сначала применяем только правила вида [math]\alpha' \rightarrow \beta'[/math], а потом только правила вида [math]a' \rightarrow a[/math].

Из построения: после применения правила вида [math]a' \rightarrow a[/math] полученное [math]a[/math] не может быть использовано при применении правил из [math]P'[/math].

Изменение порядка вывода не меняет язык, то есть в [math]\Gamma'[/math] существует вывод: , где для и в переходе было использовано правило вывода [math]\alpha' \rightarrow \beta'[/math] и для [math]1 \leqslant j \leqslant s[/math] было использовано правило [math]a' \rightarrow a[/math], чтобы получить [math]y_j \rightarrow y_{j + 1}[/math].

Получаем вывод в [math]\Gamma[/math]: .

Тогда .

Таким образом, [math]L(\Gamma') = L(\Gamma)[/math].

Очевидно, что если грамматика была неукорочивающейся, то она такой и останется.

Лемма (об удалении коротких правил):

Для любой грамматики может быть построена грамматика такая, что:

любое правило из [math]P'[/math] имеет вид: [math]\alpha \rightarrow \beta[/math], где [math]\alpha \in (N')^+[/math] и [math]\beta \in (N')^+[/math] и [math]|\alpha| \leqslant |\beta|[/math], или [math]A \rightarrow a[/math], или [math]A \rightarrow \varepsilon[/math], где [math]A \in N'[/math] и [math]a \in T[/math]
[math]L(\Gamma') = L(\Gamma)[/math]

Доказательство:

Сначала по [math]\Gamma[/math] построим грамматику , как в доказательстве леммы 1. По [math]\Gamma''[/math] построим грамматику [math]\Gamma'[/math], в которой:

[math]N' = N'' \cup \{D\}[/math], где [math]D[/math] — новый символ,
[math]P'[/math] получаем из [math]P''[/math] заменой всех правил вида , где [math]|\alpha| \gt |\beta|[/math] на правила вида , и добавлением правила [math]D \rightarrow \varepsilon[/math].

Теперь все правила в [math]P'[/math] имеет требуемую форму.

Покажем, что [math]L(\Gamma') = L(\Gamma)[/math].

Заметим, что замена правила [math]\alpha \rightarrow \beta[/math] на не меняет язык грамматики, потому что [math]D[/math] переходит только в [math]\varepsilon[/math], а других правил для [math]D[/math] нет.

Тогда получаем, что , аналогично обратные изменения не меняют язык, то есть .

Определение:

Грамматика имеет порядок [math]n[/math], если и для любого ее правила .

Лемма (об уменьшении порядка грамматики):

Для любой грамматики порядка , такой что: любое правило из имеет вид , где и и или или , где и может быть построена грамматика порядка такая, что .

Доказательство:

Разделим [math]P[/math] на три подмножества:

,

.

Очевидно, что [math]P = P_1 \cup P_2 \cup P_3[/math].

Построим [math]\Gamma'[/math] следующим образом:

Если правило [math]p \in P_2[/math], то оно имеет вид , где [math]\alpha' \in N^*[/math] и [math]\beta' \in N^*[/math].

Полагаем [math]N_p = \{ A_p, B_p \}[/math], , где [math]A_p, B_p[/math] — дополнительные символы не из для разных правил [math]p[/math] и [math]q[/math] из [math]P_2[/math].

Если правило [math]p \in P_3[/math], то оно имеет вид [math]A \rightarrow CDE\beta'[/math], где [math]\beta' \in N^*[/math].

Полагаем [math]N_p = \{B_p \}[/math], , где [math]A_p, B_p[/math] — дополнительные символы.

Тогда , .

Из построения очевидно, что [math]\Gamma'[/math] имеет порядок [math]n - 1[/math].

Покажем, что [math]L(\Gamma') = L(\Gamma)[/math].

Сначала докажем, что . Это следует из того, что:

все правила из [math]P_1[/math] применимы к обеим грамматикам,
шаг вывода , благодаря правилу в [math]\Gamma[/math]может быть использавано в [math]\Gamma'[/math] с помощью трех шагов:

, с использованием правил из [math]P_p[/math] и вывода на основе правила в [math]G[/math], которое может быть применено в [math]G'[/math] с помощью трех шагов вывода: . Таким образом, любой вывод в [math]\Gamma[/math] может быть преобразован в вывод в [math]\Gamma'[/math].

Чтобы показать обратное включение, рассмотрим вывод [math]w \in L(\Gamma')[/math] в [math]\Gamma'[/math], который содержит применение правил вида [math]AB \rightarrow A_pB_p[/math] для какого-то правила . Заметим, что другие два правила из [math]P_p[/math] могут быть применены только если правило [math]AB \rightarrow A_pB_p[/math] было применено в этом выводе ранее.

Данный вывод имеет вид (1):

,

где [math]q_1[/math] — последовательность правил, примененых после [math]AB \rightarrow A_pB_p[/math] и до [math]A_p \rightarrow C[/math], которая осуществляет и ,

где [math]q_2[/math] — последовательность правил, осуществляющих и .

Или вид (2):

,

где [math]q_1'[/math] — последовательность правил, которая осуществляет и ,

где [math]q_2'[/math] — последовательность правил, осуществляющих и .

Таким образом, существует вывод: , который получается из (1) заменой правил [math]P_p[/math] на применение . Аналогично, в случае (2) мы можем заменить применение [math]P_p[/math] на [math]p[/math]. Кроме того, это верно и для применения [math]P_q,[/math] где [math]q \in P_3[/math].

Таким образом, для [math]r \in P_2 \cup P_3[/math] мы можем заменить все применения [math]P_r[/math] на [math]r[/math], то есть получаем вывод [math]w[/math], который состоит только из правил из [math]P[/math].

Тогда и .

Теорема:

Любую грамматику можно преобразовать к грамматике в нормальной форме Куроды так, что .

Доказательство:

По лемме 1 построим из [math]\Gamma[/math] грамматику [math]\Gamma'[/math], затем по лемме 2 построим из [math]\Gamma'[/math] грамматику [math]\Gamma''[/math], Тогда [math]\Gamma''[/math] удовлетворит требованиям леммы 3.

Пусть [math]\Gamma''[/math] имеет порядок [math]n[/math]. Если [math]n = 2[/math], то [math]\Gamma''[/math] в нормальной форме Куроды и [math]\Gamma_K = \Gamma''[/math]. Если [math]n \geqslant 3[/math], построим [math]\Gamma'''[/math] порядка [math]n - 1[/math] из [math]\Gamma''[/math] по лемме 3. Понятно, что [math]\Gamma'''[/math] удовлетворяет условиям леммы 3.

Будем повторять процесс, пока не получим грамматику порядка , которую и примем за .

См. также

Источники информации

Alexander Meduna Automata and Languages: Theory and Applications
Wikipedia — Kuroda normal form

Нормальная форма Куроды

См. также

Источники информации

Навигация

Персональные инструменты

Пространства имён

Варианты

Просмотры

Ещё

Поиск

Навигация

Инструменты