Нормальная форма Куроды — различия между версиями

Версия 13:22, 4 января 2015

Определение:

Грамматика представлена в нормальной форме Куроды (англ. Kuroda normal form), если каждое правило имеет одну из четырех форм:

[math]AB \rightarrow CD[/math]
[math]A \rightarrow BC[/math]
[math]A \rightarrow B[/math]
[math]A \rightarrow a[/math] или [math]A \rightarrow \varepsilon[/math]

Где — нетерминалы, — терминал.

Данная грамматика названа в честь Куроды (англ. Sige-Yuki Kuroda), который изначально назвал ее линейно ограниченной грамматикой.

Определение:

Грамматика представлена в нормальной форме Пенттонена (англ. Penttonen normal form), если каждое правило имеет одну из трех форм:

[math]AB \rightarrow CD[/math]
[math]A \rightarrow BC[/math]
[math]A \rightarrow a[/math] или [math]A \rightarrow \varepsilon[/math]

Где — нетерминалы, — терминал.

Также грамматику Пенттонена называют односторонней нормальной формой (англ. one-sided normal form). Как можно заметить, она является частным случаем нормальной формы Куроды: когда [math]A = C[/math] в первом правиле определения. Для каждой контестно-зависимой грамматики существует слабо эквивалентная ей грамматика в форме Пенттонена.

Лемма (об удалении терминалов):

Для любой грамматики может быть построена грамматика такая, что:

все правила в [math]P'[/math] имеет вид [math]\alpha \rightarrow \beta[/math] где [math]\alpha \in (N')^+[/math] и [math]\beta \in (N')^*[/math] или [math]A \rightarrow a[/math], где [math]A \in N', a \in T[/math],
[math]L(G') = L(G)[/math]

Кроме того, если G контекстно-свободна или контекстно-зависима, то и будет соответственно контекстно-свободной или контекстно-зависимой.

Доказательство:

Каждому терминалу [math]a[/math] поставим в соотвествие новый символ [math]a'[/math], которого нет в [math]N \cup T[/math], такой что [math]a' \neq b'[/math] для разных терминалов [math]a[/math] и [math]b[/math].

Пусть .

Пусть [math]\alpha = x_1x_2...x_n[/math] — часть правила, тогда [math]\alpha' = y_1y_2...y_n[/math], где [math]y_i = \{x_i[/math], если [math]x_i \in N[/math]; [math]x_i'[/math], если [math]x_i \in T\}[/math] для [math]1 \lt = i \lt = n[/math].

Построим грамматику [math]G' = (N', T, P', S)[/math], где .

Покажем, что [math]L(G') = L(G)[/math].

Пусть [math]w \in L(G)[/math]. Тогда в G существует вывод .

Согласно конструкции [math]P'[/math], в [math]G'[/math] существует вывод .

Для [math]0 \lt = i \lt = n - 1[/math] в переходах [math]w_i' =\gt w_{i + 1}'[/math] используем правило [math]\alpha' \rightarrow \beta'[/math], так как правило [math]\alpha \rightarrow \beta[/math] было использовано при выводе [math]w_i =\gt w_{i + 1}[/math].

Для [math]0 \lt = j \lt = m - 1[/math] в переходах [math]v_j =\gt v_{j + 1}[/math] используем правила вида [math]a' \rightarrow a[/math].

Заменяем разрешенные в [math]w'[/math] символы на новые и получаем, что [math]w \in L(G')[/math]. Тогда [math]L(G) \lt = L(G')[/math].

Пусть [math]x \in L(G')[/math]. Тогда в [math]G'[/math] существует вывод [math]S =\gt * x[/math]. Мы можем поменять порядок применения правил в этом выводе: сначала применяем только правила вида [math]\alpha' \rightarrow \beta'[/math], а потом только правила вида [math]a' \rightarrow a[/math].

Из построения: после применения правила вида [math]a' \rightarrow a[/math] полученное [math]a[/math] не может быть использовано при применении правил из [math]P'[/math].

Изменение порядка вывода не меняет язык, то есть в [math]G'[/math] существует вывод: , где для и в переходе было использовано правило вывода [math]\alpha' \rightarrow \beta'[/math] и для [math]1 \lt = j \lt = s[/math] было использовано правило [math]a' \rightarrow a[/math], чтобы получить [math]y_j \rightarrow y_{j + 1}[/math].

Получаем вывод в [math]G[/math]: .

Тогда [math]L(G') \lt = L(G)[/math].

Таким образом, [math]L(G') = L(G)[/math].

Очевидно, что если грамматика была неукорочивающейся, то она такой и останется.

Лемма (об удалении длинных правил):

Для любой грамматики может быть построена грамматика такая, что:

любое правило из [math]P'[/math] имеет вид: [math]\alpha \rightarrow \beta[/math], где [math]\alpha \in (N')^+[/math] и [math]\beta \in (N')^+[/math] и [math]|\alpha| \lt = |\beta|[/math], или [math]A \rightarrow a[/math], или [math]A \rightarrow \varepsilon[/math], где [math]A \in N'[/math] и [math]a \in T[/math]
[math]L(G') = L(G)[/math]

Доказательство:

Сначала по [math]G[/math] построим грамматику [math]G'' = (N'', T, P'', S)[/math], как в доказательстве леммы 1. По [math]G''[/math] построим грамматику [math]G'[/math], в которой:

[math]N' = N'' \cup \{D\}[/math], где [math]D[/math] — новый символ,
[math]P'[/math] получаем из [math]P''[/math] заменой всех правил вида , где [math]|\alpha| \gt |\beta|[/math] на правила вида , и добавлением правила [math]D \rightarrow \varepsilon[/math].

Теперь все правила в [math]P'[/math] имеет требуемую форму.

Покажем, что [math]L(G') = L(G)[/math].

Заметим, что замена правила [math]\alpha \rightarrow \beta[/math] на не меняет язык грамматики, потому что дополнительная буква [math]D[/math] запрещается при добавлении перехода [math]D \rightarrow \varepsilon[/math], а других правил для [math]D[/math] нет.

Тогда получаем, что , аналогично обратные изменения не меняют язык, то есть .

Определение:

Грамматика имеет порядок n, если

Лемма (об уменьшении порядка грамматики):

(Уменьшение порядка грамматики) Для любой грамматики G = (N, T, P, S) порядка n >= 3, такой что: любое правило из P' имеет вид \alpha \rightarrow \beta, где \alpha \in (N')^+ и \beta \in (N')^+ и

Доказательство:

Разделим P на три подмножества:

P_1 = \{ \alpha \rightarrow \beta

Теорема:

Любую грамматику G можно преобразовать к грамматике G_K в нормальной форме Куроды, так что L(G) = L(G_K).

Доказательство:

По лемме 1 построим из G грамматику G', затем по лемме 2 построим из G' грамматику G, Тогда G удовлетворит требованиям леммы 3. Пусть G имеет порядок n. Нсли n = 2, то G в нормальной форме Куроды и G_K = G. Если n >= 3, построим G порядка n - 1 из G по лемме 3.

Понятно, что G удовлетворяет условиям леммы 3, будем повторять процесс, пока не получим грамматику порядка 2, которую и примем за G_K.

@@ Строка 56: / Строка 56: @@
 Получаем вывод в <tex>G</tex>: <tex>S = x_0 => x_1 => ... => x_n = x</tex>.
 Тогда <tex>L(G') <= L(G)</tex>.
 Таким образом, <tex>L(G') = L(G)</tex>.
 Очевидно, что если грамматика была неукорочивающейся, то она такой и останется.
@@ Строка 67: / Строка 69: @@
 * <tex>L(G') = L(G)</tex>
 |proof=
-Сначала по G построим грамматику G'' = (N'', T, P'', S), как в доказательстве леммы 1. По G'' построим грамматику G', в которой:
+Сначала по <tex>G</tex> построим грамматику <tex>G'' = (N'', T, P'', S)</tex>, как в доказательстве леммы 1. По <tex>G''</tex> построим грамматику <tex>G'</tex>, в которой:
-N' = N'' U {D}, где D {{---}} новый символ,
+* <tex>N' = N'' \cup \{D\}</tex>, где <tex>D</tex> {{---}} новый символ,
-P' получаем из P'' заменой всех правил вида \alpha \rightarrow \beta \in P'', где |\alpha| > |\beta| на правила вида \alpha \rightarrow \betaD^{|\alpha| - |\beta|}, и добавлением правила D \rightarrow \varepsilon.
+* <tex>P'</tex> получаем из <tex>P''</tex> заменой всех правил вида <tex>\alpha \rightarrow \beta \in P''</tex>, где <tex>|\alpha| > |\beta|</tex> на правила вида <tex>\alpha \rightarrow \beta D^{|\alpha| - |\beta|}</tex>, и добавлением правила <tex>D \rightarrow \varepsilon</tex>.
-Теперь все правила в P' имеет требуемую форму.
+Теперь все правила в <tex>P'</tex> имеет требуемую форму.
+Покажем, что <tex>L(G') = L(G)</tex>.
+Заметим, что замена правила <tex>\alpha \rightarrow \beta</tex> на <tex>\alpha \rightarrow \beta D^{|\alpha| - |\beta|}</tex> не меняет язык грамматики, потому что дополнительная буква <tex>D</tex> запрещается при добавлении перехода <tex>D \rightarrow \varepsilon</tex>, а других правил для <tex>D</tex> нет.
-Покажем, что L(G') = L(G).
+Тогда получаем, что <tex>L(G) <= L(G')</tex>, аналогично обратные изменения не меняют язык, то есть <tex>L(G') <= L(G)</tex>.
-Заметим, что замена правила \alpha \rightarrow \beta на \alpha \rightarrow \betaD^{|\alpha| - |\beta|} не меняет язык грамматики, потому что дополнительная буква D запрещается при добавлении перехода D \rightarrow \varepsilon, а других правил для D нет.
-Тогда получаем, что L(G) <= L(G'), аналогично обратные изменения не меняют язык, то есть L(G') <= L(G).
 }}

Нормальная форма Куроды — различия между версиями

Версия 13:22, 4 января 2015

Навигация

Персональные инструменты

Пространства имён

Варианты

Просмотры

Ещё

Поиск

Навигация

Инструменты