Изменения

Удаление бесполезных символов из грамматики

7721 байт добавлено, 18:18, 2 июня 2018

→‎Пример

== Порождающие и непорождающие нетерминалы ==

===Описание===

{{Определение

|definition=

~~Символ~~ [[Формальные_грамматики|Нетерминал]] <tex>A</tex> называется '''порождающим'''(англ. ''generating''), если из него может быть выведена конечная терминальная цепочка. Иначе он называется '''непорождающим'''.

}}

Очевидно, что если и только если все нетерминалы правой части правила являются порождающими, то порождающим является и нетерминал, стоящий в его левой части.

{{Лемма

|statement=

После удаления из грамматики правил, содержащих непорождающие нетерминалы, язык не изменится.

|proof=

Непорождающие нетерминалы по определению не могли участвовать в выводе какого-либо слова.

}}

===Алгоритм===

'''Шаг 0'''. Множество порождающих нетерминалов пустое.

'''Шаг 1'''. Находим правила, не содержащие нетерминалов в правых частях и добавляем нетерминалы, встречающихся в левых частях таких правил, в множество.

'''Шаг 2'''. Если найдено такое правило, что все нетерминалы, стоящие в его правой части, уже входят в множество, то добавим в множество нетерминалы, стоящие в его левой части.

'''Шаг 3'''. Повторим предыдущий шаг, если множество порождающих нетерминалов изменилось.

В результате получаем множество всех порождающих нетерминалов грамматики, а все нетерминалы, не попавшие в него, являются непорождающими.

=== Время работы алгоритма ===

Данный алгоритм работает за <tex>O(\left| \Gamma \right| ^ 2)</tex>, где <tex>\left| \Gamma \right|</tex> {{---}} размер грамматики. Однако используя [[Очередь|очередь]] можно ускорить его до <tex>O(\left| \Gamma \right|)</tex>.

===Модификация алгоритма с очередью===

Для реализации алгоритма поиска непорождающих нетерминалов будем использовать следующие структуры:

*<tex>\mathrm{isGenerating[nonterm_i]}</tex> {{---}} является ли нетерминал <tex>\mathrm{nonterm_i}</tex> порождающим или нет,

*<tex>\mathrm{counter[rule_i]}</tex> {{---}} счетчик количества нетерминалов, которые ещё не помечены порождающими, для каждого из правил,

*<tex>\mathrm{concernedRules[nonterm_i]}</tex> {{---}} для каждого нетерминала <tex>\mathrm{nonterm_i}</tex> список номеров правил, в правой части которых он встречается,

*<tex>\mathrm{Q}</tex> {{---}} очередь нетерминалов, помеченных порождающими, но ещё не обработанных.

~~Очевидно, что если и только если все нетерминальные символы~~ Вначале для всех нетерминалов в <tex>\mathrm{isGenerating}</tex> поставим <tex>false</tex>. В <tex>\mathrm{counter}</tex> поставим количество нетерминалов в правой части ~~являются порождающими~~. Нетерминалы, ~~то порождающим является и символ~~у которых счётчик <tex>\mathrm{counter}</tex> нулевой, ~~стоящий~~ добавим в ~~левой части. Это позволяет обнаружить непорождающие нетерминалы с помощью следующей процедуры~~очередь и отметим их порождающими. ~~# Найти правила, не содержащие нетерминалов~~ Пока в ~~правых частях. Составить множество нетерминалов~~очереди есть элементы, ~~встречающихся в левых частях таких~~ достаём очередной нетерминал и уменьшаем <tex>\mathrm{counter}</tex> для всех правилиз <tex>\mathrm{concernedRules}</tex> для данного нетерминала.# Если ~~найдено такое правило~~счётчик количества порождающих терминалов обнулился, ~~что все нетерминалы~~то добавим нетерминал, ~~стоящие~~ стоящий в ~~его правой,~~ левой части ~~уже входят в множество, то добавить в множество нетерминалы, стоящие~~ данного правила в очередь и пометим его ~~левой части~~порождающим. ~~# Если на шаге 2 множество изменилось, повторить шаг 2.# Получено множество всех порождающих~~ Каждый из нетерминалов ~~грамматики~~попадёт в очередь только один раз, ~~а все нетерминалы~~следовательно мы пройдем по списку правил, ~~не попавшие~~ в ~~него~~правой части которых он встречается, один раз. Таким образом, ~~являются непорождающими~~суммарно получаем <tex>O(\left| \Gamma \right|)</tex>.

При удалении из грамматики непорождающих нетерминалов и правил, их содержащих, язык не изменится, так как эти нетерминалы по определению не могли встречаться в выводе любого слова.=== Пример ===Рассмотрим следующую грамматику:

:<tex>

S\rightarrow Ac\\

A\rightarrow SD\\

D\rightarrow aD\\

A\rightarrow a

</tex>

Применяя описанный алгоритм:

# Изначально множество порождающих нетерминалов состоит из одного элемента <tex>A</tex>.

# Добавим в множество нетерминал <tex>S</tex>, так как существует правило <tex>S\rightarrow Ac</tex>, в правой части которого стоят нетерминал <tex>A</tex>, который есть в множестве, и терминал <tex>c</tex>.

# После следующего обхода правил из грамматики множество не изменится.

# Теперь удалим правила <tex>A\rightarrow SD</tex> и <tex>D\rightarrow aD</tex>, так как они содержат нетерминалы, которых нет в полученном множестве.

== Достижимые и недостижимые нетерминалы ==

===Описание===

{{Определение

|definition=

Нетерминал <tex>A</tex> называется '''достижимым''' (англ. ''reachable'') в [[Контекстно-свободные_грамматики,_вывод,_лево-_и_правосторонний_вывод,_дерево_разбора|КС-грамматике ]] <tex>\Gamma</tex>, если существует порождение <tex>S \Rightarrow^* \alpha A \beta</tex>. Иначе он называется '''недостижимым'''(англ. ''unreachable'').}}Очевидно, что если нетерминал в левой части правила является достижимым, то и все нетерминалы правой части являются достижимыми. {{Лемма|statement=После удаления из грамматики правил, содержащих недостижимые нетерминалы, язык не изменится.|proof=Недостижимые нетерминалы по определению не достижимы из стартового, следовательно они не могли участвовать в выводе какого-либо слова.

}}

===Алгоритм===

'''Шаг 0.''' Множество достижимых нетерминалов состоит из единственного элемента: <tex>\lbrace S \rbrace</tex>.

'''Шаг 1.''' Если найдено правило, в левой части которого стоит нетерминал, содержащийся в множестве, добавим в множество все нетерминалы из правой части.

'''Шаг 2.''' Повторим предыдущий шаг, если множество порождающих нетерминалов изменилось.

Получаем множество всех достижимых нетерминалов, а нетерминалы, не попавшие в него, являются недостижимыми.

=== Время работы алгоритма ===

Очевидно, что если нетерминал в левой части правила является достижимым, то и все нетерминалы правой части являются достижимыми. Найти недостижимые нетерминалы можно с помощью следующей процедуры.=== Пример ===Рассмотрим следующую грамматику: :<tex> S\rightarrow AB|CD\\ A\rightarrow EF\\ G\rightarrow AD\\ C\rightarrow c</tex>Применяя описанный алгоритм:

# Возьмём множество, состоящее из единственного элемента: <tex>\lbrace S \rbrace</tex>.

# ~~Если найдено правило~~Из <tex>S</tex> достижимы нетерминалы <tex>A</tex>, <tex>B</tex>, <tex>C</tex> и <tex>D</tex>. Добавим их в ~~левой части которого стоит нетерминал~~множество и получим <tex>\lbrace S, A, B, C, ~~содержащийся в множестве~~D \rbrace</tex>.# Множество изменилось. Переберём заново правила из грамматики. Из <tex>A</tex> можно вывести <tex>E</tex> и <tex>F</tex>, ~~добавить~~ добавим их в множество ~~все нетерминалы из правой части~~.# ~~Если на шаге 2 множество изменилось~~Снова переберём правила. Из <tex>C</tex> можно вывести только терминал, ~~повторить шаг 2~~а <tex>G</tex> нет в множестве.# ~~Получено~~ После последнего обхода правил грамматики множество ~~всех достижимых нетерминалов~~не изменилось, а значит мы нашли все достижимые нетерминалы: <tex>\lbrace S, A, B, ~~не попавшие в него~~C, D, E, ~~являются недостижимыми~~F \rbrace</tex>. ~~При удалении из грамматики недостижимых нетерминалов и правил, их содержащих, язык не изменится~~# Теперь удалим правило <tex>G\rightarrow AD</tex>, так как ~~эти нетерминалы недостижимы из стартового~~оно содержит в левой части нетерминал, ~~то и~~ которого нет в ~~выводе любого слова они встречаться не могли~~полученном множестве.

== Полезные и бесполезные нетерминалы ==

===Описание===

{{Определение

|definition=

Нетерминал <tex>A</tex> называется '''полезным''' (англ. ''useful'') в КС-грамматике <tex>\Gamma</tex>, если он может участвовать в выводе, то есть существует порождение вида <tex>S \Rightarrow ^* \alpha A \beta \Rightarrow ^* w</tex>. Иначе он называется '''бесполезным'''(англ. ''useless'').

}}

|id=th1

|statement=

Грамматика <tex>\Gamma</tex> не содержит бесполезных нетерминалов ~~<tex>\Leftrightarrow</tex>~~ тогда и только тогда, когда грамматика <tex>\Gamma</tex> не содержит ни недостижимых нетерминалов, ни непорождающих.

|proof=

~~''Необходимость.''~~ <tex>\Leftarrow</tex> :Очевидно, ~~т.к.~~ так как недостижимые и непорождающие нетерминалы являются бесполезными.

~~''Достаточность.''~~ <tex>\Rightarrow</tex> :Рассмотрим любой нетерминал <tex>A</tex>. Так как он достижим, существуют <tex>\alpha</tex> и <tex>\beta</tex>, такие, что <tex>S \Rightarrow ^* \alpha A \beta</tex>. Из того, что любой нетерминал является порождающим, следует, что из любой строки можно вывести строку из терминалов. Значит, существует <tex>\omega \in \Sigma ^ *</tex>: <tex>S \Rightarrow ^* \alpha A \beta \Rightarrow ^* \omega</tex>, и <tex>A</tex> {{---}} не бесполезный.

}}

===Алгоритм===Алгоритм ~~удаления бесполезных нетерминалов~~ состоит из ~~грамматики прост, как три рубля.~~двух этапов:# Удалить из грамматики правила, содержащие непорождающие нетерминалы ~~и правила, в которых они встречаются~~.# Удалить из грамматики правила, содержащие недостижимые нетерминалы ~~и правила, в которых они встречаются~~.

~~После сих~~ === Корректность алгоритма ===Достаточность данных действий ~~в грамматике не будет бесполезных символов~~следует из доказанной выше теоремы.

~~==Корректность алгоритма==~~

~~Корректность алгоритма вытекает из [[#th1|первой теоремы]] и следующей.~~

{{Теорема

|id=~~th2~~th1

|statement=

~~Пусть <tex>\Gamma</tex> - грамматика без непорождающих нетерминалов. Тогда после~~ После удаления ~~недостижимых нетерминалов~~ из грамматики правил, содержащих недостижимые нетерминалы, не появятся новые непорождающие ~~не появятся~~нетерминалы.

|proof=

Допустим, что в грамматике появился непорождающий нетерминал <tex>A</tex>. Так как до удаления недостижимых нетерминалов существовал вывод из <tex>A</tex> некоторой конечной цепочки терминалов<tex>\omega</tex>, то ~~удалилось~~ было удалено хотя бы какое-то одно ~~или несколько правил~~ правило из этого вывода. ~~Возьмем первое удаленное правило~~ Пусть <tex>CB\rightarrow\alpha</tex> {{---}} правило, первым из удалённых применяемое в выводе <tex>A \Rightarrow ^* \omega</tex>. Оно могло ~~удалиться~~ быть удалено тольков том случае, если в <tex>\alpha</tex> присутствуют недостижимые ~~символы~~нетерминалы. Но так как было выбрано первое ~~удаленное~~ удалённое правило из вывода, то <tex>CB</tex> — достижим~~, а~~, следовательно, достижимы и все ~~символы~~ нетерминалы из <tex>\alpha</tex>. Значит, это правило ~~удалиться~~ не моглобыть удалено.

}}

~~''Примечание~~=== Пример === 1. Пусть нам дана грамматика:'' :<tex> S\rightarrow AS|BS|s \\ E\rightarrow EF|FF \\ A\rightarrow a \\ F\rightarrow f</tex> 2. Удалим правила, содержащие непорождающие нетерминалы: :<tex> S\rightarrow AS|s \\ E\rightarrow EF|FF \\ A\rightarrow a \\ F\rightarrow f</tex> 3. Теперь удалим недостижимые нетерминалы: :<tex> S\rightarrow AS|s \\ A\rightarrow a</tex> === Замечание ===Шаги алгоритма нельзя менять местами.

~~Эти шаги нельзя менять местами.~~ Рассмотрим следующую грамматику:

:<tex> S\rightarrow AB|a\\ A\rightarrow b</tex>

Все нетерминалы в этой грамматике достижимы. Однако, если удалить <tex>B</tex> как непорождающий, то нетерминал <tex>A~~\rightarrow b~~</tex>станет недостижимым.== См. также ==* [[Контекстно-свободные_грамматики,_вывод,_лево-_и_правосторонний_вывод,_дерево_разбора|Контекстно-свободные грамматики]]* [[Нормальная_форма_Хомского|Нормальная форма Хомского]]

~~Если начать~~ == Источники информации ==* [[wikipedia:Formal_grammar | Wikipedia {{---}} Formal grammar]]* [http://en.wikipedia.org/wiki/Chomsky_normal_form Wikipedia {{---}} Chomsky normal form]* ''Хопкрофт Д., Мотвани Р., Ульман Д.'' {{---}} Введение в теорию автоматов, языков и вычислений, 2-е изд. : Пер. с ~~проверки достижимости~~англ. — Москва, Издательский дом «Вильямс», ~~то все символы грамматики оказываются достижимыми~~2002. ~~Если затем удалить <tex>B</tex> как непорождающий символ, то останется грамматика~~ — 528 с ~~бесполезными символами <tex>A</tex> и <tex>b</tex>~~.: ISBN 5-8459-0261-4 (рус.)

~~== Литература ==~~[[Категория: Теория формальных языков]]* ''Хопкрофт Д., Мотвани Р., Ульман Д.'' — '''Введение в теорию автоматов, языков и вычислений''', 2[[Категория: Контекстно-~~е изд. : Пер. с англ. — Москва, Издательский дом «Вильямс», 2002. — 528 с.~~ свободные грамматики]][[Категория: ~~ISBN 5-8459-0261~~Нормальные формы КС-~~4 (рус.)~~грамматик]]

Анонимный участник

5.18.215.180

Изменения

Удаление бесполезных символов из грамматики

Навигация

Персональные инструменты

Пространства имён

Варианты

Просмотры

Ещё

Поиск

Навигация

Инструменты