Многозначные зависимости и четвертая нормальная форма — различия между версиями
(→Теорема о дополнении) |
м (rollbackEdits.php mass rollback) |
||
(не показано 9 промежуточных версий 2 участников) | |||
Строка 1: | Строка 1: | ||
− | == Аномалии в НФБК == | + | == Мотивация. Аномалии в НФБК == |
Рассмотрим следующий пример: | Рассмотрим следующий пример: | ||
Строка 16: | Строка 16: | ||
Тогда все атрибуты будут ключевыми: у курса и лектора бывает много книг, лектор может рекомендовать книгу по нескольким курсам, книгу для курса могут рекомендовать все лекторы этого курса. | Тогда все атрибуты будут ключевыми: у курса и лектора бывает много книг, лектор может рекомендовать книгу по нескольким курсам, книгу для курса могут рекомендовать все лекторы этого курса. | ||
− | Поэтому здесь присутствуют только тривиальные функциональные зависимости, | + | Поэтому здесь присутствуют только тривиальные функциональные зависимости, следовательно отношение находится в [[Нормальные_формы:_третья_и_Бойса-Кодда|нормальной форме Бойса-Кодда]]. |
− | При этом | + | При этом у нас будут все 3 вида аномалии: |
* '''Вставки''': невозможно указать литературу по курсу без преподавателя. | * '''Вставки''': невозможно указать литературу по курсу без преподавателя. | ||
* '''Удаления''': нельзя удалить преподавателя, не потеряв литературу по курсу. | * '''Удаления''': нельзя удалить преподавателя, не потеряв литературу по курсу. | ||
Строка 31: | Строка 31: | ||
<tex>X \twoheadrightarrow Y</tex> <tex>(X</tex> многозначно определяет <tex>Y)</tex> в отношении <tex>R:</tex> | <tex>X \twoheadrightarrow Y</tex> <tex>(X</tex> многозначно определяет <tex>Y)</tex> в отношении <tex>R:</tex> | ||
* <tex>X</tex> и <tex>Y - </tex> множества атрибутов | * <tex>X</tex> и <tex>Y - </tex> множества атрибутов | ||
− | * Множество значений <tex>Y</tex> не зависит от <tex>R \setminus X \setminus Y</tex> | + | * Множество значений <tex>Y</tex> не зависит от всех оставшихся атрибутов: <tex>R \setminus X \setminus Y</tex> |
* <tex>\forall x,y1,z1,y2,z2</tex> если <tex>(x,y1,z1)∈R</tex> и <tex>(x,y2,z2) \in R</tex> то <tex>{y{|}(x,y,z1) \in R}={y{|}(x,y,z2) \in R}</tex> | * <tex>\forall x,y1,z1,y2,z2</tex> если <tex>(x,y1,z1)∈R</tex> и <tex>(x,y2,z2) \in R</tex> то <tex>{y{|}(x,y,z1) \in R}={y{|}(x,y,z2) \in R}</tex> | ||
}} | }} | ||
Строка 44: | Строка 44: | ||
=== Теорема Фейгина === | === Теорема Фейгина === | ||
{{Теорема | {{Теорема | ||
− | |statement= | + | |statement=Декомпозиция является корректной тогда и только тогда, когда есть соответствующая множественная зависимость: <tex>R(XYZ) = \pi_{XY}(R) \bowtie \pi_{XZ}(R) \Leftrightarrow X \twoheadrightarrow Y </tex> |
|proof= | |proof= | ||
* <tex>\Rightarrow</tex> | * <tex>\Rightarrow</tex> | ||
− | **<tex>R(XYZ)=\pi_{XY}(R) \bowtie \pi_{XZ}(R) \ | + | **Запишем утверждение про корректную декомпозицию: <tex>R(XYZ)=\pi_{XY}(R) \bowtie \pi_{XZ}(R)</tex>. |
− | ** | + | **Рассмотрим произвольный кортеж из исходного отношения <tex>(x,y,z) \in R</tex>. |
+ | **Мы знаем, что его проекции принадлежат проекциям исходного отношения: <tex>(x,y) \in \pi_{XY}(R)∧(x,z) \in \pi_{XZ}(R)</tex>. | ||
+ | **<tex>(x,y,z) \in R \Leftrightarrow (x,y) \in \pi_{XY}(R)∧(x,z) \in \pi_{XZ}(R)</tex>. | ||
+ | **Возьмем произвольное дополнительное $z1$, которое было из проекции на $xz$, и произвольное $z2$ из той же проекции:<tex>(x,z1) \in \pi_{XZ}(R),(x,z2) \in \pi_{XZ}(R)</tex>. | ||
+ | |||
+ | Тогда если <tex>(x,y,z1) \in R</tex>, то <tex>(x,y) \in \pi_{XY}(R)</tex>. Если у нас есть <tex>(x, z2)</tex> и кортеж <tex>(x, y)</tex>, то при их соединении мы получим кортеж <tex>(x,y,z2)</tex>, который будет принадлежать естественному соединению. | ||
+ | |||
+ | Так как декомпозиция корректна, то <tex>(x,y,z2)\in R</tex>. | ||
+ | |||
+ | Итого от выбора конкретных $z1$ и $z2$ у нас наличие или отсутствие $y$ зависеть не может, все будет всегда одинаково. | ||
* <tex>\Leftarrow</tex> | * <tex>\Leftarrow</tex> | ||
− | ** <tex>\forall(x,y,z) \in \pi_{XY}(R) \bowtie \pi_{XZ}(R) | + | ** Возьмем любой кортеж из естественного соединения: <tex>\forall(x,y,z) \in \pi_{XY}(R) \bowtie \pi_{XZ}(R)</tex>. Он был получен из двух половинок: <tex>(x,y) \in \pi_{XY}(R)\wedge(x,z) \in \pi_{XY}(R)</tex> |
− | ** | + | ** Чтобы получилась вторая половинка (<tex>(x,z) \in \pi_{XY}(R)</tex>), то должно было существовать какой-то $y'$, такой, что $(x,y',z) \in R$. С другой стороны, для того, чтобы существовала первая половинка, должен был существовать какой-то $z'$, такой, что $(x,y,z') \in R$. |
− | + | ** По определению множественной зависимости если $(x,y',z) \in R$, $(x,y,z) \in R$ и $(x,y,z') \in R$, то у нас принадлежат все возможные варианты. Соответственно, <tex>(x,y,z) \in R \wedge (x,y',z') \in R </tex> | |
}} | }} | ||
+ | |||
+ | '''Примечание.''' Теорема является обобщением [[Цели_и_средства_нормализации|теоремы Хита]]. | ||
В отличие от теоремы Хита, где доказывалась только достаточность, в теореме Фейгина доказывается необходимость и достаточность. | В отличие от теоремы Хита, где доказывалась только достаточность, в теореме Фейгина доказывается необходимость и достаточность. | ||
Строка 61: | Строка 72: | ||
|statement=<tex>R(XYZ)</tex> и <tex>X \twoheadrightarrow Y \Rightarrow X \twoheadrightarrow Z</tex> | |statement=<tex>R(XYZ)</tex> и <tex>X \twoheadrightarrow Y \Rightarrow X \twoheadrightarrow Z</tex> | ||
|proof= | |proof= | ||
+ | В доказательстве теоремы Фейгина <tex>Y</tex> и <tex>Z</tex> равноправны. | ||
+ | |||
+ | |||
Из <tex>X \twoheadrightarrow Y</tex> по теореме Фейгина следует <tex>R(XYZ) = \pi_{XY}(R) \bowtie \pi_{XZ}(R).</tex> | Из <tex>X \twoheadrightarrow Y</tex> по теореме Фейгина следует <tex>R(XYZ) = \pi_{XY}(R) \bowtie \pi_{XZ}(R).</tex> | ||
Текущая версия на 19:34, 4 сентября 2022
Содержание
Мотивация. Аномалии в НФБК
Рассмотрим следующий пример:
Course | Lecturer | Book |
---|---|---|
СУБД | Корнеев Г. А. | Дейт |
СУБД | Корнеев Г. А. | Ульман |
Мат.Ан. | Кохась К. П. | Фихтенгольц |
Мат.Ан. | Виноградов О. Л. | Фихтенгольц |
В данном отношении подразумевается, что набор книг по курсу не зависит от преподавателя.
Тогда все атрибуты будут ключевыми: у курса и лектора бывает много книг, лектор может рекомендовать книгу по нескольким курсам, книгу для курса могут рекомендовать все лекторы этого курса. Поэтому здесь присутствуют только тривиальные функциональные зависимости, следовательно отношение находится в нормальной форме Бойса-Кодда.
При этом у нас будут все 3 вида аномалии:
- Вставки: невозможно указать литературу по курсу без преподавателя.
- Удаления: нельзя удалить преподавателя, не потеряв литературу по курсу.
- Изменения: если есть два преподавателя по одному и тому же курсу и один рекомендует книгу, а другой нет. При этом для курса должен быть конкретный набор книг.
Для таких случаев было введено понятие многозначной зависимости.
Многозначная зависимость
Определение: |
| многозначно определяет в отношении
Утверждение: |
Любая функциональная зависимость является множественной зависимостью. |
У $Y$ при фиксированном $X$ есть ровно одно значение. То есть мощность множества, которое зависит, равна одному. |
Теорема Фейгина
Теорема: |
Декомпозиция является корректной тогда и только тогда, когда есть соответствующая множественная зависимость: |
Доказательство: |
Тогда если , то . Если у нас есть и кортеж , то при их соединении мы получим кортеж , который будет принадлежать естественному соединению.Так как декомпозиция корректна, то .Итого от выбора конкретных $z1$ и $z2$ у нас наличие или отсутствие $y$ зависеть не может, все будет всегда одинаково.
|
Примечание. Теорема является обобщением теоремы Хита.
В отличие от теоремы Хита, где доказывалась только достаточность, в теореме Фейгина доказывается необходимость и достаточность.
Теорема о дополнении
Теорема: |
и |
Доказательство: |
В доказательстве теоремы Фейгина и равноправны.
Вследствие коммутативности Применяя еще раз теорему Фейгина, получаем, что |
обозначается: множественно определяет и .
Утверждение: |
Докажем от противного. Попробуем доказать, что данное утверждение неверно. По определению: для того, чтобы доказать, что множественная зависимость отсутствует, необходимо взять Итого, если одно из множеств пусто, то такая соответствующая множественная зависимость тривиальна и выполняется для всех отношений. , найти к нему два различных таких, что множества будут разные. Однако два различных в пустом множестве мы найти не можем. |
Определение: |
называется тривиальной множественной зависимостью. |
Четвертая нормальная форма
Определение: |
Отношение находится в четвертой нормальной форме (4НФ) тогда и только тогда, когда
|
Достижимость
Теорема: |
Любое отношение можно декомпозировать на отношения, находящиеся в 4НФ |
Доказательство: |
|
Пример приведения к 4НФ
Пусть задано отношение:
Course | Lecturer | Book |
---|---|---|
СУБД | Корнеев Г. А. | Дейт |
СУБД | Корнеев Г. А. | Ульман |
Мат.Ан. | Кохась К. П. | Фихтенгольц |
Мат.Ан. | Виноградов О. Л. | Фихтенгольц |
В данном отношении есть множественная зависимость:
, поэтому декомпозируем его следующим образом:Course | Lecturer |
---|---|
СУБД | Корнеев Г. А. |
СУБД | Корнеев Г. А. |
Мат.Ан. | Кохась К. П. |
Мат.Ан. | Виноградов О. Л. |
Course | Book |
---|---|
СУБД | Дейт |
СУБД | Ульман |
Мат.Ан. | Фихтенгольц |
Мат.Ан. | Фихтенгольц |
Теорема Фейгина гарантирует, что соответствующая декомпозиция будет корректной.