Цели и средства нормализации
Определение: |
Нормализация — процесс преобразования отношений реляционной базы данных к виду, отвечающему одной из нормальных форм. |
Нормализация помогает привести базу данных к виду обеспечивающему минимальную логическую избыточность. Эта цель достигается благодаря тому, что в полностью нормализованном проекте предикаты переменных отношения имеют более простой вид.
Содержание
Цели
- Исключение некоторых типов избыточности
- Устранение аномалий
- Разработка проекта базы данных, который является достаточно «качественным» представлением реального мира, интуитивно понятен и может служить хорошей основой для последующего расширения
- Упрощение процедуры применения необходимых ограничений целостности
Следствия
Полная нормализация приводит к увеличению количества логически независимых переменных отношения, что может привести к снижению скорости выборки ⇒ к замедлению работы базы данных.
Средства нормализации
Для приведения базы данных в нормальную форму будет применяться декомпозиция без потерь. При построении такой декомпозиции используются операции соединения и проекции.
Проекция
Определение: |
Проекция отношения
| на множество атрибутов : — это отношение удовлетворяющее свойствам:
Соединение
Операция соединения имеет несколько разных вариантов, но чаще всего рассматривается естественное соединение.
Определение: |
Естественное соединение (англ. natural join) отношений | и : — отношение с заголовком и телом, состоящим из всех таких кортежей , , . . . , , что любой из этих кортежей присутствует и в отношении , со значением атрибута и значением атрибута , и в отношении , со значением атрибута и значением атрибута .
- Можно понимать как соединение по совпадающим атрибутам
- Коммутативно:
- Ассоциативно:
Декомпозиция
Процедура нормализации предусматривает разбиение, или декомпозицию, данной переменной отношения на другие переменные отношения, причем декомпозиция должна быть обратимой, т.е. выполняться без потерь информации, то есть, соединение отношений, полученных при декомпозиции множества, должно давать исходное отношение Декомпозиция отношения
на множества атрибутов и :Пример корректной декомпозиции
Проекции на CId Phone и Lecturer Phone | Соединение CId Lecturer и Lecturer Phone |
Пример некорректной декомпозиции
При обратном соединении полученных отношений исходное отношений не было восстановлено — появились записи, которых не было ⇒ декомпозиция некорректна.
Проекции на CId Phone и Lecturer Phone | Соединение CId Phone и Lecturer Phone |
Теорема Хита
Теорема Хита утверждает, что если некоторая декомпозиция выполняется в соответствии с определенной функциональной зависимостью, то она будет выполнена без потерь.
Теорема (Хит): |
Пусть является отношением, где , и — неперескающиеся множества атрибутов. Если удовлетворяет функциональной зависимости , то равно соединению его проекций по атрибутам , и , : |
Доказательство: |
Докажем равенство в обе стороны: 1. Докажем, что исходное отношение — подмножество соединения проекций.Рассмотрим произвольный кортеж из отношения .Для проекций кортежа на и выполняетя: .Из этого следует, что — подмножество соединения проекций ⋈ .2. Докажем, что любой кортеж полученного соединения является кортежем отношения .Рассмотрим кортеж , принадлежащий соединениюДля того, чтобы был в соеденении, необходимо, чтобы существовали кортежи иИз Поскольку следует, что существует кортеж для некоторого . Это означает, что должен существовать кортеж , существует единственный |
Доказательсто первого пункта не опирается на наличие функциональной зависимости ⇒ справедливо следствие:
Следствие Исходное отношение
всегда является подмножеством соединения отношений, полученных при декомпозиции.См. также
- Функциональные зависимости: замыкание, эквивалентность и правила вывода
- Нормальные формы: первая и вторая
- Нормальные формы: третья и Бойса-Кодда
- Многозначные зависимости и четвертая нормальная форма
- Зависимости соединения и пятая нормальная форма
Источники информации
- kgeorgiy.info Тема 4. Нормализация баз данных
- Дейт К.: Введение в системы баз данных (Глава 12)