Функциональные зависимости: замыкание, эквивалентность и правила вывода

Материал из Викиконспекты
Версия от 22:42, 15 января 2021; Darkey (обсуждение | вклад) (Оценка мощности замыкания)
Перейти к: навигация, поиск

Функциональные зависимости

Определение и примеры

Правила вывода функциональных зависимостей

Замыкание множества функциональных зависимостей

Определение:
Замыкание множества функциональных зависимостей [math]S[/math] - множество всех функциональных зависимостей, обозначаемое [math]S^+[/math], которые следуют из заданного множества функциональных зависимостей [math]S[/math].

Построение

Set<E> buildClosure(s: Set<E>): 
  closure = Set<E>(s)
  changed = true
  while (changed): 
    changed = false
    for f in closure:
       for rule in rules:     //rules - правила вывода
         new_f = rule.apply(f, closure)
         changed = closure.add(new_f)    //add - возвращает true, если элемент был добавлен, false - иначе
  return closure

Эквивалентность множеств функциональных зависимостей

Здесь и далее [math]S, P[/math] - множества функциональных зависимостей.

Определение:
[math]S[/math] слабее [math]P[/math] ([math]P[/math] накрывает [math]S[/math]) тогда и только тогда, когда [math]S^+[/math] является подмножеством [math]P^+[/math]:
[math]S \sqsubset P \Leftrightarrow S^+ \subset P^+[/math]


Определение:
[math]S[/math] эквивалентно [math]P[/math]:
[math]S \equiv P \, \Leftrightarrow \, S \sqsubset P \; \textrm{and} \; P \sqsubset S \, \Leftrightarrow \, S^+ = P^+ [/math]


Оценка мощности замыкания

Для начала оценим количество тривиальных ФЗ на [math]n[/math] атрибутах. Количество способов выбрать [math]k[/math] атрибутов из [math]n[/math] для левой части ФЗ - [math]{\binom {n}{k}}[/math], количество способов выбрать непустое подмножество из левой части для правой - [math]2^k - 1[/math]. Известно, что [math]\sum _{k=0}^{n}{\binom {n}{k}}x^{k}=(1+x)^{n}[/math]. Значит количество тривиальных ФЗ: [math]\sum _{k=0}^{n}{\binom {n}{k}}(2^{k} - 1)=O(3^{n})[/math]. Заметим, что при построении замыкания нельзя не учитывать тривиальные зависимости, так как при применении правил вывода, правила композиции, например, к нетривиальной и тривиальной зависимостям можно получить в итоге нетривиальную зависимость. Получается, что мощность порядка [math]O(m3^n)[/math], где [math]m[/math] - базовые нетривиальные зависимости.

На практике замыкания ФЗ не применимы, так как мощность в реальных приложениях слишком велика.

Задача минимизации ФЗ

Постановка задачи

Найти минимальное множество ФЗ эквивалентное заданному. То есть необходимо найти множество ФЗ [math]P[/math] такое, что замыкание [math]S[/math] и [math]P[/math] совпадают и множество [math]P[/math] имеет меньшую мощность, чем [math]S[/math]. Это позволит снизить нагрузку на базу данных. Но такой подход к решению задачи не применим на практике из-за большой мощности замыкания.