Соединения
Определение: |
Соединение (англ. Join) — общее наименование для бинарных операторов на отношениях, позволяющих некоторым образом соединить данные из двух отношений в одно. |
Полное соединение
Определение: |
Полным, или декартовым соединением (англ. Cross join, Cartesian join) двух отношений [math]R_1[/math] и [math]R_2[/math], у которых нет общих атрибутов, называется отношение, в котором заголовок является объединением заголовков [math]R_1[/math] и [math]R_2[/math], а тело — декартовым произведением тел [math]R_1[/math] и [math]R_2[/math]. Обозначение: [math]R_1 \times R_2[/math] |
В случае, если у двух отношений есть хотя бы один общий атрибут в заголовке, их полное соединение не определено.
Пример
Рассмотрим два отношения:
Id1
|
FirstName
|
1
|
Иван
|
2
|
Пётр
|
3
|
Сидор
|
Id2
|
LastName
|
1
|
Иванов
|
3
|
Петров
|
4
|
Сидоров
|
Их полным соединением будет следующее отношение:
Id1
|
FirstName
|
Id2
|
LastName
|
1
|
Иван
|
1
|
Иванов
|
1
|
Иван
|
3
|
Петров
|
1
|
Иван
|
4
|
Сидоров
|
2
|
Пётр
|
1
|
Иванов
|
2
|
Пётр
|
3
|
Петров
|
2
|
Пётр
|
4
|
Сидоров
|
3
|
Сидор
|
1
|
Иванов
|
3
|
Сидор
|
3
|
Петров
|
3
|
Сидор
|
4
|
Сидоров
|
Естественное соединение
Определение: |
Естественным соединением (англ. Natural join) двух отношений [math]R_1[/math] и [math]R_2[/math] называется отношение, в котором заголовок является объединением заголовков [math]R_1[/math] и [math]R_2[/math], а тело состоит из кортежей, полученных всевозможными соединениями кортежей [math]R_1[/math] и [math]R_2[/math], имеющих равные значения одноимённых атрибутов. Обозначение: [math]R_1 \Join R_2[/math] |
Пример
Рассмотрим два отношения:
Id
|
FirstName
|
1
|
Иван
|
2
|
Пётр
|
3
|
Сидор
|
Id
|
LastName
|
1
|
Иванов
|
1
|
Петров
|
2
|
Сидоров
|
Их естественным соединением будет следующее отношение:
Id
|
FirstName
|
LastName
|
1
|
Иван
|
Иванов
|
1
|
Иван
|
Петров
|
2
|
Пётр
|
Сидоров
|
Свойства
Замечание. Здесь и далее под теоретико-множественными операциями над отношениями (мощность отношения, включение одного отношения в другое и т.д.) будем иметь ввиду соответствующие операции над телами отношений.
- Если [math]|R_1| = m[/math] и [math]|R_2| = n[/math], то [math]0 \leq |R_1 \Join R_2| \leq mn[/math].
- [math]|R_1 \Join R_2| = 0[/math] достигается, если у общих атрибутов в [math]R_1[/math] и [math]R_2[/math] нет равных значений
- [math]|R_1 \Join R_2| = mn[/math] достигается, в частности, при отсутствии общих атрибутов у [math]R_1[/math] и [math]R_2[/math] (в такой ситуации естественное соединение совпадает с полным: [math]R_1 \Join R_2 = R_1 \times R_2[/math])
Внешние соединения
Определение: |
Левым соединением (англ. Left join или Left outer join) двух отношений [math]R_1[/math] и [math]R_2[/math] называется отношение, в котором заголовок является объединением заголовков [math]R_1[/math] и [math]R_2[/math], а тело состоит из кортежей, полученных всевозможными соединениями кортежей [math]R_1[/math] и [math]R_2[/math], имеющих равные значения одноимённых атрибутов. Если по одноимённым атрибутам кортежу из [math]R_1[/math] не соответствует ни одного кортежа из [math]R_2[/math], то в результат добавляется этот кортеж из [math]R_1[/math], дополненный пустыми значениями. Обозначение: [math]R_1 \, ⟕ \, R_2[/math] |
Определение: |
Правым соединением (англ. Right join или Right outer join) двух отношений [math]R_1[/math] и [math]R_2[/math] называется отношение, в котором заголовок является объединением заголовков [math]R_1[/math] и [math]R_2[/math], а тело состоит из кортежей, полученных всевозможными соединениями кортежей [math]R_1[/math] и [math]R_2[/math], имеющих равные значения одноимённых атрибутов. Если по одноимённым атрибутам кортежу из [math]R_2[/math] не соответствует ни одного кортежа из [math]R_1[/math], то в результат добавляется этот кортеж из [math]R_2[/math], дополненный пустыми значениями. Обозначение: [math]R_1 \, ⟖ \, R_2[/math] |
Определение: |
Внешним соединением (англ. Outer join или Full outer join) двух отношений [math]R_1[/math] и [math]R_2[/math] называется отношение, в котором заголовок является объединением заголовков [math]R_1[/math] и [math]R_2[/math], а тело состоит из кортежей, полученных всевозможными соединениями кортежей [math]R_1[/math] и [math]R_2[/math], имеющих равные значения одноимённых атрибутов. Если по одноимённым атрибутам кортежу из одного отношения не соответствует ни одного кортежа из другого, то в результат добавляется этот кортеж, дополненный пустыми значениями. Обозначение: [math]R_1 \, ⟗ \, R_2[/math] |
Пример
Рассмотрим два отношения ([math]R_1[/math] и [math]R_2[/math] соответственно):
Id
|
FirstName
|
1
|
Иван
|
2
|
Пётр
|
3
|
Сидор
|
Id
|
LastName
|
1
|
Иванов
|
1
|
Петров
|
3
|
Сидоров
|
4
|
Плюшкин
|
Тогда [math]R_1 \, ⟕ \, R_2[/math] (левое соединение) равно:
Id
|
FirstName
|
LastName
|
1
|
Иван
|
Иванов
|
1
|
Иван
|
Петров
|
2
|
Пётр
|
|
3
|
Сидор
|
Сидоров
|
[math]R_1 \, ⟖ \, R_2[/math] (правое соединение) равно:
Id
|
FirstName
|
LastName
|
1
|
Иван
|
Иванов
|
1
|
Иван
|
Петров
|
3
|
Сидор
|
Сидоров
|
4
|
|
Плюшкин
|
[math]R_1 \, ⟗ \, R_2[/math] (внешнее соединение) равно:
Id
|
FirstName
|
LastName
|
1
|
Иван
|
Иванов
|
1
|
Иван
|
Петров
|
2
|
Пётр
|
|
3
|
Сидор
|
Сидоров
|
4
|
|
Плюшкин
|
Свойства
Непосредственно из определений вытекают следующие свойства:
- [math]R_1 \, ⟕ \, R_2 = (R_1 \Join R_2) \cup (R_1 \setminus \pi_{R_1}(R_1 \Join R_2))[/math]
- Замечание 1. [math]R_1 \setminus \pi_{R_1}(R_1 \Join R_2)[/math] — это и есть кортежи из [math]R_1[/math], которым не соответствует ни один кортеж из [math]R_2[/math]
- Замечание 2. Множество атрибутов у [math]R_1 \Join R_2[/math] есть надмножество атрибутов у [math]R_1 \setminus \pi_{R_1}(R_1 \Join R_2)[/math]. Подразумевается, что у [math]R_1 \setminus \pi_{R_1}(R_1 \Join R_2)[/math] недостающие атрибуты дополняются значениями [math]null[/math], чтобы операция объединения была определена
- [math]R_1 \, ⟖ \, R_2 = (R_1 \Join R_2) \cup (R_2 \setminus \pi_{R_2}(R_1 \Join R_2))[/math]
- [math]R_1 \, ⟗ \, R_2 = (R_1 \Join R_2) \cup (R_1 \setminus \pi_{R_1}(R_1 \Join R_2)) \cup (R_2 \setminus \pi_{R_2}(R_1 \Join R_2))[/math]
Из этих свойств, в свою очередь, следует:
- [math]R_1 \, ⟕ \, R_2 = R_2 \, ⟖ \, R_1[/math]
- [math]R_1 \, ⟗ \, R_2 = (R_1 \, ⟕ \, R_2) \cup (R_1 \, ⟖ \, R_2)[/math]
Полусоединения
Определение: |
Левым полусоединением (англ. Left semijoin) двух отношений [math]R_1[/math] и [math]R_2[/math] называется отношение, в котором заголовок равен заголовку [math]R_1[/math], а тело состоит из кортежей в [math]R_1[/math], для которых существует кортеж из [math]R_2[/math] с равными значениями одноимённых атрибутов. Обозначение: [math]R_1 \ltimes R_2[/math] |
Определение: |
Правым полусоединением (англ. Right semijoin) двух отношений [math]R_1[/math] и [math]R_2[/math] называется отношение, в котором заголовок равен заголовку [math]R_2[/math], а тело состоит из кортежей в [math]R_2[/math], для которых существует кортеж из [math]R_1[/math] с равными значениями одноимённых атрибутов. Обозначение: [math]R_1 \rtimes R_2[/math] |
Пример
Рассмотрим два отношения ([math]R_1[/math] и [math]R_2[/math] соответственно):
Id
|
FirstName
|
1
|
Иван
|
2
|
Пётр
|
3
|
Сидор
|
Id
|
LastName
|
1
|
Иванов
|
1
|
Петров
|
3
|
Сидоров
|
4
|
Плюшкин
|
Тогда [math]R_1 \ltimes R_2[/math] (левое полусоединение) равно:
Id
|
FirstName
|
1
|
Иван
|
3
|
Сидор
|
[math]R_1 \rtimes R_2[/math] (правое полусоединение) равно:
Id
|
LastName
|
1
|
Иванов
|
1
|
Петров
|
3
|
Сидоров
|
Свойства
Из определения следует:
- [math]R_1 \ltimes R_2 = \pi_{R_1}(R_1 \Join R_2)[/math]
- [math]R_1 \rtimes R_2 = \pi_{R_2}(R_1 \Join R_2)[/math]
- [math]R_1 \ltimes R_2 = R_2 \rtimes R_1[/math]
Подставив [math]R_1 \ltimes R_2[/math] и [math]R_1 \rtimes R_2[/math] в соответствующие свойства [math]R_1 \, ⟕ \, R_2[/math] и [math]R_1 \, ⟖ \, R_2[/math], получим:
- [math]R_1 \, ⟕ \, R_2 = (R_1 \Join R_2) \cup (R_1 \setminus (R_1 \ltimes R_2))[/math]
- [math]R_1 \, ⟖ \, R_2 = (R_1 \Join R_2) \cup (R_2 \setminus (R_1 \rtimes R_2))[/math]
- [math]R_1 \, ⟗ \, R_2 = (R_1 \Join R_2) \cup (R_1 \setminus (R_1 \ltimes R_2)) \cup (R_2 \setminus (R_1 \rtimes R_2))[/math]
Условные соединения
Определение: |
Условным соединением (англ. Conditional join) двух отношений [math]R_1[/math] и [math]R_2[/math], у которых нет общих атрибутов, по условию [math]\theta[/math] называется отношение, в котором заголовок является объединением заголовков [math]R_1[/math] и [math]R_2[/math], а кортежами тела являются всевозможные конкатенации кортежей тел [math]R_1[/math] и [math]R_2[/math], удовлетворяющих условию [math]\theta[/math]. Обозначение: [math]R_1 \times_{\theta} R_2[/math] |
Определение: |
Левым условным соединением (англ. Left conditional join) двух отношений [math]R_1[/math] и [math]R_2[/math], у которых нет общих атрибутов, по условию [math]\theta[/math] называется отношение, в котором заголовок является объединением заголовков [math]R_1[/math] и [math]R_2[/math], а кортежами тела являются всевозможные конкатенации кортежей тел [math]R_1[/math] и [math]R_2[/math], удовлетворяющих условию [math]\theta[/math]. Если в результате кортежу из [math]R_1[/math] не соответствует ни одного кортежа из [math]R_2[/math], то в результат добавляется этот кортеж из [math]R_1[/math], дополненный пустыми значениями. Обозначение: [math]R_1 \, ⟕_{\theta} \, R_2[/math] |
Определение: |
Правым условным соединением (англ. Right conditional join) двух отношений [math]R_1[/math] и [math]R_2[/math], у которых нет общих атрибутов, по условию [math]\theta[/math] называется отношение, в котором заголовок является объединением заголовков [math]R_1[/math] и [math]R_2[/math], а кортежами тела являются всевозможные конкатенации кортежей тел [math]R_1[/math] и [math]R_2[/math], удовлетворяющих условию [math]\theta[/math]. Если в результате кортежу из [math]R_2[/math] не соответствует ни одного кортежа из [math]R_1[/math], то в результат добавляется этот кортеж из [math]R_2[/math], дополненный пустыми значениями. Обозначение: [math]R_1 \, ⟖_{\theta} \, R_2[/math] |
Определение: |
Внешним условным соединением (англ. Outer conditional join) двух отношений [math]R_1[/math] и [math]R_2[/math], у которых нет общих атрибутов, по условию [math]\theta[/math] называется отношение, в котором заголовок является объединением заголовков [math]R_1[/math] и [math]R_2[/math], а кортежами тела являются всевозможные конкатенации кортежей тел [math]R_1[/math] и [math]R_2[/math], удовлетворяющих условию [math]\theta[/math]. Если в результате кортежу из одного отношения не соответствует ни одного кортежа из другого, то в результат добавляется этот кортеж, дополненный пустыми значениями. Обозначение: [math]R_1 \, ⟗_{\theta} \, R_2[/math] |
Пример
Рассмотрим два отношения ([math]R_1[/math] и [math]R_2[/math] соответственно):
Id1
|
FirstName
|
1
|
Иван
|
2
|
Пётр
|
3
|
Сидор
|
Id2
|
LastName
|
1
|
Иванов
|
1
|
Петров
|
3
|
Сидоров
|
4
|
Плюшкин
|
Тогда [math]R_1 \, ⟕_{\text{length(FirstName)}+2\lt \text{length(LastName)}} \, R_2[/math] равно:
Id1
|
FirstName
|
Id2
|
LastName
|
1
|
Иван
|
3
|
Сидоров
|
1
|
Иван
|
4
|
Плюшкин
|
2
|
Пётр
|
3
|
Сидоров
|
2
|
Пётр
|
4
|
Плюшкин
|
3
|
Сидор
|
|
|
Свойства
Из определений следует:
- [math]R_1 \times_{\theta} R_2 = \sigma_{\theta}(R_1 \times R_2)[/math]
- [math]R_1 \, ⟕_{\theta} \, R_2 = J \cup (R_1 \setminus \pi_{R_1}(J))[/math], где [math]J = \sigma_{\theta}(R_1 \times R_2)[/math]
- [math]R_1 \, ⟖_{\theta} \, R_2 = J \cup (R_2 \setminus \pi_{R_2}(J))[/math], где [math]J = \sigma_{\theta}(R_1 \times R_2)[/math]
- [math]R_1 \, ⟗_{\theta} \, R_2 = J \cup (R_1 \setminus \pi_{R_1}(J)) \cup (R_2 \setminus \pi_{R_2}(J))[/math], где [math]J = \sigma_{\theta}(R_1 \times R_2)[/math]
Из свойств выше нетрудно вывести:
- [math]R_1 \, ⟕_{\theta} \, R_2 = R_2 \, ⟖_{\theta} \, R_1[/math]
- [math]R_1 \, ⟗_{\theta} \, R_2 = (R_1 \, ⟕_{\theta} \, R_2) \cup (R_1 \, ⟖_{\theta} \, R_2)[/math]
Деление
Деление
Определение: |
Пусть даны отношения [math]A[/math] с заголовком [math]X \cup Y[/math] и отношение [math]B[/math] с заголовком [math]Y[/math]. Тогда делением (англ. Division) [math]A[/math] на [math]B[/math] называется максимальное по включению отношение [math]C[/math] с заголовком [math]X[/math], такое что [math]B \times C \subseteq A[/math]. Обозначение: [math]A \div B[/math] |
Определение деления в реляционной алгебре хорошо перекликается с определением деления с остатком в арифметике: «Частным от деления целого числа [math]a[/math] на натуральное число [math]b[/math] называется максимальное целое [math]c[/math], такое что [math]bc \leq a[/math].»
Пример
Рассмотрим следующие отношения, [math]A[/math] и [math]B[/math] соответственно:
Id
|
FirstName
|
1
|
Иван
|
2
|
Иван
|
1
|
Пётр
|
2
|
Пётр
|
3
|
Пётр
|
1
|
Сидор
|
3
|
Сидор
|
Тогда результатом деления [math]A[/math] на [math]B[/math] будут такие имена (FirstName), которые в отношении [math]A[/math] ассоциированы и с [math]Id = 1[/math], и с [math]Id = 2[/math]. Итого получим:
Свойства
- [math]A \div B = \{x \in \pi_X(A) \, | \, \forall y \in B: \,\, (x, y) \in A\}[/math] — интерпретация определения на языке кванторов
- [math]A \div B = \pi_X(A) \setminus \pi_X(\pi_X(A) \times B \setminus A)[/math] — выражение деления через простейшие операции реляционной алгебры
- Объяснение. [math]\pi_X(A) \times B \setminus A[/math] это все такие пары [math](x, y) \in X \times Y[/math], что [math]x \in \pi_X(A)[/math], но [math](x, y) \notin A[/math].
- Тогда [math]\pi_X(\pi_X(A) \times B \setminus A)[/math] — это все [math]x \in \pi_X(A)[/math], такие что [math]\{x\} \times B \not\subseteq A[/math].
- Тогда [math]\pi_X(A) \setminus \pi_X(\pi_X(A) \times B \setminus A)[/math] — это максимальное по включению [math]C \subseteq \pi_X(A)[/math], что [math]C \times B \subseteq A[/math] — то есть, в точности результат деления [math]A[/math] на [math]B[/math] по определению
Большое деление
Определение: |
Пусть даны отношения [math]A[/math] с заголовком [math]X \cup Y[/math] и отношение [math]B[/math] с заголовком [math]Y \cup Z \,\,\,\, (X \cap Z = \varnothing)[/math]. Тогда большим делением (англ. Great division) [math]A[/math] на [math]B[/math] называется максимальное по включению отношение с заголовком [math]X \cup Z[/math], такое что для каждого [math](x, z) \in X \times Z[/math] верно [math]\{x\} \times \pi_Y(\sigma_{Z=z}(B)) \subseteq A[/math]. Обозначение: [math]A ⋇ B[/math] |
Пример
Рассмотрим следующие отношения, [math]A[/math] и [math]B[/math] соответственно:
Id
|
FirstName
|
1
|
Иван
|
2
|
Иван
|
1
|
Пётр
|
2
|
Пётр
|
3
|
Пётр
|
1
|
Сидор
|
3
|
Сидор
|
Id
|
LastName
|
1
|
Иванов
|
2
|
Иванов
|
1
|
Петров
|
3
|
Сидоров
|
Тогда результатом большого деления [math]A[/math] на [math]B[/math] будет:
FirstName
|
LastName
|
Иван
|
Иванов
|
Иван
|
Петров
|
Пётр
|
Иванов
|
Пётр
|
Петров
|
Пётр
|
Сидоров
|
Сидор
|
Петров
|
Сидор
|
Сидоров
|
Объяснение. Чтобы найти результат большого деления, переберём всевозможные [math](x, z) \in X \times Z[/math]. В нашем случае [math]X = \{(Иван), (Пётр), (Сидор)\}, Z = \{(Иванов), (Петров), (Сидоров)\}[/math].
Возьмём [math](x, z) = (Иван, Иванов)[/math]. Тогда [math]\pi_Y(\sigma_{Z=Иванов}(B)) = \{(1), (2)\}[/math]. Тогда [math]\{Иван\} \times \pi_Y(\sigma_{Z=Иванов}(B)) = \{(1, Иван), (2, Иван)\}[/math], что является подмножеством [math]A[/math]. Значит, [math](Иван, Иванов)[/math] есть в результате большого деления.
Возьмём [math](x, z) = (Иван, Петров)[/math]. Тогда [math]\pi_Y(\sigma_{Z=Петров}(B)) = \{(1)\}[/math]. Тогда [math]\{Иван\} \times \pi_Y(\sigma_{Z=Петров}(B)) = \{(1, Иван)\}[/math], что является подмножеством [math]A[/math]. Значит, [math](Иван, Петров)[/math] есть в результате большого деления.
Возьмём [math](x, z) = (Иван, Сидоров)[/math]. Тогда [math]\pi_Y(\sigma_{Z=Сидоров}(B)) = \{(3)\}[/math]. Тогда [math]\{Иван\} \times \pi_Y(\sigma_{Z=Сидоров}(B)) = \{(3, Иван)\}[/math], что не является подмножеством [math]A[/math]. Значит, элемента [math](Иван, Сидоров)[/math] нет в результате большого деления.
Аналогично перебираются 6 оставшихся элементов [math]X \times Z[/math].
Свойства
- [math]A ⋇ B = \{(x, z) \in \pi_X(A) \times \pi_Z(B) \, | \, \forall y \in \pi_Y(\sigma_{Z=z}(B)): \,\, (x, y) \in A\}[/math] — интерпретация определения на языке кванторов
- Если [math]C = A ⋇ B[/math], то для каждого [math]z \in Z[/math] верно [math]\pi_X(\sigma_{Z=z}(C)) = A \div \pi_Y(\sigma_{Z=z}(B))[/math] — интерпретация большого деления как "деление для каждого [math]z[/math]"
- [math]A ⋇ B = \pi_X(A) \times \pi_Z(B) \setminus \pi_{XZ}(\pi_X(A) \times B \setminus A \Join B)[/math] — выражение большого деления через простейшие операции реляционной алгебры
Литература
- Дейт К. Введение в системы баз данных (глава 7)
- Уидом Д., Ульман Д. Основы реляционных баз данных (главы 4 и 5)