Неполные данные и null — различия между версиями

Материал из Викиконспекты
Перейти к: навигация, поиск
м
м (Типы столбцов)
(не показано 26 промежуточных версий этого же участника)
Строка 1: Строка 1:
 +
{{В разработке}}
 +
 
== Что означает null ==
 
== Что означает null ==
 +
Представим себе таблицы в БД университета ИТМО
 +
* ''Students(StudentId, StudentName, GroupId)''
 +
* ''Groups(GroupId, GroupName)''
 +
Что может означать тот факт, что у студента '''null''' в столбце GroupId?
 +
* Значение неизвестно (нет информации, из какой группы студент)
 +
* Значение неверно (студент учится в какой-то группе, но эта группа не представлена в БД)
 +
* Значение еще/уже не существует (студент был зачислен, но еще не распределен в группу или уже отчислен)
 +
* Значение не имеет смысла (студент из другого университета, который пришел с какими-то целями в ИТМО)
 +
* Значение недоступно (недостаточно прав узнать группу)
 +
На основе этих предположений можно сделать вывод, что значение '''null''' сильно зависит от контекста (какую предметную область мы моделируем итд.).<br>
 +
Вполне возможно, что возникнет необходимость различать разные виды того, что значение в том или ином смысле отсутствует.
 +
== Можно ли обойтись без null? ==
 +
Как представить кортеж с неопределенными частями в нашем случае?
 +
* Разбить на 2 группы и сделать необязательную связь 1:1. В таком случае, в дополнительной таблице будет запись ''(StudentId, GroupId)'' тогда и только тогда, когда у студента определена группа
 +
=== Где еще появляется null ===
 +
* Результаты внешних соединений
 +
* Результаты множественных операций
 +
Оказывается, что в некоторых случаях без null не обойтись и надо уметь с ним работать.
 
== Операции с null ==
 
== Операции с null ==
 +
=== Тернарная логика ===
 +
С точки зрения SQL, результат логического выражения может быть ''true'', ''false'' или ''unknown''.<br>
 +
С другой стороны есть тип ''boolean'', и у него есть 3 значения: ''true'', ''false'' и '''''null''''' <br>
 +
То есть формально ''unknown'' - это результат вычисления, а '''''null''''' - это конкретное значение, которое может быть записано в БД. На практике ''unknown'' представляется значением '''''null''''', и это различие не будет иметь большого значения.
 +
==== Логические операции ====
 +
===== Конъюнкция =====
 +
{| style="background-color:#CCC;margin:0.5px;text-align:center"
 +
!style="background-color:#EEE;color:#00F"| <tex>\bf{and}</tex>
 +
!style="background-color:#EEE"| <tex>\bf{true}</tex>
 +
!style="background-color:#EEE"| <tex>\bf{unknown}</tex>
 +
!style="background-color:#EEE"| <tex>\bf{false}</tex>
 +
|-
 +
|style="background-color:#EEE;padding:2px 30px"| <tex>\bf{true}</tex>
 +
|style="background-color:#FFF;padding:2px 30px"| <tex>true</tex>
 +
|style="background-color:#FFF;padding:2px 30px"| <tex>unknown</tex>
 +
|style="background-color:#FFF;padding:2px 30px"| <tex>false</tex>
 +
|-
 +
|style="background-color:#EEE;padding:2px 30px"| <tex>\bf{unknown}</tex>
 +
|style="background-color:#FFF;padding:2px 30px"| <tex>unknown</tex>
 +
|style="background-color:#FFF;padding:2px 30px"| <tex>unknown</tex>
 +
|style="background-color:#FFF;padding:2px 30px"| <tex>false</tex>
 +
|-
 +
|style="background-color:#EEE;padding:2px 30px"| <tex>\bf{false}</tex>
 +
|style="background-color:#FFF;padding:2px 30px"| <tex>false</tex>
 +
|style="background-color:#FFF;padding:2px 30px"| <tex>false</tex>
 +
|style="background-color:#FFF;padding:2px 30px"| <tex>false</tex>
 +
|}
 +
 +
===== Дизъюнкция =====
 +
{| style="background-color:#CCC;margin:0.5px;text-align:center"
 +
!style="background-color:#EEE;color:#00F"| <tex>\bf{or}</tex>
 +
!style="background-color:#EEE"| <tex>\bf{true}</tex>
 +
!style="background-color:#EEE"| <tex>\bf{unknown}</tex>
 +
!style="background-color:#EEE"| <tex>\bf{false}</tex>
 +
|-
 +
|style="background-color:#EEE;padding:2px 30px"| <tex>\bf{true}</tex>
 +
|style="background-color:#FFF;padding:2px 30px"| <tex>true</tex>
 +
|style="background-color:#FFF;padding:2px 30px"| <tex>true</tex>
 +
|style="background-color:#FFF;padding:2px 30px"| <tex>true</tex>
 +
|-
 +
|style="background-color:#EEE;padding:2px 30px"| <tex>\bf{unknown}</tex>
 +
|style="background-color:#FFF;padding:2px 30px"| <tex>true</tex>
 +
|style="background-color:#FFF;padding:2px 30px"| <tex>unknown</tex>
 +
|style="background-color:#FFF;padding:2px 30px"| <tex>unknown</tex>
 +
|-
 +
|style="background-color:#EEE;padding:2px 30px"| <tex>\bf{false}</tex>
 +
|style="background-color:#FFF;padding:2px 30px"| <tex>true</tex>
 +
|style="background-color:#FFF;padding:2px 30px"| <tex>unknown</tex>
 +
|style="background-color:#FFF;padding:2px 30px"| <tex>false</tex>
 +
|}
 +
 +
===== Отрицание =====
 +
{| style="background-color:#CCC;margin:0.5px;text-align:center"
 +
!style="background-color:#EEE;color:#00F"| <tex></tex>
 +
!style="background-color:#EEE"| <tex>\bf{true}</tex>
 +
!style="background-color:#EEE"| <tex>\bf{unknown}</tex>
 +
!style="background-color:#EEE"| <tex>\bf{false}</tex>
 +
|-
 +
|style="background-color:#EEE;color:#00F;;padding:2px 30px"| <tex>\bf{not}</tex>
 +
|style="background-color:#FFF;padding:2px 30px"| <tex>false</tex>
 +
|style="background-color:#FFF;padding:2px 30px"| <tex>unknown</tex>
 +
|style="background-color:#FFF;padding:2px 30px"| <tex>true</tex>
 +
|}
 +
 +
===== Импликация =====
 +
TODO: уточнить
 +
* A → B = (not A) or B
 +
{| style="background-color:#CCC;margin-left:2rem;text-align:center"
 +
!style="background-color:#EEE;color:#00F"| <tex>\bf{(not\ A)\ or\ B}</tex>
 +
!style="background-color:#EEE"| <tex>\bf{true}</tex>
 +
!style="background-color:#EEE"| <tex>\bf{unknown}</tex>
 +
!style="background-color:#EEE"| <tex>\bf{false}</tex>
 +
|-
 +
|style="background-color:#EEE;padding:2px 30px"| <tex>\bf{true}</tex>
 +
|style="background-color:#FFF;padding:2px 30px"| <tex>true</tex>
 +
|style="background-color:#FFF;padding:2px 30px"| <tex>unknown</tex>
 +
|style="background-color:#FFF;padding:2px 30px"| <tex>false</tex>
 +
|-
 +
|style="background-color:#EEE;padding:2px 30px"| <tex>\bf{unknown}</tex>
 +
|style="background-color:#FFF;padding:2px 30px"| <tex>true</tex>
 +
|style="background-color:#FFF;padding:2px 30px"| <tex>unknown</tex>
 +
|style="background-color:#FFF;padding:2px 30px"| <tex>unknown</tex>
 +
|-
 +
|style="background-color:#EEE;padding:2px 30px"| <tex>\bf{false}</tex>
 +
|style="background-color:#FFF;padding:2px 30px"| <tex>true</tex>
 +
|style="background-color:#FFF;padding:2px 30px"| <tex>true</tex>
 +
|style="background-color:#FFF;padding:2px 30px"| <tex>true</tex>
 +
|}
 +
 +
* A → B = not (A and not B)
 +
{| style="background-color:#CCC;margin-left:2rem;text-align:center"
 +
!style="background-color:#EEE;color:#00F"| <tex>\bf{not\ (A\ and\ not\ B)}</tex>
 +
!style="background-color:#EEE"| <tex>\bf{true}</tex>
 +
!style="background-color:#EEE"| <tex>\bf{unknown}</tex>
 +
!style="background-color:#EEE"| <tex>\bf{false}</tex>
 +
|-
 +
|style="background-color:#EEE;padding:2px 30px"| <tex>\bf{true}</tex>
 +
|style="background-color:#FFF;padding:2px 30px"| <tex>true</tex>
 +
|style="background-color:#FFF;padding:2px 30px"| <tex>unknown</tex>
 +
|style="background-color:#FFF;padding:2px 30px"| <tex>false</tex>
 +
|-
 +
|style="background-color:#EEE;padding:2px 30px"| <tex>\bf{unknown}</tex>
 +
|style="background-color:#FFF;padding:2px 30px"| <tex>true</tex>
 +
|style="background-color:#FFF;padding:2px 30px"| <tex>unknown</tex>
 +
|style="background-color:#FFF;padding:2px 30px"| <tex>unknown</tex>
 +
|-
 +
|style="background-color:#EEE;padding:2px 30px"| <tex>\bf{false}</tex>
 +
|style="background-color:#FFF;padding:2px 30px"| <tex>true</tex>
 +
|style="background-color:#FFF;padding:2px 30px"| <tex>true</tex>
 +
|style="background-color:#FFF;padding:2px 30px"| <tex>true</tex>
 +
|}
 +
Оказывается что законы Де Моргана в данном случае '''не работают'''.
 +
 +
==== Сравнение ====
 +
===== = =====
 +
{| style="background-color:#CCC;margin:0.5px;text-align:center"
 +
!style="background-color:#EEE;color:#00F"| <tex>\bf{=}</tex>
 +
!style="background-color:#EEE"| <tex>\bf{true}</tex>
 +
!style="background-color:#EEE"| <tex>\bf{unknown}</tex>
 +
!style="background-color:#EEE"| <tex>\bf{false}</tex>
 +
|-
 +
|style="background-color:#EEE;padding:2px 30px"| <tex>\bf{true}</tex>
 +
|style="background-color:#FFF;padding:2px 30px"| <tex>true</tex>
 +
|style="background-color:#FFF;padding:2px 30px"| <tex>unknown</tex>
 +
|style="background-color:#FFF;padding:2px 30px"| <tex>false</tex>
 +
|-
 +
|style="background-color:#EEE;padding:2px 30px"| <tex>\bf{unknown}</tex>
 +
|style="background-color:#FFF;padding:2px 30px"| <tex>unknown</tex>
 +
|style="background-color:#FFF;padding:2px 30px"| <tex>unknown</tex>
 +
|style="background-color:#FFF;padding:2px 30px"| <tex>unknown</tex>
 +
|-
 +
|style="background-color:#EEE;padding:2px 30px"| <tex>\bf{false}</tex>
 +
|style="background-color:#FFF;padding:2px 30px"| <tex>false</tex>
 +
|style="background-color:#FFF;padding:2px 30px"| <tex>unknown</tex>
 +
|style="background-color:#FFF;padding:2px 30px"| <tex>екгу</tex>
 +
|}
 +
 +
===== is =====
 +
{| style="background-color:#CCC;margin:0.5px;text-align:center"
 +
!style="background-color:#EEE;color:#00F"| <tex></tex>
 +
!style="background-color:#EEE"| <tex>\bf{true}</tex>
 +
!style="background-color:#EEE"| <tex>\bf{unknown}</tex>
 +
!style="background-color:#EEE"| <tex>\bf{false}</tex>
 +
|-
 +
|style="background-color:#EEE;color:#00F;;padding:2px 30px"| <tex>\bf{is\ true}</tex>
 +
|style="background-color:#FFF;padding:2px 30px"| <tex>true</tex>
 +
|style="background-color:#FFF;padding:2px 30px"| <tex>false</tex>
 +
|style="background-color:#FFF;padding:2px 30px"| <tex>false</tex>
 +
|-
 +
|style="background-color:#EEE;color:#00F;;padding:2px 30px"| <tex>\bf{is\ unknown}</tex>
 +
|style="background-color:#FFF;padding:2px 30px"| <tex>false</tex>
 +
|style="background-color:#FFF;padding:2px 30px"| <tex>true</tex>
 +
|style="background-color:#FFF;padding:2px 30px"| <tex>false</tex>
 +
|-
 +
|style="background-color:#EEE;color:#00F;;padding:2px 30px"| <tex>\bf{is\ false}</tex>
 +
|style="background-color:#FFF;padding:2px 30px"| <tex>false</tex>
 +
|style="background-color:#FFF;padding:2px 30px"| <tex>false</tex>
 +
|style="background-color:#FFF;padding:2px 30px"| <tex>true</tex>
 +
|-
 +
|style="background-color:#EEE;color:#00F;;padding:2px 30px"| <tex>\bf{is\ not\ true}</tex>
 +
|style="background-color:#FFF;padding:2px 30px"| <tex>false</tex>
 +
|style="background-color:#FFF;padding:2px 30px"| <tex>true</tex>
 +
|style="background-color:#FFF;padding:2px 30px"| <tex>true</tex>
 +
|-
 +
|style="background-color:#EEE;color:#00F;;padding:2px 30px"| <tex>\bf{is\ not\ unknown}</tex>
 +
|style="background-color:#FFF;padding:2px 30px"| <tex>true</tex>
 +
|style="background-color:#FFF;padding:2px 30px"| <tex>false</tex>
 +
|style="background-color:#FFF;padding:2px 30px"| <tex>true</tex>
 +
|-
 +
|style="background-color:#EEE;color:#00F;;padding:2px 30px"| <tex>\bf{is\ not\ false}</tex>
 +
|style="background-color:#FFF;padding:2px 30px"| <tex>true</tex>
 +
|style="background-color:#FFF;padding:2px 30px"| <tex>true</tex>
 +
|style="background-color:#FFF;padding:2px 30px"| <tex>false</tex>
 +
|}
 +
==== Скалярные операции ====
 +
===== null заразен =====
 +
Следующие операции с '''null''' порождают '''null'''
 +
* =, <>, <, <=, >, >=
 +
* +, −, *, /
 +
* ||
 +
* in ('''''in'''(true, false, null)'' не дает нужного эффекта, т.к. сравнение с '''null''' попродит '''null''')
 +
 +
===== coalesce(v1, v2, ...) =====
 +
* Принимает произвольное число аргументов и возвращает первый не null
 +
* Если все аргументы null - возвращает '''null'''
 +
 +
=== Дубликаты и null ===
 +
Так как null ≠ null, сравнения кортежей, содержащих null не обладают интуитивными свойствами, например:
 +
* ''R ∪ R'' - не всегда R
 +
* ''R ∩ R'' - не всегда R
 +
* ''R ⋈ R'' - не всегда R
 +
 +
=== Спецэффекты ===
 +
При детальном рассмотрении, оказывается, что сравнение не транзитивно и не рефлексивно.
 +
* ''x = x'' - true или null
 +
* ''x <> x'' - true или null
 +
* ''x or x'' - true или null
 +
* ''x or not x'' - true или null
 +
* ''x and not x'' - false или null
 +
 +
=== Ключи и null ===
 +
Можно использовать null:
 +
* Альтернативные ключи
 +
* Внешние ключи
 +
** Простые
 +
** Составные, отсутствующие целиком
 +
'''Первичные ключи не могут содержать null.'''
 +
 +
== Неинтуитивность null ==
 +
=== Студенты, учащиеся в группе M34391 ===
 +
<font color = blue>select</font> * <font color = blue>from</font> Students <font color = blue>where</font> GroupId <> <font color = green>'M34391'</font>
 +
Корректность запроса зависит от смысла '''null'''. Неясно, надо ли возвращать в этом запросе студента, о котором нет информации, в какой группе он учится.
 +
 +
=== Поиск всех студентов ===
 +
<font color = blue>select</font> * <font color = blue>from</font> Students <font color = blue>where</font> GroupId <> <font color = green>'M34391'</font>
 +
<font color = blue>union</font>
 +
<font color = blue>select</font> * <font color = blue>from</font> Students <font color = blue>where</font> GroupId <> <font color = green>'M34391'</font>
 +
Из-за наличия '''null''', этот запрос не отработает так, как предполагалось.
 +
 
== Null и SQL ==
 
== Null и SQL ==
 +
=== Предикаты ===
 +
==== DML ====
 +
<font color = blue>where</font> и <font color = blue>having</font> считают истинным предикат '''только если он вернул ''true'''''
 +
==== DDL ====
 +
C точки зрения <font color = blue>check</font> constraint-ов не подходит только ''false''. ''Unknown'' превращается в ''true''
 +
 +
=== Различимость ===
 +
Два '''null''' не равны и не различимы. Это важно для <font color = blue>distinct</font> и <font color = blue>group by</font> <br>
 +
Например, кортежи ''(1, '''null''')'' и ''(1, '''null''')'' склеятся в случае <font color = blue>distinct</font> и не породят разные группы в случае <font color = blue>group by</font>, т.к. не различимы
 +
 +
=== Типы столбцов ===
 +
* <font color = blue>nullable</font> (по умолчанию)
 +
** <font color = gray>birthday date</font>
 +
* <font color = blue>Не nullable</font>
 +
** <font color = gray>birthday date</font> <font color = blue>not null</font>
 +
 +
=== Проверки значений ===
 +
==== Синтаксис ====
 +
==== Примеры ====
 +
 +
=== Прочее ===
 +
exists, Агрегирующие функции, Order by

Версия 15:33, 20 декабря 2021

Эта статья находится в разработке!

Что означает null

Представим себе таблицы в БД университета ИТМО

  • Students(StudentId, StudentName, GroupId)
  • Groups(GroupId, GroupName)

Что может означать тот факт, что у студента null в столбце GroupId?

  • Значение неизвестно (нет информации, из какой группы студент)
  • Значение неверно (студент учится в какой-то группе, но эта группа не представлена в БД)
  • Значение еще/уже не существует (студент был зачислен, но еще не распределен в группу или уже отчислен)
  • Значение не имеет смысла (студент из другого университета, который пришел с какими-то целями в ИТМО)
  • Значение недоступно (недостаточно прав узнать группу)

На основе этих предположений можно сделать вывод, что значение null сильно зависит от контекста (какую предметную область мы моделируем итд.).
Вполне возможно, что возникнет необходимость различать разные виды того, что значение в том или ином смысле отсутствует.

Можно ли обойтись без null?

Как представить кортеж с неопределенными частями в нашем случае?

  • Разбить на 2 группы и сделать необязательную связь 1:1. В таком случае, в дополнительной таблице будет запись (StudentId, GroupId) тогда и только тогда, когда у студента определена группа

Где еще появляется null

  • Результаты внешних соединений
  • Результаты множественных операций

Оказывается, что в некоторых случаях без null не обойтись и надо уметь с ним работать.

Операции с null

Тернарная логика

С точки зрения SQL, результат логического выражения может быть true, false или unknown.
С другой стороны есть тип boolean, и у него есть 3 значения: true, false и null
То есть формально unknown - это результат вычисления, а null - это конкретное значение, которое может быть записано в БД. На практике unknown представляется значением null, и это различие не будет иметь большого значения.

Логические операции

Конъюнкция
[math]\bf{and}[/math] [math]\bf{true}[/math] [math]\bf{unknown}[/math] [math]\bf{false}[/math]
[math]\bf{true}[/math] [math]true[/math] [math]unknown[/math] [math]false[/math]
[math]\bf{unknown}[/math] [math]unknown[/math] [math]unknown[/math] [math]false[/math]
[math]\bf{false}[/math] [math]false[/math] [math]false[/math] [math]false[/math]
Дизъюнкция
[math]\bf{or}[/math] [math]\bf{true}[/math] [math]\bf{unknown}[/math] [math]\bf{false}[/math]
[math]\bf{true}[/math] [math]true[/math] [math]true[/math] [math]true[/math]
[math]\bf{unknown}[/math] [math]true[/math] [math]unknown[/math] [math]unknown[/math]
[math]\bf{false}[/math] [math]true[/math] [math]unknown[/math] [math]false[/math]
Отрицание
[math][/math] [math]\bf{true}[/math] [math]\bf{unknown}[/math] [math]\bf{false}[/math]
[math]\bf{not}[/math] [math]false[/math] [math]unknown[/math] [math]true[/math]
Импликация

TODO: уточнить

  • A → B = (not A) or B
[math]\bf{(not\ A)\ or\ B}[/math] [math]\bf{true}[/math] [math]\bf{unknown}[/math] [math]\bf{false}[/math]
[math]\bf{true}[/math] [math]true[/math] [math]unknown[/math] [math]false[/math]
[math]\bf{unknown}[/math] [math]true[/math] [math]unknown[/math] [math]unknown[/math]
[math]\bf{false}[/math] [math]true[/math] [math]true[/math] [math]true[/math]
  • A → B = not (A and not B)
[math]\bf{not\ (A\ and\ not\ B)}[/math] [math]\bf{true}[/math] [math]\bf{unknown}[/math] [math]\bf{false}[/math]
[math]\bf{true}[/math] [math]true[/math] [math]unknown[/math] [math]false[/math]
[math]\bf{unknown}[/math] [math]true[/math] [math]unknown[/math] [math]unknown[/math]
[math]\bf{false}[/math] [math]true[/math] [math]true[/math] [math]true[/math]

Оказывается что законы Де Моргана в данном случае не работают.

Сравнение

=
[math]\bf{=}[/math] [math]\bf{true}[/math] [math]\bf{unknown}[/math] [math]\bf{false}[/math]
[math]\bf{true}[/math] [math]true[/math] [math]unknown[/math] [math]false[/math]
[math]\bf{unknown}[/math] [math]unknown[/math] [math]unknown[/math] [math]unknown[/math]
[math]\bf{false}[/math] [math]false[/math] [math]unknown[/math] [math]екгу[/math]
is
[math][/math] [math]\bf{true}[/math] [math]\bf{unknown}[/math] [math]\bf{false}[/math]
[math]\bf{is\ true}[/math] [math]true[/math] [math]false[/math] [math]false[/math]
[math]\bf{is\ unknown}[/math] [math]false[/math] [math]true[/math] [math]false[/math]
[math]\bf{is\ false}[/math] [math]false[/math] [math]false[/math] [math]true[/math]
[math]\bf{is\ not\ true}[/math] [math]false[/math] [math]true[/math] [math]true[/math]
[math]\bf{is\ not\ unknown}[/math] [math]true[/math] [math]false[/math] [math]true[/math]
[math]\bf{is\ not\ false}[/math] [math]true[/math] [math]true[/math] [math]false[/math]

Скалярные операции

null заразен

Следующие операции с null порождают null

  • =, <>, <, <=, >, >=
  • +, −, *, /
  • ||
  • in (in(true, false, null) не дает нужного эффекта, т.к. сравнение с null попродит null)
coalesce(v1, v2, ...)
  • Принимает произвольное число аргументов и возвращает первый не null
  • Если все аргументы null - возвращает null

Дубликаты и null

Так как null ≠ null, сравнения кортежей, содержащих null не обладают интуитивными свойствами, например:

  • R ∪ R - не всегда R
  • R ∩ R - не всегда R
  • R ⋈ R - не всегда R

Спецэффекты

При детальном рассмотрении, оказывается, что сравнение не транзитивно и не рефлексивно.

  • x = x - true или null
  • x <> x - true или null
  • x or x - true или null
  • x or not x - true или null
  • x and not x - false или null

Ключи и null

Можно использовать null:

  • Альтернативные ключи
  • Внешние ключи
    • Простые
    • Составные, отсутствующие целиком

Первичные ключи не могут содержать null.

Неинтуитивность null

Студенты, учащиеся в группе M34391

select * from Students where GroupId <> 'M34391'

Корректность запроса зависит от смысла null. Неясно, надо ли возвращать в этом запросе студента, о котором нет информации, в какой группе он учится.

Поиск всех студентов

select * from Students where GroupId <> 'M34391'
union
select * from Students where GroupId <> 'M34391'

Из-за наличия null, этот запрос не отработает так, как предполагалось.

Null и SQL

Предикаты

DML

where и having считают истинным предикат только если он вернул true

DDL

C точки зрения check constraint-ов не подходит только false. Unknown превращается в true

Различимость

Два null не равны и не различимы. Это важно для distinct и group by
Например, кортежи (1, null) и (1, null) склеятся в случае distinct и не породят разные группы в случае group by, т.к. не различимы

Типы столбцов

  • nullable (по умолчанию)
    • birthday date
  • Не nullable
    • birthday date not null

Проверки значений

Синтаксис

Примеры

Прочее

exists, Агрегирующие функции, Order by