Нормализация набора данных — различия между версиями
м (rollbackEdits.php mass rollback) |
|||
(не показаны 3 промежуточные версии 2 участников) | |||
Строка 1: | Строка 1: | ||
− | + | Набор данных содержит в себе единицы измерения, которые отбрасываются, чтобы набор данных был просто числами. Но чтобы далее работать, нам нужно, чтобы все объекты были приведены к единому формату. С этим и помогает '''нормализация'''. | |
+ | |||
+ | Нормализация применяется независимо к столбцу X. | ||
Важно в sklearn.preprocessing есть метод normalize, но это не то, что нам нужно, он рассматривает нормализацию с геометрической точки зрения | Важно в sklearn.preprocessing есть метод normalize, но это не то, что нам нужно, он рассматривает нормализацию с геометрической точки зрения | ||
− | (представляет объект в виде вектора), а не по столбцам | + | (представляет объект в виде вектора), а не по столбцам. |
Строка 17: | Строка 19: | ||
= Декорреляция = | = Декорреляция = | ||
− | [[File:Декорреляция.png|300px|thumb| | + | Процесс, который используется для уменьшения корреляции. |
+ | [[File:Декорреляция.png|300px|thumb|рис.1 Декорреляция]] | ||
1. Есть матрица X. | 1. Есть матрица X. |
Текущая версия на 19:32, 4 сентября 2022
Набор данных содержит в себе единицы измерения, которые отбрасываются, чтобы набор данных был просто числами. Но чтобы далее работать, нам нужно, чтобы все объекты были приведены к единому формату. С этим и помогает нормализация.
Нормализация применяется независимо к столбцу X.
Важно в sklearn.preprocessing есть метод normalize, но это не то, что нам нужно, он рассматривает нормализацию с геометрической точки зрения (представляет объект в виде вектора), а не по столбцам.
Минмакс, [0;1] масштабирование
После нормализации:
и
Стандартизация, Z-масштабирование
После нормализации:
иДекорреляция
Процесс, который используется для уменьшения корреляции.
1. Есть матрица X.
2. Матрицу центрировали (
).3. Ковариация вычисляется по следующей формуле:
4. Если же матрица нормализована так, что
, то из произведения мы получим не ковариационную, а корреляционную матрицу5. Декорреляция вычисляется по формуле:
где
находится из разложения ХолецкогоУтверждение: |
После декорреляции: |
. |