Изменения

Перейти к: навигация, поиск

Нормализация набора данных

878 байт добавлено, 20:23, 29 июня 2022
Новая страница: «Применяются независимо к столбцу X Важно в sklearn.preprocessing есть метод normalize, но это не то, что…»
Применяются независимо к столбцу X

Важно в sklearn.preprocessing есть метод normalize, но это не то, что нам нужно, он рассматривает нормализацию с геометрической точки зрения
(представляет объект в виде вектора), а не по столбцам


'''Минмакс, [0;1] масштабирование'''
<tex> x_{new} = \dfrac{x_{old} - \min[X]}{\max[X] - \min[X]}</tex>

После нормализации: <math>\min[X_{new}] = 0</math> и <math>\max[X_{new}] = 1</math>


'''Стандартизация, Z-масштабирование'''
<tex> x_{new} = \dfrac{x_{old} - \mathbb{E}[X]}{\mathbb{D}[X]}</tex>

После нормализации: <math>\mathbb{E}[X_{new}] = 0</math> и <math>\mathbb{D}[X_{new}] = 1</math>
42
правки

Навигация