Изменения

Перейти к: навигация, поиск

Предварительная обработка данных

775 байт добавлено, 19:20, 29 июня 2022
Нет описания правки
== Преобразование порядкового типа ==
[[File:Преобразование_порядкового_типа_в_k_категорий.png|250px|thumb|рис1. (A<B<C)]]
 
* Преобразование в число(берём его порядковый номер)
* Преобразование в k бинарных категорий(если число значений конечно и равно k):
= Нормализация данных =
 
Применяются независимо к столбцу X
= Декорреляция =
[[File:Декорреляция.png|300px|thumb|рис3]]
 
1. Есть матрица X.
= (\Sigma^{-T/2} * \Sigma^{T/2})*(\Sigma^{1/2}*\Sigma^{-1/2}) = I * I = I</tex>.
}}
 
= Аномалии в наборе данных =
 
Аномалии - плохие объекты для построения нашей модели
 
Задача поиска аномалий является отдельной задачей машинного обучения, про которую можно почитать [http://neerc.ifmo.ru/wiki/index.php?title=поиск_аномалий здесь]
 
= Пропуски в наборе данных =
 
Иногда в таблице с данными существую пустоты(они же пропуски), про работу с пропусками можно почитать [http://neerc.ifmo.ru/wiki/index.php?title=Работа_с_пропусками_в_наборе_данных тут]
42
правки

Навигация