Изменения

Перейти к: навигация, поиск

Обучение на больших данных

2 байта добавлено, 09:39, 14 января 2021
Нет описания правки
1. чистка данных (data cleaning) – поиск и исправление ошибок в первичном наборе информации, например, ошибки ручного ввода (опечатки), некорректные значения с измерительных приборов из-за кратковременных сбоев и т.д.;
 
2. генерация предикторов (feature engineering) – переменных для построения аналитических моделей;
 
3. построение и обучение аналитической модели (model selection) для предсказания целевой (таргетной) переменной. Так проверяются гипотезы о зависимости таргетной переменной от предикторов;
Анонимный участник

Навигация