Выбросы

Материал из Викиконспекты
Перейти к: навигация, поиск

Выбросы

Выбросы(англ. outliers) --- такая часть во входных данных, которая сильно выделяется из общей выборки. Многие выбросы во входных данных могут исказить и ввести в заблуждение процесс обучения алгоритмов машинного обучения, что приводит к увеличению времени обучения, снижению точности моделей и, в конечном итоге, снижению результатов. Даже до подготовки предсказательных моделей на основе обучающих данных выбросы могут приводить к ошибочным представлениям и в дальнейшем к ошибочной интерпретации собранных данных.

Методы борьбы с выбросами

Примечания

  1. https://machinelearningmastery.com/how-to-identify-outliers-in-your-data/