Изменения

Перейти к: навигация, поиск

Выброс

47 байт добавлено, 10:54, 25 января 2020
Источники информации
[[Файл:Outlier_boxplot.png|upright=1.0|thumb|Рис 1.График boxplot населения регионов России в 1990 году, где можно заметить 5 выбросов]]
'''Выброс''' (англ. ''outlier'') {{---}} это экстремальные значения во входных данных, которые находятся далеко за пределами других наблюдений. Простой бытовой пример: Например, все предметы на кухне имеют температуру около 22-25 грудусовЦельсия, а {{---}} духовка 220.
Многие алгоритмы машинного обучения чувствительны к разбросу и распределению значений признаков обрабатываемых объектов. Соответственно, выбросы во входных данных могут исказить и ввести в заблуждение процесс обучения алгоритмов машинного обучения, что приводит к увеличению времени обучения, снижению точности моделей и, в конечном итоге, к снижению результатов. Даже до подготовки предсказательных моделей на основе обучающих данных выбросы могут приводить к ошибочным представлениям и в дальнейшем к ошибочной интерпретации собранных данных.
:Точка является выбросом только по одной из своих координат.
;Многомерные выбросы
:Точка является выбросом сразу по нескольким из своих координаткоординатам.
Другой подход классификации выбросов {{---}} по их окружению.
# https://machinelearningmastery.com/how-to-identify-outliers-in-your-data/
# https://ru.coursera.org/lecture/vvedenie-mashinnoe-obuchenie/obnaruzhieniie-vybrosov-t9PG4
# https://www.reg.ru/blog/ishchem-anomalii-s-python-chast-1/
 
[[Категория: Машинное обучение]]
[[Категория: Статистика]]
Анонимный участник

Навигация