Изменения

Перейти к: навигация, поиск

Выброс

160 байт добавлено, 15:27, 24 января 2019
Нет описания правки
'''Выброс'''(англ. ''outlier'') — небольшая доля объектов во входных данных, которая сильно выделяется из общей выборки. Многие алгоритмы машинного обучения чувствительны к разбросу и распределению значений атрибутов во входных данных. Соответственно выбросы во входных данных могут исказить и ввести в заблуждение процесс обучения алгоритмов машинного обучения, что приводит к увеличению времени обучения, снижению точности моделей и, в конечном итоге, к снижению результатов. Даже до подготовки предсказательных моделей на основе обучающих данных выбросы могут приводить к ошибочным представлениям и в дальнейшем к ошибочной интерпретации собранных данных.
{|align="right"
|-valign="top"
|[[Файл:Outlier_boxplot.png|200px|thumb|Рис 1. Хорошо обученная модель с выбросами]]
|}
===Причины возникновения выбросов===
* Сбой работы оборудования
{|align="center"
|-valign="top"
|[[Файл:Outlier_norm.png|200px|thumb|Рис 12. Хорошо обученная модель с выбросами]] |[[Файл:Outlier_bad.png|200px|thumb|Рис 23. Переобученная модель на выбросах]]
|}
Рис 1 2 показывает хорошо обученную модель, в которой присутствуют два выброса. Как видно из рисунка данная модель показала себя устойчивой к выбросам, либо же вовремя прекратила своё обучение. Обратная ситуация обстоит с Рис 23, где модель сильно переобучилась из-за присутствующих в ней выбросов.
==Методы обнаружения и борьбы с выбросами==
===Методы обнаружения выбросов===
115
правок

Навигация