115
правок
Изменения
Выброс
,→Методы обнаружения выбросов
#* Идентифицировать и отметить центроиды каждого кластера.
#* Соотнести кластеры с экземплярами данных, находящимися на фиксированном расстоянии или на процентном удалении от центроиды соответствующего кластера.
#* Отфильтровать предполагаемые выбросы из обучающей выборки и оценить работу модели.
# Проецирующие методы (англ. projections methods). Эти методы довольно быстро и просто определяют выбросы в выборке.
#* Использовать один из проецирующих методов, например метод главных компонент (англ. principal component analysis, PCA) или самоорганизующиеся карты Кохонена(англ. self-organizing map, SOM) или проекцию Саммона(англ. Sammon mapping, Sammon projection), для суммирования обучающих данных в двух измерениях.
#* Визуализировать отображение
#* Использовать критерий близости от проецируемых значений или от вектора таблицы кодирования (англ. codebook vector) для идентифицирования выбросов.
#* Отфильтровать предполагаемые выбросы из обучающей выборки и оценить работу модели.