Изменения

Перейти к: навигация, поиск

Генерация объектов

4 байта добавлено, 16:50, 19 апреля 2020
правка текста
SMOTE (Synthetic Minority Oversampling Technique) – генерация искусственных примеров, не совпадающих с имеющимися в выборке. Этот алгоритм во многом основан на [http://neerc.ifmo.ru/wiki/index.php?title=%D0%9C%D0%B5%D1%82%D1%80%D0%B8%D1%87%D0%B5%D1%81%D0%BA%D0%B8%D0%B9_%D0%BA%D0%BB%D0%B0%D1%81%D1%81%D0%B8%D1%84%D0%B8%D0%BA%D0%B0%D1%82%D0%BE%D1%80_%D0%B8_%D0%BC%D0%B5%D1%82%D0%BE%D0%B4_%D0%B1%D0%BB%D0%B8%D0%B6%D0%B0%D0%B9%D1%88%D0%B8%D1%85_%D1%81%D0%BE%D1%81%D0%B5%D0%B4%D0%B5%D0%B9 методе ближайшего соседа]. Для создания новой записи находят разность d=Xb–Xa, где Xa,Xb – векторы признаков «соседних» примеров a и b из миноритарного класса (их находят так же, как в методе kNN). В данном случае необходимо и достаточно для примера b получить набор из k соседей, из которого в дальнейшем будет выбрана запись b. Далее из d путем умножения каждого его элемента на случайное число в интервале (0, 1) получают ^d. Вектор признаков нового примера вычисляется путем сложения Xa и ^d. Алгоритм SMOTE позволяет задавать количество записей, которое необходимо искусственно сгенерировать. Степень сходства примеров a и b можно регулировать путем изменения значения k (числа ближайших соседей).
[[File:SMOTE.jpg|thumb|SMOTE]]
10
правок

Навигация