Изменения

Перейти к: навигация, поиск

Обсуждение участника:Gen05

2067 байт добавлено, 14:25, 28 июня 2022
Встроенные методы
*Гибридные и ансамблирующие методы
===Встроенные методы===
Встроенные методы [[File:Feature_selection_embedded_rus.png|450px|thumb|right|Процесс работы встроенных методов]]Группа '''встроенных методов''' (англ. ''embedded methods'') — это очень похожа на оберточные методы , но для выборапризнаков используется непосредственно структуру некоторого классификатора. В оберточных методах классификатор служит только для оценки работы на данном множестве признаков, тогда как встроенные методы используют какую-то информацию о признаках, которую классификаторы присваивают во время обучения.  Одним из примеров встроенного метода является реализация на [[Дерево решений и случайный лес| случайном лесе]]: каждому дереву на вход подаются случайное подмножество данных из датасета с каким-то случайным набор признаков, при которых этот выбор осуществляется в процессе работыобучения каждое из деревьев решений производит "голосование" за релевантность его признаков, эти данные агрегируются, и на выходе получаются значения важности каждого признака набора данных. Дальнейший выбор нужных нам признаков уже зависит от выбранного критерия отбора. других алгоритмов (классификаторов Встроенные методы используют преимущества оберточных методов и регрессоров)*Опираются являются более эффективными, при этом на отбор тратится меньше времени, уменьшается риск [[переобучение|переобучения]], но т.к. полученный набор признаков был отобран на конкретный алгоритм*Специфичны основе знаний о классификаторе, то есть вероятность, что для каждого алгоритмадругого классификатора это множество признаков уже не будет настолько же релевантным.
[[Файл:Таблица_2.jpg|600px|thumb|right|Схема встроенного метода]]
#Выбросить некоторое число признаков с наименьшими весами
#Повторять, пока не останется нужное число признаков
 
==Методы-обертки==
Метод-обертка (wrapper method) использует алгоритм
80
правок

Навигация