Изменения

Дерево решений и случайный лес

3 байта убрано, 22:45, 20 января 2019

→‎Композиции решающих деревьев

===Виды ансамблей===

====Бутстрэп====

Метод бутстрэпа (англ. ''bootstrap aggregation'') {{-~~-}}~~ один из первых и самых простых видов ансамблей, который позволяет оценивать многие статистики сложных распределений и заключается в следующем. Пусть имеется выборка <tex>X</tex> размера <tex>N</tex>. Равномерно возьмем из выборки <tex>N</tex> объектов с возвращением. Это означает, что мы будем <tex>N</tex> раз равновероятно выбирать произвольный объект выборки, причем каждый раз мы выбираем из всех исходных <tex>N</tex> объектов. Отметим, что из-за возвращения среди них окажутся повторы. <br>Обозначим новую выборку через <tex>X_1</tex>. Повторяя процедуру <tex>M</tex> раз, сгенерируем <tex>M</tex> подвыборок <tex>X_1 ... X_M</tex>. Теперь мы имеем достаточно большое число выборок и можем оценивать различные статистики исходного распределения.

====Бэггинг ~~(англ. ''bagging'')~~====Рассмотрим, следующий вид ансамбля - бэггинг(англ. ''bagging''). Пусть имеется обучающая выборка <tex>X</tex>. С помощью бутстрэпа сгенерируем из неё выборки <tex>X_1 ... X_M</tex>. Теперь на каждой выборке обучим свой классификатор <tex>a_i(x)</tex>. Итоговый классификатор будет усреднять ответы всех этих алгоритмов <tex>a(x) = \frac{1}{M}\sum\limits_{i = 1}^{M} a_i(x)</tex>.

== Пример использования (через scikit-learn) ==

Sokolova

635

правок

Изменения

Дерево решений и случайный лес

Навигация

Персональные инструменты

Пространства имён

Варианты

Просмотры

Ещё

Поиск

Навигация

Инструменты