Изменения

Перейти к: навигация, поиск

Дерево решений и случайный лес

3 байта убрано, 22:45, 20 января 2019
Композиции решающих деревьев
===Виды ансамблей===
====Бутстрэп====
Метод бутстрэпа (англ. ''bootstrap aggregation'') {{--}} один из первых и самых простых видов ансамблей, который позволяет оценивать многие статистики сложных распределений и заключается в следующем. Пусть имеется выборка <tex>X</tex> размера <tex>N</tex>. Равномерно возьмем из выборки <tex>N</tex> объектов с возвращением. Это означает, что мы будем <tex>N</tex> раз равновероятно выбирать произвольный объект выборки, причем каждый раз мы выбираем из всех исходных <tex>N</tex> объектов. Отметим, что из-за возвращения среди них окажутся повторы. <br>Обозначим новую выборку через <tex>X_1</tex>. Повторяя процедуру <tex>M</tex> раз, сгенерируем <tex>M</tex> подвыборок <tex>X_1 ... X_M</tex>. Теперь мы имеем достаточно большое число выборок и можем оценивать различные статистики исходного распределения.
====Бэггинг (англ. ''bagging'')====Рассмотрим, следующий вид ансамбля - бэггинг(англ. ''bagging''). Пусть имеется обучающая выборка <tex>X</tex>. С помощью бутстрэпа сгенерируем из неё выборки <tex>X_1 ... X_M</tex>. Теперь на каждой выборке обучим свой классификатор <tex>a_i(x)</tex>. Итоговый классификатор будет усреднять ответы всех этих алгоритмов <tex>a(x) = \frac{1}{M}\sum\limits_{i = 1}^{M} a_i(x)</tex>.
== Пример использования (через scikit-learn) ==
635
правок

Навигация