635
правок
Изменения
→Виды ансамблей
Для повышения точности модели применяют объединения моделей (классификаторов) в ансамбль.
===Виды ансамблей===
====Бутстрэп====
Метод бутстрэпа (англ. ''bagging or bootstrap aggregation'') {{--}} один из первых и самых простых видов ансамблей, который позволяет оценивать многие статистики сложных распределений и заключается в следующем. Пусть имеется выборка <tex>X</tex> размера <tex>N</tex>. Равномерно возьмем из выборки <tex>N</tex> объектов с возвращением. Это означает, что мы будем <tex>N</tex> раз равновероятно выбирать произвольный объект выборки, причем каждый раз мы выбираем из всех исходных <tex>N</tex> объектов. Отметим, что из-за возвращения среди них окажутся повторы. <br>Обозначим новую выборку через <tex>X_1</tex>. Повторяя процедуру <tex>M</tex> раз, сгенерируем <tex>M</tex> подвыборок <tex>X_1 ... X_M</tex>. Теперь мы имеем достаточно большое число выборок и можем оценивать различные статистики исходного распределения. ====Бэггинг (англ. ''bagging'')====Рассмотрим, следующий вид ансамбля - бэггинг. Пусть имеется обучающая выборка <tex>X</tex>. С помощью бутстрэпа сгенерируем из неё выборки <tex>X_1 ... X_M</tex>. Теперь на каждой выборке обучим свой классификатор <tex>a_i(x)</tex>. Итоговый классификатор будет усреднять ответы всех этих алгоритмов <tex>a(x) = frac{1}{M}\sum\limits_{i = 1}^{M} a_i(x)</tex>.
== Пример использования (через scikit-learn) ==