Виды ансамблей — различия между версиями

Версия 10:20, 19 февраля 2019

Содержание

1 Ансамбль
2 Вероятность ошибки
3 Бутстрэп
4 Бэггинг

Ансамбль

Рассмотрим задачу классификации на K классов: [math]Y = \{1, 2, ..., K\}[/math]
Пусть имеется M классификатор ("экспертов"): [math] f_1, f_2, ..., f_M [/math]

Тогда давайте посмотрим новый классификатор на основе данных:

Простое голосование:
Взвешенное голосование:

Вероятность ошибки

Пусть [math]M[/math] - количество присяжный, [math]p[/math] - вероятность правильного решения одного эксперта, [math]R[/math] - вероятность правильного решения всего жюри, [math]m[/math] - минимальное большинство членов жюри [math] = floor(N / 2) + 1 [/math]

Тогда

Бутстрэп

Метод бутстрэпа (англ. bootstrap) — один из первых и самых простых видов ансамблей, который позволяет оценивать многие статистики сложных распределений и заключается в следующем. Пусть имеется выборка [math]X[/math] размера [math]N[/math]. Равномерно возьмем из выборки [math]N[/math] объектов с возвращением. Это означает, что мы будем [math]N[/math] раз равновероятно выбирать произвольный объект выборки, причем каждый раз мы выбираем из всех исходных [math]N[/math] объектов. Отметим, что из-за возвращения среди них окажутся повторы.
Обозначим новую выборку через [math]X_1[/math]. Повторяя процедуру [math]M[/math] раз, сгенерируем [math]M[/math] подвыборок [math]X_1 ... X_M[/math]. Теперь мы имеем достаточно большое число выборок и можем оценивать различные статистики исходного распределения.

Бутстрэп используется в статистике, в том числе для:

Аппроксимация стандартной ошибки выборочной оценки
Байесовская коррекция с помощью Бутстрэп метода
Доверительные интервалы
Метод процентилей

Бэггинг

Пусть имеется выборка [math]X[/math] размера [math]N[/math]. Количество классификаторов [math]M[/math]

Алгоритм классификации в технологии бэггинг на подпространствах:

Генерируется с помощью бутстрэпа M выборок размера N для каждого классификатора
Производится независимое обучения каждого элементарного классификатора (каждого алгоритма, определенного на своем подпространстве).
Производится классификация основной выборки на каждом из подпространств (также независимо).
Принимается окончательное решение о принадлежности объекта одному из классов. Это можно сделать несколькими разными способами, подробнее описано ниже.

Окончательное решение о принадлежности объекта классу может приниматься, например, одним из следующих методов:

Консенсус: если все элементарные классификаторы присвоили объекту одну и ту же метку, то относим объект к выбранному классу.
Простое большинство: консенсус достижим очень редко, поэтому чаще всего используют метод простого большинства. Здесь объекту присваивается метка того класса, который определило для него большинство элементарных классификаторов.
Взвешивание классификаторов: если классификаторов четное количество, то голосов может получиться поровну, еще возможно, что для эксперты одна из групп параметров важна в большей степени, тогда прибегают к взвешиванию классификаторов. То есть при голосовании голос классификатора умножается на его вес.

@@ Строка 49: / Строка 49: @@
 <li> Взвешивание классификаторов: если классификаторов четное количество, то голосов может получиться поровну, еще возможно, что для эксперты одна из групп параметров важна в большей степени, тогда прибегают к взвешиванию классификаторов. То есть при голосовании голос классификатора умножается на его вес.
 </ul>
-== Эффективность ==
-Рассмотрим задачу регрессии с базовыми алгоритмами <tex>b_1, b_2, ..., b_m</tex>. Предположим, что существует истинная функция ответа для всех объектов y(x), а также задано распределение p(x) на объектах. В этом случае мы можем записать ошибку каждой функции регрессии:
-<tex> \epsilon_i(x) = b_i(x) - y(x), y = 1, ..., n </tex>
-и записать матожидание среднеквадратичной ошибки:
-<tex>E_x(b_i(x) - y(x))^2 = E_x \epsilon_i^2(x) </tex>
-Средняя ошибка построенных функций регрессии имеет вид:
-<tex>E_1 = \frac 1 n E_x \sum \limits_{i = 1}^n \epsilon_i^2(x) </tex>
-Предположим, что ошибки несмещены и некоррелированы:
-<tex> E_x\epsilon_i(x) = 0, E_x\epsilon_i(x)\epsilon_j(x) = 0, i ≠ j </tex>
-Построим теперь новую функцию регрессии, которая будет усреднять ответы построенных нами функций:
-<tex> a(x) = \frac 1 n \sum \limits_{i = 1}^n b_i(x) </tex>
-Найдем ее среднеквадратичную ошибку:
-<tex> E_n = E_x(\frac 1 n \sum \limits_{i = 1}^n (b_i(x) - y(x))^2
-= E_x(\frac 1 n \sum \limits_{i = 1}^n \epsilon_i)^2
-= \frac 1 {n^2} E_x(\sum \limits_{i = 1}^n \epsilon_i^2(x) + \sum \limits_{i ≠ j} \epsilon_i(x)\epsilon_j(x))
-= \frac 1 n E_1 </tex>
-Таким образом, усреднение ответов позволило уменьшить средний квадрат ошибки в <tex>n</tex> раз

Виды ансамблей — различия между версиями

Версия 10:20, 19 февраля 2019

Содержание

Ансамбль

Вероятность ошибки

Бутстрэп

Бэггинг

Навигация

Персональные инструменты

Пространства имён

Варианты

Просмотры

Ещё

Поиск

Навигация

Инструменты