Изменения

Перейти к: навигация, поиск

Активное обучение

11 байт добавлено, 16:18, 2 февраля 2020
м
Метод Uncertainty Sampling
Uncertainty Sampling - метод отбора объектов из выборки, где самыми информативными объектами считаются те, на которых текущий алгоритм меньше всего уверен в верности классификации. Для этого необходимо задать меру неуверенности в классификации на каждом объекте.
Зафиксируем модель на некотором этапе обучения и обозначим за $P(y | x)$ вероятность того, что объект $x $ принадлежит классу $y$. Приведем основные меры неуверенности для текущей классификации:
* Максимальная энтропия
$\Phi_{entENT}(x) = - \sum\limits_y{P(y | x) \log{P(y | x)}}$ - энтропия классификации на объекте $x$. Чем больше энтропия - тем больше неуверенность в классификации.
* Минимальный отступ
* Минимальная уверенность
$\PhiPhi_{LC}(x) = 1 - P(y_1 | x)$,  где $y_1$ - наиболее вероятный класс. Интересующие нас объекты - объекты с минимальной уверенностью.
52
правки

Навигация