Функция потерь и эмпирический риск
Функция потерь (loss function) — отображение результата работы алгоритма на , показывающее "стоимость" ошибки.
Часто применяются следующие функции потерь ( — уверенность алгоритма в определённом классе для задач классификации / значение функции для регрессии, — метки; для бинарного классификатора ):
- 0-1 функция
- Квадратичная функция
- Hinge loss
- Логистическая
- Log loss
Понятие функции потерь тесно связано с эмпирическим риском.
Эмпирический риск — средняя величина ошибки на обучающей выборке:
Метод минимизации эмпирического риска
Логично предположить, что если алгоритм хорошо показывает себя на обучающей выборке, то и на реальных данных он будет работать неплохо. Так подходим к конструктивному методу обучения — методу минимизации эмпирического риска. Суть метода, как следует из названия, в минимизации функционала :
Метод простой, общий, конструктивный и зачастую сводит задачу обучения к численному поиску минимума в модели алгоритма. Однако столь пристальное внимание к обучающей выборке приводит к явлению переобучения.