Регуляризация

Материал из Викиконспекты
Перейти к: навигация, поиск
Определение:
Регуляризация (англ. regularization) в статистике, машинном обучении, теории обратных задач — метод добавления некоторых дополнительных ограничений к условию с целью решить неккоректно поставленную задачу или предотвратить переобучение. Чаще всего эта информация имеет вид штрафа за сложность модели.


Мотивация

Как говорилось ранее, регуляризация полезна для борьбы с <переобучением>. Если вы выбрали сложную модель, и при этом у вас недостаточно данных, то легко можно получить итоговую модель, которая хорошо описывает обучающую выборку, но не обобщается на тестовую.

В качестве наглядного примера можно рассмотреть линейные регрессионные модели. Восстановить зависимость для нескольких точек можно пытаться полиномами разной степени.

Рис 1. Недообучение. M=1
Рис 2. Норма. M=2
Рис 3. Переобучение. M=4

Основные виды регуляризации

L1-регуляризация

L2-регуляризация

Эластичная сеть

Вероятностная интерпретация регуляризации

Регуляризация в линейной регрессии

Другие использования регуляризации

Логистическая регрессия

Нейронные сети

Метод опорных вектоов

Стохастический градиентный спуск