Изменения

Перейти к: навигация, поиск

Вариации регрессии

Нет изменений в размере, 14:27, 24 февраля 2019
м
Описание
<center><tex>Q_{\lambda}(\beta) = ||F \beta - y||^2 + \lambda ||\beta||</tex>,</center>
Основное различие лассо- и ридж-регрессии заключается в том, что первая может приводить к обращению некоторых независимых переменных в ноль, тогда как вторая уменьшает их до значений, близких к нулю. Рассмотрим для простоты двумерное пространство независимых переменных. В случае риджлассо-регрессии органичение на коэффициенты представляют представляет собой круг ромб (<tex>|\beta_1^2 | + |\beta_2^2 | \leq t^2</tex>), в случае лассоридж-регрессии {{---}} ромб круг (<tex>|\beta_1| ^2 + |\beta_2| ^2 \leq t^2</tex>). Необходимо минимизировать функцию ошибки, но при этом соблюсти ограничения на коэффициенты. С геометрической точки зрения задача состоит в том, чтобы найти точку касания линии, отражающей функцию ошибки с фигурой, отражающей ограничения на <tex>\beta</tex>. Из рисунка 1 интуитивно понятно, что в случае лассо-регрессии эта точка с большой вероятностью будет находиться на углах ромба, то есть лежать на оси, тогда как в случае ридж-регрессии такое происходит очень редко. Если точка пересечения лежит на оси, один из коэффициентов будет равен нулю, а значит, значение соответствующей независимой переменной не будет учитываться.
===Пример кода для Scikit-learn===
276
правок

Навигация