Изменения

Вариации регрессии

1878 байт добавлено, 19:29, 17 февраля 2020

м

→‎Байесовская регрессия: fixed lex mistake

Диагональная матрица <tex>\lambda I_n</tex> называется '''гребнем'''.

===Примеры кода=======Пример кода для Scikit-learn====

# импорт библиотек

'''from''' sklearn.datasets '''import''' make_regression

Точность предсказания для данного датасета и параметров:

>>> 0.8171822749108134

====Пример на языке Java====

Пример гребневой регрессии с применением <code>smile.regression.RidgeRegression</code><ref>[https://haifengl.github.io/smile/api/java/smile/regression/RidgeRegression.html/ Smile, Ridge Regression]</ref>

<code>Maven</code> зависимость:

<groupId>com.github.haifengl</groupId>

<artifactId>smile-core</artifactId>

</dependency>

'''import''' smile.data.NominalAttribute;

'''import''' smile.data.parser.DelimitedTextParser;

'''import''' smile.regression.RidgeRegression;

'''var''' parser = new DelimitedTextParser();

parser.setDelimiter(", ");

parser.setResponseIndex(new NominalAttribute("class"), 0);

'''var''' dataset = parser.parse("dataset.csv");

'''var''' lambda = 0.0057d;

'''var''' ridgeClf = new RidgeRegression(dataset.x(), dataset.y(), lambda);

ridgeClf.predict(testX);

==Лассо-регрессия==

Основное различие лассо- и ридж-регрессии заключается в том, что первая может приводить к обращению некоторых независимых переменных в ноль, тогда как вторая уменьшает их до значений, близких к нулю. Рассмотрим для простоты двумерное пространство независимых переменных. В случае лассо-регрессии органичение на коэффициенты представляет собой ромб (<tex>|\beta_1| + |\beta_2| \leq t</tex>), в случае ридж-регрессии {{---}} круг (<tex>\beta_1^2 + \beta_2^2 \leq t^2</tex>). Необходимо минимизировать функцию ошибки, но при этом соблюсти ограничения на коэффициенты. С геометрической точки зрения задача состоит в том, чтобы найти точку касания линии, отражающей функцию ошибки с фигурой, отражающей ограничения на <tex>\beta</tex>. Из рисунка 1 интуитивно понятно, что в случае лассо-регрессии эта точка с большой вероятностью будет находиться на углах ромба, то есть лежать на оси, тогда как в случае ридж-регрессии такое происходит очень редко. Если точка пересечения лежит на оси, один из коэффициентов будет равен нулю, а значит, значение соответствующей независимой переменной не будет учитываться.

===Примеры кода=======Пример кода для Scikit-learn====

# импорт библиотек

'''from''' sklearn.datasets '''import''' make_regression

Точность предсказания для данного датасета и параметров:

>>> 0.8173906804156383

====Пример на языке Java====

Пример Лассо-регрессии с применением <code>smile.regression.LASSO</code><ref>[https://haifengl.github.io/smile/api/java/smile/regression/LASSO.html/ Smile, LASSO regression]</ref>

<code>Maven</code> зависимость:

<groupId>com.github.haifengl</groupId>

<artifactId>smile-core</artifactId>

</dependency>

'''import''' smile.data.NominalAttribute;

'''import''' smile.data.parser.DelimitedTextParser;

'''import''' smile.regression.LASSO;

'''var''' parser = new DelimitedTextParser();

parser.setDelimiter(", ");

parser.setResponseIndex(new NominalAttribute("class"), 0);

'''var''' dataset = parser.parse("dataset.csv");

'''var''' lasso = new LASSO(dataset.x(), dataset.y(), 10);

lasso.predict(testX);

==Байесовская регрессия==

= \arg\min \sum\limits_{i=1}^n (y_i - x_i \beta)^2</tex>

Таким образом, оказывается, что метод максимального правдоподобия с учетом шума в данных сводится к оценке по методу наименьших квадратов, которую мы уже видели в ~~обынчой~~ обычной линейной регрессии.

===Пример кода для Scikit-learn===

# Если такого дерева не существует, алгоритм завершается. Если оно все же есть, выбираем его в качестве текущего и повторяем второй шаг.

Этот алгоритм склонен к переобучению, а также в некоторых ситуациях может остановиться преждевременно, так и не дойдя до наилучшего дерева. Существует также алгоритм под названием '''имитация отжига''' (англ. ''simulated annealing'') который показывает лучшие результаты, чем описанный жадный поиск.

==См. также==

PaulKh

76

правок

Изменения

Вариации регрессии

Навигация

Персональные инструменты

Пространства имён

Варианты

Просмотры

Ещё

Поиск

Навигация

Инструменты