Вариации регрессии — различия между версиями

Версия 15:30, 2 февраля 2019

Регрессия (англ. Regression) — метод моделирования зависимости между зависимой переменной [math]y[/math] и одной или несколькими независимыми переменными [math]x_1, x_2, \dots, x_n[/math]. В случае нескольких независимых переменных регрессия называется множественной (англ. multivariate regression). Цель регрессионного анализа состоит в том, чтобы оценить значение непрерывной выходной переменной по значениям входных переменных.

Содержание

1 Линейная регрессия
2 Логистическая регрессия
3 Гребневая регрессия (ридж-регрессия)
4 Лассо-регрессия
- 4.1 Описание
- 4.2 Пример кода для Scikit-learn
5 Байесовская регрессия
6 Логическая регрессия
7 См. также
8 Источники информации

Линейная регрессия

Основная статья: Линейная регрессия

Линейная регрессия (англ. linear regression) — разновидность регрессии для моделирования линейной зависимости между зависимой и независимой переменными.

Логистическая регрессия

Основная статья: Логистическая регрессия

Логистическая регрессия (англ. logistic regression) — разновидность регрессии для прогнозирования вероятности некоторого события по значениям независимых переменных. Зависимая переменная [math]y[/math] в этом случае принимает значения [math]0[/math] или [math]1[/math] (рассматриваемое событие не произошло или произошло соответственно).

Гребневая регрессия (ридж-регрессия)

Гребневая регрессия или ридж-регрессия (англ. ridge regression) — один из методов понижения размерности. Применяется для борьбы с избыточностью данных, когда независимые переменные коррелируют друг с другом, вследствие чего проявляется неустойчивость оценок коэффициентов многомерной линейной регрессии.

Мотивация

Определение:

Мультиколлинеарность (англ. multicollinearity) — наличие линейной зависимости между независимыми переменными регрессионной модели. Различают полную коллинеарность и частичную или просто мультиколлинеарность — наличие сильной корреляции между независимыми переменными.

Рассмотрим пример линейной модели: . Пусть имеет место зависимость [math]x_1 = x_2 + x_ 3[/math]. Добавим к первому коэффициенту произвольное число [math]a[/math], а из двух других коэффициентов это же число вычтем. Получаем (без случайной ошибки):

Несмотря на относительно произвольное изменение коэффициентов модели мы получили исходную модель, то есть такая модель неидентифицируема.

На практике чаще встречается проблема сильной корреляции между независимыми переменными. В этом случае оценки параметров модели получить можно, но они будут неустойчивыми.

Описание

Напомним задачу многомерной линейной регрессии: Рассматривается линейная зависимость .

Находим вектор [math]\beta^*[/math], при котором достигается минимум среднего квадрата ошибки:

Методом наименьших квадратов находим решение:

В условиях мультиколлинеарности матрица [math]F^T F[/math] становится плохо обусловленной.

Для решения этой проблемы добавим к функционалу [math]Q[/math] регуляризационное слагаемое:

,

где [math]\lambda[/math] — неотрицательный параметр.

Решением в этом случае будет

Это изменение увеличивает собственные значения матрицы [math]F^T F[/math], но не изменяет ее собственные вектора. В результате имеем хорошо обусловленную матрицу.

Диагональная матрица [math]\lambda I_n[/math] называется гребнем.

Пример кода для Scikit-learn

# Импорт библиотек
from sklearn.datasets import make_regression
from sklearn.linear_model import Ridge
from sklearn.model_selection import train_test_split

# генерируем данные для X и y
X, y = make_regression(n_samples=10000, noise=100, random_state=0)

# разделение данных на train и test
train_X, test_X, train_y, test_y = train_test_split(X, y, test_size=0.3, random_state=3)

ridge_regression = Ridge(alpha=0.1)  # alpha — величина регуляризации

# обучение
ridge_regression.fit(train_X, train_y)

# предсказание результата
print(ridge_regression.predict(test_X))

# вывод точности предсказания
print(ridge_regression.score(test_X, test_y))

Точность предсказания для данного датасета и параметров:

>>> 0.8171822749108134

Лассо-регрессия

Описание

Рис.1. Сравнение Лассо- и Ридж- регрессии. Пример для двумерного пространства независимых переменных

Метод регрессии лассо (англ. LASSO, Least Absolute Shrinkage and Selection Operator) похож на гребневую регрессию:

,

В ходе минимизации некоторые коэффициенты становятся равными нулю, что определяет отбор информативных признаков.

Различия лассо- и ридж-регрессии в том, что первая может приводить к обращению некоторых независимых переменных в ноль, тогда как вторая уменьшает их до значений, близких к нулю. Рассмотрим двумерное пространство независимых переменных. На рисунке 1 изображены ограничения на коэффициенты [math]\beta[/math] ( для лассо и для ридж), эллипсами изображены значения функции наименьшей квадратичной ошибки. Оба метода вычисляют коэффициенты посредством нахождения первой точки касания эллипса фигуры, отображающей ограничения на [math]\beta[/math]. Если точка пересечения лежит на оси, один из коэффициентов будет равен нулю, а значит, значение соответствующей независимой переменной не будет учитываться.

Пример кода для Scikit-learn

# Импорт библиотек
from sklearn.datasets import make_regression
from sklearn.linear_model import Lasso
from sklearn.model_selection import train_test_split

# генерируем данные для X и y
X, y = make_regression(n_samples=10000, noise=100, random_state=0)

# разделение данных на train и test
train_X, test_X, train_y, test_y = train_test_split(X, y, test_size=0.3, random_state=3)

lasso_regression = Lasso(alpha=0.1) # alpha — величина регуляризации

# обучение
lasso_regression.fit(train_X, train_y)

# предсказание результата
print(lasso_regression.predict(test_X))

# вывод точности предсказания
print(lasso_regression.score(test_X, test_y))

Точность предсказания для данного датасета и параметров:

>>> 0.8173906804156383

Байесовская регрессия

Байесовская линейная регрессия (англ. Bayesian linear regression) — подход в линейной регрессии, в котором предполагается что шум распределен нормально.

Рассмотрим задачу линейной регрессии , где .

В терминах вероятностей можно записать следующее:

Будем предполагать, что данные независимы:

Прологарифмируем это выражение:

Из оценки максимального правдоподобия мы получили оценку по методу наименьших квадратов.

Логическая регрессия

Логическая регрессия (англ. logic regression) — обобщенный метод регрессии, применяемый в основном в случае, когда независимые переменные имеют двоичную природу (при этом зависимая переменная не обязательно двоичная). Задачей логической регрессии является определение независимых переменных, которые могут быть выражены как результат вычисления булевой функции от других независимых переменных.

Пусть [math]x_1, x_2, \dots, x_k[/math] — двоичные независимые переменные, и пусть [math]y[/math] — зависимая переменная. Будем пытаться натренировать модели регрессии вида , где [math]L_j[/math] — булева функция от переменных [math]x_i[/math] (например ).

Для каждого типа модели необходимо определить функцию, которая отражает качество рассматриваемой модели. Например, для линейной регрессии такой функцией может быть остаточная сумма квадратов. Целью метода логической регрессии является минимизация выбранной функции качества посредством настройки параметров [math]b_j[/math] одновременно с булевыми выражениями [math]L_j[/math].

См. также

Источники информации

@@ Строка 82: / Строка 82: @@
 ==Лассо-регрессия==
 ===Описание===
-[[Файл: Ridge and Lasso Regression.png|400px|thumb|Рис.1. Сравнение Лассо- и Ридж- регрессии. Пример для двумерного пространства независимых переменных]]
+[[Файл: Ridge_and_Lasso_Regression.png|400px|thumb|Рис.1. Сравнение Лассо- и Ридж- регрессии. Пример для двумерного пространства независимых переменных]]
 '''Метод регрессии лассо''' (англ. ''LASSO, Least Absolute Shrinkage and Selection Operator'') похож на гребневую регрессию:
@@ Строка 88: / Строка 88: @@
 В ходе минимизации некоторые коэффициенты становятся равными нулю, что определяет отбор информативных признаков.
-Различия Лассо- и Ридж-регрессии в том, что первая может приводить к обращению некоторых независимых переменных в ноль, тогда как вторая уменьшает их до значений, близких к нулю. Попробуем разобраться, почему так происходит. Рассмотрим двумерное пространство независимых переменных. На рисунке 1 изображены ограничения на коэффициенты <tex>\beta</tex>, эллипсами изображены значения функции стоимости <tex>Q</tex>. Оба метода вычисляют коэффициенты посредством нахождения первой точки касания эллипса с фигурой, отображающей ограничения на <tex>\beta</tex>. Если точка пересечения лежит на оси, один из коэффициентов будет равен нулю, а значит, значение соответствующей независимой переменной не будет учитываться.
+Различия лассо- и ридж-регрессии в том, что первая может приводить к обращению некоторых независимых переменных в ноль, тогда как вторая уменьшает их до значений, близких к нулю. Рассмотрим двумерное пространство независимых переменных. На рисунке 1 изображены ограничения на коэффициенты <tex>\beta</tex> (<tex>|\beta_1| + |\beta_2| \leq t</tex> для лассо и <tex>\beta_1^2 + \beta_2^2 \leq t^2</tex> для ридж), эллипсами изображены значения функции наименьшей квадратичной ошибки. Оба метода вычисляют коэффициенты посредством нахождения первой точки касания эллипса фигуры, отображающей ограничения на <tex>\beta</tex>. Если точка пересечения лежит на оси, один из коэффициентов будет равен нулю, а значит, значение соответствующей независимой переменной не будет учитываться.
 ===Пример кода для Scikit-learn===

Вариации регрессии — различия между версиями

Версия 15:30, 2 февраля 2019

Содержание

Линейная регрессия

Логистическая регрессия

Гребневая регрессия (ридж-регрессия)

Мотивация

Описание

Пример кода для Scikit-learn

Лассо-регрессия

Описание

Пример кода для Scikit-learn

Байесовская регрессия

Логическая регрессия

См. также

Источники информации

Навигация

Персональные инструменты

Пространства имён

Варианты

Просмотры

Ещё

Поиск

Навигация

Инструменты