Линейная регрессия

Линейная регрессия (англ. linear regression) — метод восстановления зависимости одной (объясняемой, зависимой) переменной [math] y [/math] от другой или нескольких других переменных (факторов, регрессоров, независимых переменных) [math] x [/math] с линейной функцией зависимости. Данный метод позволяет предсказывать значения зависимой переменной [math] y [/math] по значениям независимой переменной [math] x [/math].

Задача

Дано

[math] f_1(x), \dots ,f_n(x) [/math] - числовые признаки
модель многомерной линейной регрессии:

,

где [math] a \in R^n [/math]

обучающая выборка: множество из пар [math](x_i, y_i)_{i=1 \dots n}[/math]
[math] x_i [/math] - объекты из множества [math] X = R^n [/math]
[math] y_i [/math] - объекты из множества [math] X = R [/math]

Матричные обозначения

Перейдем к матричным обозначениям:

, где

[math] F [/math] - матрица объектов-признаков, где строки соответствуют объектам а столбцы - признакам
[math] y [/math] - вектор ответов, или целевой вектор
[math] \alpha [/math] - вектор коэффициентов

Постановка задачи

В этих трех векторно-матричных обозначениях очень удобно расписать постановку задачи наименьших квадратов:

Необходимо найти вектор [math] \alpha [/math] при известной матрице [math] F [/math] и известном вектор-столбце [math] y [/math].

Решение

Нормальная система уравнений

Запишем необходимые условия минимума в матричном виде.

Отсюда следует нормальная система задачи МНК:

[math] F^T F \alpha = F^T y [/math],

где [math] F^T F - n \times n [/math] матрица

Мы получили систему уравнений, откуда можем выразить искомый вектор [math] \alpha [/math].

Решение системы

.

Значение функционала: ,

где - проекционная матрица

Проблемы

В случае мультиколлинеарности (столбцы матрицы [math] F [/math] линейно-зависимы) нам не удастся найти обратную матрицу к [math] F^T F [/math] (она будет вырождена).

Если же столбцы матрицы [math] F [/math] почти линейно-зависимы, то у нас возникнет масса вычислительных проблем с обращением этой матрицы.

Линейная регрессия

Задача

Дано

Матричные обозначения

Постановка задачи

Решение

Нормальная система уравнений

Решение системы

Проблемы

Сингулярное разложение

Навигация

Персональные инструменты

Пространства имён

Варианты

Просмотры

Ещё

Поиск

Навигация

Инструменты