Линейная регрессия — различия между версиями
| Строка 58: | Строка 58: | ||
== Решение == | == Решение == | ||
| − | ==== | + | === Нормальная система уравнений === |
| + | |||
| + | Запишем необходимые условия минимума в матричном виде. | ||
| + | |||
| + | <tex> \frac{\partial Q }{\partial \alpha } (\alpha) = 2F^T (F\alpha - y) = 0 </tex> | ||
| + | |||
| + | Отсюда следует нормальная система задачи МНК: | ||
| + | |||
| + | <tex> F^T F \alpha = F^T y </tex>, | ||
| + | |||
| + | где <tex> F^T F - n \times n </tex> матрица | ||
| + | |||
| + | Мы получили систему уравнений, откуда можем выразить искомый вектор <tex> \alpha </tex>. | ||
| + | |||
| + | ==== Решение системы ==== | ||
| + | <tex> \alpha^* = (F^T F)^{-1} F^T y = F^+ y </tex>. | ||
| + | |||
| + | Значение функционала: <tex> Q(\alpha^*) = ||P_F y - y||^2 </tex>, | ||
| + | |||
| + | где <tex> P_F = F F^+ = F (F^T F)^{-1} F^T </tex> - ''проекционная матрица'' | ||
| + | |||
| + | ==== Проблемы ==== | ||
| + | |||
| + | В случае мультиколлинеарности (столбцы матрицы <tex> F </tex> линейно-зависимы) нам не удастся найти обратную матрицу к <tex> F^T F </tex> (она будет вырождена). | ||
| + | |||
| + | Если же столбцы матрицы <tex> F </tex> почти линейно-зависимы, то у нас возникнет масса вычислительных проблем с обращением этой матрицы. | ||
| + | |||
| + | === Сингулярное разложение === | ||
Версия 13:44, 11 марта 2019
Линейная регрессия (англ. linear regression) — метод восстановления зависимости одной (объясняемой, зависимой) переменной от другой или нескольких других переменных (факторов, регрессоров, независимых переменных) с линейной функцией зависимости. Данный метод позволяет предсказывать значения зависимой переменной по значениям независимой переменной .
Содержание
Задача
Дано
- - числовые признаки
- модель многомерной линейной регрессии:
где
- обучающая выборка: множество из пар
- - объекты из множества
- - объекты из множества
Матричные обозначения
Перейдем к матричным обозначениям:
, где
- - матрица объектов-признаков, где строки соответствуют объектам а столбцы - признакам
- - вектор ответов, или целевой вектор
- - вектор коэффициентов
Постановка задачи
В этих трех векторно-матричных обозначениях очень удобно расписать постановку задачи наименьших квадратов:
Необходимо найти вектор при известной матрице и известном вектор-столбце .
Решение
Нормальная система уравнений
Запишем необходимые условия минимума в матричном виде.
Отсюда следует нормальная система задачи МНК:
,
где матрица
Мы получили систему уравнений, откуда можем выразить искомый вектор .
Решение системы
.
Значение функционала: ,
где - проекционная матрица
Проблемы
В случае мультиколлинеарности (столбцы матрицы линейно-зависимы) нам не удастся найти обратную матрицу к (она будет вырождена).
Если же столбцы матрицы почти линейно-зависимы, то у нас возникнет масса вычислительных проблем с обращением этой матрицы.