Изменения

Перейти к: навигация, поиск

Линейная регрессия

1056 байт добавлено, 09:12, 12 марта 2019
Решение
==== Решение системы ====
<tex> \alpha^* = (F^T F)^{-1} F^T y = F^+ y </tex>, <br> где <tex> F^+ </tex> — псевдо-обратная матрица.
Значение функционала: <tex> Q(\alpha^*) = ||P_F y - y||^2 </tex>, <br> где <tex> P_F = F F^+ = F (F^T F)^{-1} F^T </tex> - ''проекционная матрица''
==== Проблемы ====
=== Решение МНК через сингулярное разложение ===
Найдем псевдо-обратную матрицу: <br> <tex> F^+ = (U D V^T V D U^T)^{-1} U D V^T = U D^{-1} V^T = \sum\limits_{j=1}^n \frac{ 1 }{ \sqrt{ \lambda_j } } u_j v_j ^T </tex>. Теперь зная псевдо-обратную матрицу, найдем решение задачи наименьших квадратов: <br> <tex> \alpha^* = F^+ y = U D^{-1} V^T y = \sum\limits_{j=1}^n \frac{ 1 }{ \sqrt{ \lambda_j } } u_j (v_j^T y) </tex>;.
Найдем вектор, которым наша линейная модель аппроксимирует целевой вектор <tex> y </tex>: <br> <tex> F \alpha^* = F^+ P_F y = (V D U^T) U D^{-1} V^T y = V V^T y = \sum\limits_{j=1}^n \frac{ 1 }{ \sqrt{ \lambda_j } } u_j v_j (v_j^T y) </tex>;.
Квадрат нормы вектора коэффициентов: <br> <tex> F || \alpha^* ||^2 = P_F y = (V D U^T) U ||D^{-1} V^T y = V V||^T y 2 = \sum\limits_{j=1}^n v_j \frac{ 1 }{ \lambda_j } (v_j^T y) ^2 </tex>;.
<tex> || \alpha^* ||^2 = ||D^{В 3-1} V^T y||^2 = \sum\limits_{j=1}^n \frac{ 1 }{ \lambda_j } (v_j^T y)^2 </tex>х из 4-х формул сингулярные числа оказались в знаменателе. Если имеются сингулярные числа приближающиеся к 0, то мы получаем проблему мультиколлинеарности. Близкие к 0 собственные значения или сингулярные числа — показатель того, что среди признаков есть почти линейно-зависимый.
Анонимный участник

Навигация