Изменения

Перейти к: навигация, поиск
Нет описания правки
Наиболее типичными мерами качества в задачах регрессии являются
=== MSE, Mean Squared Error (средняя квадратичная ошибка (Mean Squared Error, MSE) ===
[[Файл:mse1.png]] и
=== MAE, Mean Absolute Error (средняя абсолютная ошибка(Mean Absolute Error, MAE) ===
[[Файл:mae2.png]]
 
Среднеквадратичный функционал сильнее штрафует за большие отклонения по сравнению со среднеабсолютным, и поэтому более чувствителен к выбросам. При использовании любого из этих двух функционалов может быть полезно проанализировать, какие объекты вносят наибольший вклад в общую ошибку — не исключено, что на этих объектах была допущена ошибка при вычислении признаков или целевой величины.
 
Среднеквадратичная ошибка подходит для сравнения двух моделей или для контроля качества во время обучения, но не позволяет сделать выводов о том, на сколько хорошо данная модель решает задачу. Например, MSE = 10 является очень плохим показателем, если целевая переменная принимает значения от 0 до 1, и очень хорошим, если целевая переменная лежит в интервале (10000, 100000). В таких ситуациях вместо среднеквадратичной ошибки полезно использовать коэффициент детерминации, или коэффициент R 2
 
=== Коэффициент детерминации ===
 
[[Файл:determ.png]]
 
Коэффициент детерминации измеряет долю дисперсии, объясненную моделью, в общей дисперсии целевой переменной. Фактически, данная мера качества — это нормированная среднеквадратичная ошибка. Если она близка к единице, то модель хорошо объясняет данные, если же она близка к нулю, то прогнозы сопоставимы по качеству с константным предсказанием.
187
правок

Навигация