Изменения

Оценка качества в задачах классификации и регрессии

511 байт добавлено, 17:31, 25 марта 2020

→‎Средняя абсолютная масштабированная ошибка (англ. Mean absolute scaled error, MASE)

Наиболее типичными мерами качества в задачах регрессии являются

=== ~~MSE,~~ Средняя квадратичная ошибка (англ. Mean Squared Error ~~(средняя квадратичная ошибка~~, MSE) === ''MSE'' применяется в ситуациях, когда нам надо подчеркнуть большие ошибки и выбрать модель, которая дает меньше больших ошибок прогноза. Грубые ошибки становятся заметнее за счет того, что ошибку прогноза мы возводим в квадрат. И модель, которая дает нам меньшее значение среднеквадратической ошибки, можно сказать, что что у этой модели меньше грубых ошибок.

: <math>

</math> и

=== ~~MAE,~~ Cредняя абсолютная ошибка (англ. Mean Absolute Error ~~(средняя абсолютная ошибка~~, MAE) ===

: <math>

Коэффициент детерминации измеряет долю дисперсии, объясненную моделью, в общей дисперсии целевой переменной. Фактически, данная мера качества — это нормированная среднеквадратичная ошибка. Если она близка к единице, то модель хорошо объясняет данные, если же она близка к нулю, то прогнозы сопоставимы по качеству с константным предсказанием.

=== ~~MAPE,~~ Средняя абсолютная процентная ошибка (англ. Mean Absolute Percentage Error ~~(средняя абсолютная процентная ошибка~~, MAPE) ===

: <math>

Основная проблема данной ошибки — нестабильность.

=== ~~RMSE,~~ Корень из средней квадратичной ошибки (англ. Root Mean Squared Error ~~(корень из средней квадратичной ошибки~~, RMSE) ===

: <math>

</math>

Примерно такая же проблема, как и в MAPE: так как каждое отклонение возводится в квадрат, любое небольшое отклонение может значительно повлиять на показатель ошибки. Стоит отметить, что существует также ошибка MSE, из которой RMSE как раз и получается путем извлечения корня. Но так как MSE дает расчетные единицы измерения в квадрате, то использовать данную ошибку будет немного неправильно.

=== ~~SMAPE, Symmetric~~ Cимметричная MAPE (~~симметричная~~ англ. Symmetric MAPE, SMAPE) ===

: <math>

</math>

=== ~~MASE,~~ Средняя абсолютная масштабированная ошибка (англ. Mean absolute scaled error ~~(cредняя абсолютная масштабированная ошибка~~, MASE) ===

: <math> MASE = \dfrac{\sum \limits_{i=1}^n |Y_i - e_i|}{\frac{n}{n-1}\sum \limits_{i=2}^n | Y_i-Y_{i-1}|} </math>

''MASE'' является очень хорошим вариантом для расчета точности, так как сама ошибка не зависит от масштабов данных и является симметричной: то есть положительные и отрицательные отклонения от факта рассматриваются в равной степени.

Обратите внимание, что в ''MASE'' мы имеем дело с двумя суммами: та, что в числителе, соответствует тестовой выборке, та, что в знаменателе - обучающей. Вторая фактически представляет собой среднюю абсолютную ошибку прогноза по методу Naive. Она же соответствует среднему абсолютному отклонению ряда в первых разностях. Эта величина, по сути, показывает, насколько обучающая выборка предсказуема. Она может быть равна нулю только в том случае, когда все значения в обучающей выборке равны друг другу, что соответствует отсутствию каких-либо изменений в ряде данных, ситуации на практике почти невозможной. Кроме того, если ряд имеет тендецию к росту либо снижению, его первые разности будут колебаться около некоторого фиксированного уровня. В результате этого по разным рядам с разной структурой, знаменатели будут более-менее сопоставимыми. Всё это, конечно же, является очевидными плюсами ''MASE'', так как позволяет складывать разные значения по разным рядам и получать несмещённые оценки.

Но, конечно же, без минусов нельзя. Проблема ''MASE'' в том, что её тяжело интерпретировать. Например, ''MASE''=1.21 ни о чём, по сути, не говорит. Это просто означает, что ошибка прогноза оказалась в 1.21 раза выше среднего абсолютного отклонения ряда в первых разностях, и ничего более.

MuratOK

187

правок

Изменения

Оценка качества в задачах классификации и регрессии

Навигация

Персональные инструменты

Пространства имён

Варианты

Просмотры

Ещё

Поиск

Навигация

Инструменты