187
правок
Изменения
Нет описания правки
== Оценки качества классификации ==
=== Сonfusion matrix (матрица ошибок) ===
Перед переходом к самим метрикам необходимо ввести важную концепцию для описания этих метрик в терминах ошибок классификации — [[матрица ошибок|confusion matrix]] (матрица ошибок).
Таким образом, ошибки классификации бывают двух видов: False Negative (FN) и False Positive (FP).
Каждая строка в матрице ошибок представляет фактический класс, а каждый столбец - спрогнозированный класс.
# код для матрицы ошибок
from sklearn.metrics import confusion_matrix
import pandas as pd
n = confusion_matrix(y, a) # 1-й способ
n = pd.crosstab(y, a) # 2-й способ
# Вычисление TN, FP, FN, TP
TN, FP, FN, TP = confusion_matrix(y, a).ravel()
=== Accuracy ===
Коэффициент детерминации измеряет долю дисперсии, объясненную моделью, в общей дисперсии целевой переменной. Фактически, данная мера качества — это нормированная среднеквадратичная ошибка. Если она близка к единице, то модель хорошо объясняет данные, если же она близка к нулю, то прогнозы сопоставимы по качеству с константным предсказанием.
=== MAPE, Mean Absolute Percentage Error (средняя абсолютная процентная ошибка) ===