Изменения

Перейти к: навигация, поиск

Оценка качества в задачах классификации

Нет изменений в размере, 15:24, 20 июня 2022
Нет описания правки
'''Confusion matrix''' ('''матрица ошибок / несоответствий / потерь, CM''')
[[Файл:F_scores_сomputing.png|thumb|right|150px|Вычисление TP, FP, FN по CM]]
— квадратная матрица размера n k × nk, где <tex>\text{CM}_{t,c}</tex> — число объектов класса <math>t</math>,которые были квалифицированны как класс <math>c</math>, а <math>nk</math> — число классов. Значения ячеек CM могут быть вычислены по формуле:
<tex>\text{CM}(y, \hat{y})_{t,c} =
\displaystyle\sum_{i = 1}^{n}[(y_i = t) ∧ (\hat{y_i} = c)]</tex>, где <tex>y_i</tex> — реальный класс объекта, а <tex>\hat{y_i}</tex> — предсказанный.
Ввиду того, что такие оценки никак не учитывают изначальное распределение классов в выборке (что может существенно влиять на полученное значение), также существуют взвешенные варианты этих оценок (в терминах многоклассовой классификации):
* '''Precision'''
: <tex>\text{Precision}_W = \dfrac{\sum\limits_{i = 1}^{nk} \dfrac{T_i P_i}{C_i}}{\text{All}}</tex>
* '''Recall'''
: <tex>\text{Recall}_W = \dfrac{\sum\limits_{i = 1}^{nk} T_i}{\text{All}}</tex>
= Различные виды агрегации Precision и Recall =
Усреднённая:
: <math>\text{F} = \dfrac{1}{nk} \displaystyle\sum_{i = 0}^{nk} {\text{F}_1score_i}</math>,где <math>i</math> — индекс класса, а <math>nk</math> — число классов.
= ROC-кривая =
18
правок

Навигация