Изменения

Перейти к: навигация, поиск

Оценка качества в задачах классификации

1688 байт добавлено, 17:46, 17 июня 2022
F₁ score: Обновление конспекта (Часть 4?) Подробнее про F-меры (6 видов)
= F₁ F score = Для общей оценки качества классификатора часто используют F₁ -меру — среднее гармоническое между precision и recall:
: <tex>F_1 = \left ( \dfrac{Prec^{-1} + Recall^{-1}}{2} \right )^{-1} = 2 \cdot \dfrac{Prec \cdot Recall}{Prec + Recall}</tex>
F₁ Если брать среднее '''геометрическое''' вместо гармонического, то получитсяИндекс Фоулкса–Мэллова (Fowlkes–Mallows index). Менее строгая мера так же может быть обобщена до . : <math> FM = \sqrt{ \dfrac{TP}{TP+FP} \cdot \dfrac{TP}{TP+FN} }</math> Среднее гармоническое '''взвешенное''' F<sub>β</sub> (F<sub>1</sub>-мера - частный случай F<sub>β</sub>-меры для β = 1). F<sub>β</sub> измеряет эффективность классификатора учитывая recall в β раз более важным чем precision:
: <tex>F_β = (1 + β^2) \dfrac{Prec \cdot Recall}{β^2 \cdot Prec + Recall}</tex>
'''F-мера для многоклассовой классификации'''[[Файл:F_scores.png|thumb|400px|Принцип усреднения различных F-мер для нескольких классов]][[Файл:F_scores_сomputing.png|thumb|left|150px|Вычисление TP, FP, FN для многоклассовой классификации]] Для вычисления F-меры (и других) метрик в рамках многоклассовой классификации используется подход "один против всех": каждый класс ровно один раз становится «положительным»,а остальные — отрицательным (пример вычисления изображён на матрице). Таким образом, в зависимости от этапа вычисления, на котором производится усреднение, можно вычислить micro-average, macro-average и average F-меры (логика вычисления изображена на схеме справа).Микро- и макро-:: <tex>F = 2 * \dfrac{\text{precision * recall}}{\text{precision + recall}}</tex>,  где для micro-average precision и recall вычислены из усреднённых TP, FP, FN; для micro-average precision и recall вычислены из усреднённых precision<sub>βi</sub> измеряет эффективность классификатора учитывая , recall в β раз более важным чем precision.<sub>i</sub>;
Для многоклассовой классификации с учётом изначального распределения по классам имеет смысл рассматривать микро- и макро- F меруУсреднённая:: <tex>micro F_β F = \sumfrac{1}{N} \limits_sum_{c \in Classesi=0} \dfrac^{P_c F_β(c)N}{AllF_1score_i}</tex>,: где <math>i</math> - индекс класса, а <texmath>macro F_β = (1 + β^2) \dfrac{Prec_W \cdot Recall_W}{β^2 \cdot Prec_W + Recall_W}N</texmath>- количество классов.
18
правок

Навигация