Изменения

Перейти к: навигация, поиск

Оценка качества в задачах классификации

51 байт добавлено, 19:22, 4 сентября 2022
м
rollbackEdits.php mass rollback
'''Confusion matrix''' ('''матрица ошибок / несоответствий / потерь, CM''')
[[Файл:F_scores_сomputing.png|thumb|right|150px|Вычисление TP, FP, FN по CM]]
— квадратная матрица размера n k × nk, где <tex>\text{CM}_{t,c}</tex> — число объектов класса <math>t</math>,которые были квалифицированны как класс <math>c</math>, а <math>nk</math> — число классов. Значения ячеек CM могут быть вычислены по формуле:
<tex>\text{CM}(y, \hat{y})_{t,c} =
\displaystyle\sum_{i = 1}^{n}[(y_i = t) ∧ (\hat{y_i} = c)]</tex>, где <tex>y_i</tex> — реальный класс объекта, а <tex>\hat{y_i}</tex> — предсказанный.
Ввиду того, что такие оценки никак не учитывают изначальное распределение классов в выборке (что может существенно влиять на полученное значение), также существуют взвешенные варианты этих оценок (в терминах многоклассовой классификации):
* '''Precision'''
: <tex>\text{Precision}_W = \dfrac{\sum\limits_{i = 1}^{Nk} \dfrac{T_i P_i}{C_i}}{\text{All}}</tex>
* '''Recall'''
: <tex>\text{Recall}_W = \dfrac{\sum\limits_{i = 1}^{Nk} T_i}{\text{All}}</tex>
= Различные виды агрегации Precision и Recall =
''Примеры и картинки взяты из лекций курса [«Введение в машинное обучение»<ref>https://web.archive.org/web/20220226120201/https://www.coursera.org/learn/vvedenie-mashinnoe-obuchenie "Введение в машинное обучение»] </ref> К.В. Воронцова''
'''Арифметическое среднее:'''
'''Геометрическое среднее, или Индекс Фоулкса–Мэллова (Fowlkes–Mallows index)'''
: <math> \text{FM} = \sqrt{ \dfrac{\text{TP}}{\text{TP + FP}} \cdot \dfrac{\text{TP}}{\text{TP + FN}} }</math>
Менее строгая мера.
= F-мера =
где для micro-average precision и recall вычислены из усреднённых TP, FP, FN;
для micromacro-average precision и recall вычислены из усреднённых precision<sub>i</sub>, recall<sub>i</sub>;
Усреднённая:
: <math>\text{F} = \dfrac{1}{nk} \displaystyle\sum_{i = 0}^{nk} {\text{F}_1score_i}</math>,где <math>i</math> — индекс класса, а <math>nk</math> — число классов.
= ROC-кривая =
1632
правки

Навигация