Изменения

Перейти к: навигация, поиск

Оценка качества в задачах классификации

1683 байта добавлено, 12:22, 15 июня 2022
Обновление конспекта (Часть 3): "Добавить инфу про различные виды агрегации Precision и Recall"
* '''Recall'''
: <tex>Recall_W = \dfrac{\sum\limits_{i = 1}^{N} T_i}{All}</tex>
 
= Различные виды агрегации Precision и Recall =
 
'''Арифметическое среднее:'''
 
: <tex>A = \dfrac{1}{2} (precision + recall)</tex>
 
* Если precision = 0.05, recall = 1, то A = 0.525
* Если precision = 0.525, recall = 0.525, то A = 0.525.
* Первый классификатор — константный, не имеет смысла.
* Второй классификатор показывает неплохое качество.
Таким образом, взятие среднего арифметического не является показательным.
 
'''Минимум:'''
 
: <tex>M = min(precision, recall)</tex>
 
* Если precision = 0.05, recall = 1, то M = 0.05
* Если precision = 0.525, recall = 0.525, то M = 0.525.
То есть, довольно неплохо отражает качество классификатора, не завышая его.
* Если precision = 0.2, recall = 1, то M = 0.2.
* Если precision = 0.2, recall = 0.3, то M = 0.2.
Но не отличает классификаторы с разными неминимальными показателями.
 
'''Гармоническое среднее, или F-мера:'''
 
* Если precision = 0.05, recall = 1, то F = 0.1.
* Если precision = 0.525, recall = 0.525, то F = 0.525.
* Если precision = 0.2, recall = 1, то F = 0.33.
* Если precision = 0.2, recall = 0.3, то F = 0.24.
Является наиболее точным усреднением, учитывает оба показателя.
 
: <tex>F = \dfrac{2 ∗ precision ∗ recall}{precision + recall}</tex>
 
= ROC кривая =
Анонимный участник

Навигация