Редактирование: Оценка качества в задачах классификации
Внимание! Вы не авторизовались на сайте. Ваш IP-адрес будет публично видимым, если вы будете вносить любые правки. Если вы войдёте или создадите учётную запись, правки вместо этого будут связаны с вашим именем пользователя, а также у вас появятся другие преимущества.
Правка может быть отменена. Пожалуйста, просмотрите сравнение версий, чтобы убедиться, что это именно те изменения, которые вас интересуют, и нажмите «Записать страницу», чтобы изменения вступили в силу.
Текущая версия | Ваш текст | ||
Строка 9: | Строка 9: | ||
'''Confusion matrix''' ('''матрица ошибок / несоответствий / потерь, CM''') | '''Confusion matrix''' ('''матрица ошибок / несоответствий / потерь, CM''') | ||
[[Файл:F_scores_сomputing.png|thumb|right|150px|Вычисление TP, FP, FN по CM]] | [[Файл:F_scores_сomputing.png|thumb|right|150px|Вычисление TP, FP, FN по CM]] | ||
− | — квадратная матрица размера | + | — квадратная матрица размера n × n, где <tex>\text{CM}_{t,c}</tex> — число объектов класса <math>t</math>, |
− | которые были квалифицированны как класс <math>c</math>, а <math> | + | которые были квалифицированны как класс <math>c</math>, а <math>n</math> — число классов. Значения ячеек CM могут быть вычислены по формуле: |
<tex>\text{CM}(y, \hat{y})_{t,c} = | <tex>\text{CM}(y, \hat{y})_{t,c} = | ||
\displaystyle\sum_{i = 1}^{n}[(y_i = t) ∧ (\hat{y_i} = c)]</tex>, где <tex>y_i</tex> — реальный класс объекта, а <tex>\hat{y_i}</tex> — предсказанный. | \displaystyle\sum_{i = 1}^{n}[(y_i = t) ∧ (\hat{y_i} = c)]</tex>, где <tex>y_i</tex> — реальный класс объекта, а <tex>\hat{y_i}</tex> — предсказанный. | ||
Строка 73: | Строка 73: | ||
Ввиду того, что такие оценки никак не учитывают изначальное распределение классов в выборке (что может существенно влиять на полученное значение), также существуют взвешенные варианты этих оценок (в терминах многоклассовой классификации): | Ввиду того, что такие оценки никак не учитывают изначальное распределение классов в выборке (что может существенно влиять на полученное значение), также существуют взвешенные варианты этих оценок (в терминах многоклассовой классификации): | ||
* '''Precision''' | * '''Precision''' | ||
− | : <tex>\text{Precision}_W = \dfrac{\sum\limits_{i = 1}^{ | + | : <tex>\text{Precision}_W = \dfrac{\sum\limits_{i = 1}^{n} \dfrac{T_i P_i}{C_i}}{\text{All}}</tex> |
* '''Recall''' | * '''Recall''' | ||
− | : <tex>\text{Recall}_W = \dfrac{\sum\limits_{i = 1}^{ | + | : <tex>\text{Recall}_W = \dfrac{\sum\limits_{i = 1}^{n} T_i}{\text{All}}</tex> |
= Различные виды агрегации Precision и Recall = | = Различные виды агрегации Precision и Recall = | ||
Строка 144: | Строка 144: | ||
Усреднённая: | Усреднённая: | ||
− | : <math>\text{F} = \dfrac{1}{ | + | : <math>\text{F} = \dfrac{1}{n} \displaystyle\sum_{i = 0}^{n} {\text{F}_1score_i}</math>, |
− | где <math>i</math> — индекс класса, а <math> | + | где <math>i</math> — индекс класса, а <math>n</math> — число классов. |
= ROC-кривая = | = ROC-кривая = |