Изменения

Перейти к: навигация, поиск
Accuracy
Интуитивно понятной, очевидной и почти неиспользуемой метрикой является accuracy — доля правильных ответов алгоритма:
[[Файл:acc.png|300px]]<math>accuracy = \dfrac{TP+TN}{TP+TN+FP+FN}</math>
Эта метрика бесполезна в задачах с неравными классами, и это легко показать на примере.
Тогда accuracy:
[[Файл:acc1.png|300px]]<math>accuracy = \dfrac{5+90}{5+90+10+5} = 86,4</math>
Однако если мы просто будем предсказывать все письма как не-спам, то получим более высокую accuracy:
[[Файл:acc2.png|300px]]<math>accuracy = \dfrac{0+100}{0+100+0+10} = 90,9</math>
При этом, наша модель совершенно не обладает никакой предсказательной силой, так как изначально мы хотели определять письма со спамом. Преодолеть это нам поможет переход с общей для всех классов метрики к отдельным показателям качества классов.
187
правок

Навигация