Изменения

Перейти к: навигация, поиск
F-mera
=== F-mera ===
[[Файл:F_balanc.jpg|left|thumb|Рис.1 Сбалансированная F-мера, <math>β=1</math>]][[Файл:F_prior_Prec.jpg|thumb|Рис.2 F-мера c приоритетом точности, <math>β^2=\dfrac{ 1 }{ 4 }</math>]][[Файл:F_prior_Recal.jpg|thumb|Рис.3 F-мера c приоритетом полноты, <math>β^2=2</math>]]''Precision '' и ''recall '' не зависят, в отличие от ''accuracy'', от соотношения классов и потому применимы в условиях несбалансированных выборок.
Часто в реальной практике стоит задача найти оптимальный (для заказчика) баланс между этими двумя метриками. Понятно что чем выше точность и полнота, тем лучше. Но в реальной жизни максимальная точность и полнота не достижимы одновременно и приходится искать некий баланс. Поэтому, хотелось бы иметь некую метрику которая объединяла бы в себе информацию о точности и полноте нашего алгоритма. В этом случае нам будет проще принимать решение о том какую реализацию запускать в production (у кого больше тот и круче). Именно такой метрикой является F-мера.
F-мера представляет собой [[гармоническое среднее]] между точностью и полнотой. Она стремится к нулю, если точность или полнота стремится к нулю.
: <math>F = \dfrac{ 2 \times precision \times recall }{ precision + recall }</math>
Данная формула придает одинаковый вес точности и полноте, поэтому F-мера будет падать одинаково при уменьшении и точности и полноты. Возможно рассчитать F-меру придав различный вес точности и полноте, если вы осознанно отдаете приоритет одной из этих метрик при разработке алгоритма.:
: <math>
</math>
где <math>β</math> принимает значения в диапазоне <math>0<β<1</math> если вы хотите отдать приоритет точности, а при <math>β>1</math> приоритет отдается полноте. При <math>β=1</math> формула сводится к предыдущей и вы получаете сбалансированную F-меру (также ее называют <math>F_1</math>).: 
F-мера достигает максимума при максимальной полноте и точности, и близка к нулю, если один из аргументов близок к нулю.
 
[[Файл:fmb.png]]
F-мера является хорошим кандидатом на формальную метрику оценки качества классификатора. Она сводит к одному числу две других основополагающих метрики: точность и полноту. Имея в своем распоряжении подобный механизм оценки вам будет гораздо проще принять решение о том являются ли изменения в алгоритме в лучшую сторону или нет.
187
правок

Навигация