Редактирование: Оценка качества в задачах классификации

Перейти к: навигация, поиск

Внимание! Вы не авторизовались на сайте. Ваш IP-адрес будет публично видимым, если вы будете вносить любые правки. Если вы войдёте или создадите учётную запись, правки вместо этого будут связаны с вашим именем пользователя, а также у вас появятся другие преимущества.

Правка может быть отменена. Пожалуйста, просмотрите сравнение версий, чтобы убедиться, что это именно те изменения, которые вас интересуют, и нажмите «Записать страницу», чтобы изменения вступили в силу.
Текущая версия Ваш текст
Строка 9: Строка 9:
 
'''Confusion matrix''' ('''матрица ошибок / несоответствий / потерь, CM''')
 
'''Confusion matrix''' ('''матрица ошибок / несоответствий / потерь, CM''')
 
[[Файл:F_scores_сomputing.png|thumb|right|150px|Вычисление TP, FP, FN по CM]]
 
[[Файл:F_scores_сomputing.png|thumb|right|150px|Вычисление TP, FP, FN по CM]]
— квадратная матрица размера k × k, где <tex>\text{CM}_{t,c}</tex> — число объектов класса <math>t</math>,
+
— квадратная матрица размера n × n, где <tex>\text{CM}_{t,c}</tex> — число объектов класса <math>t</math>,
которые были квалифицированны как класс <math>c</math>, а <math>k</math> — число классов. Значения ячеек CM могут быть вычислены по формуле:
+
которые были квалифицированны как класс <math>c</math>, а <math>n</math> — число классов. Значения ячеек CM могут быть вычислены по формуле:
 
<tex>\text{CM}(y, \hat{y})_{t,c} =
 
<tex>\text{CM}(y, \hat{y})_{t,c} =
 
\displaystyle\sum_{i = 1}^{n}[(y_i = t) ∧ (\hat{y_i} = c)]</tex>, где <tex>y_i</tex> — реальный класс объекта, а <tex>\hat{y_i}</tex> — предсказанный.
 
\displaystyle\sum_{i = 1}^{n}[(y_i = t) ∧ (\hat{y_i} = c)]</tex>, где <tex>y_i</tex> — реальный класс объекта, а <tex>\hat{y_i}</tex> — предсказанный.
Строка 73: Строка 73:
 
Ввиду того, что такие оценки никак не учитывают изначальное распределение классов в выборке (что может существенно влиять на полученное значение), также существуют взвешенные варианты этих оценок (в терминах многоклассовой классификации):
 
Ввиду того, что такие оценки никак не учитывают изначальное распределение классов в выборке (что может существенно влиять на полученное значение), также существуют взвешенные варианты этих оценок (в терминах многоклассовой классификации):
 
* '''Precision'''
 
* '''Precision'''
: <tex>\text{Precision}_W = \dfrac{\sum\limits_{i = 1}^{k} \dfrac{T_i P_i}{C_i}}{\text{All}}</tex>
+
: <tex>\text{Precision}_W = \dfrac{\sum\limits_{i = 1}^{n} \dfrac{T_i P_i}{C_i}}{\text{All}}</tex>
 
* '''Recall'''
 
* '''Recall'''
: <tex>\text{Recall}_W = \dfrac{\sum\limits_{i = 1}^{k} T_i}{\text{All}}</tex>
+
: <tex>\text{Recall}_W = \dfrac{\sum\limits_{i = 1}^{n} T_i}{\text{All}}</tex>
  
 
= Различные виды агрегации Precision и Recall =
 
= Различные виды агрегации Precision и Recall =
Строка 144: Строка 144:
  
 
Усреднённая:
 
Усреднённая:
: <math>\text{F} = \dfrac{1}{k} \displaystyle\sum_{i = 0}^{k} {\text{F}_1score_i}</math>,
+
: <math>\text{F} = \dfrac{1}{n} \displaystyle\sum_{i = 0}^{n} {\text{F}_1score_i}</math>,
где <math>i</math> — индекс класса, а <math>k</math> — число классов.
+
где <math>i</math> — индекс класса, а <math>n</math> — число классов.
  
 
= ROC-кривая =
 
= ROC-кривая =

Пожалуйста, учтите, что любой ваш вклад в проект «Викиконспекты» может быть отредактирован или удалён другими участниками. Если вы не хотите, чтобы кто-либо изменял ваши тексты, не помещайте их сюда.
Вы также подтверждаете, что являетесь автором вносимых дополнений, или скопировали их из источника, допускающего свободное распространение и изменение своего содержимого (см. Викиконспекты:Авторские права). НЕ РАЗМЕЩАЙТЕ БЕЗ РАЗРЕШЕНИЯ ОХРАНЯЕМЫЕ АВТОРСКИМ ПРАВОМ МАТЕРИАЛЫ!

Чтобы изменить эту страницу, пожалуйста, ответьте на приведённый ниже вопрос (подробнее):

Отменить | Справка по редактированию (в новом окне)