Изменения

Перейти к: навигация, поиск

Ранжирование

2374 байта добавлено, 14 март
Нет описания правки
<tex>nDCG@k(q) = {\large {DCG@k(q)} \over {{\large max DCG@k(q)}}}</tex>, где <tex>max DCG@k(q)</tex> — значение DCG при идеальном ранжировании. После нормировки метрика принимает
значения от 0 до 1.
 
'''Пример вычисления DCG и nDCG:'''
 
Дано множество документов, где каждый документ оценивается от <tex>3</tex> до <tex>0</tex>, где <tex>3</tex> {{---}} очень релевантен, а <tex>0</tex> {{---}} не релевантен. Пусть таким множеством будет <tex>S = \{ D_1, D_2, D_3, D_4, D_5, D_6\}</tex>, где оценка релевантности по опросу пользователей задается(в том же порядке) множеством <tex>R = \{3, 2, 3, 0, 1, 2\}</tex>.
 
Тогда <tex>DCG@6 = \sum_{i = 1}^{6} {{rel_i} \over {log(i+1)}} = 3 + 1.262 + 1.5 + 0 + 0.387 + 0.712 = 6.861</tex>
 
{| class="wikitable" align="center" style="color: blue; background-color:#ffffcc;" cellpadding="10"
|+
|-align="center"
! '''i''' || <tex>rel_i</tex> || <tex>log(i+1)</tex> || <tex>{rel_i}\over{log(i+1)}</tex>
|-align="center"
| <tex>1</tex> || <tex>3</tex> || <tex>1</tex> || <tex>3</tex>
|-align="center"
| <tex>2</tex> || <tex>2</tex> || <tex>1.585</tex> || <tex>1.262</tex>
|-align="center"
| <tex>3</tex> || <tex>3</tex> || <tex>2</tex> || <tex>1.5</tex>
|-align="center"
| <tex>4</tex> || <tex>0</tex> || <tex>2.322</tex> || <tex>0</tex>
|-align="center"
| <tex>5</tex> || <tex>1</tex> || <tex>2.585</tex> || <tex>0.387</tex>
|-align="center"
| <tex>6</tex> || <tex>2</tex> || <tex>2.807</tex> || <tex>0.712</tex>
|}
 
Идеальный порядок оценок релевантности <tex>Ideal = \{3, 3, 2, 2, 1, 0\}</tex>. DCG для данного множества будет следующим: <tex>maxDCG@6 = \sum_{i = 1}^{6} {{rel_i} \over {log(i+1)}} = 3 + 1.893 + 1 + 0.861 + 0.387 + 0 = 7.141</tex>.
 
{| class="wikitable" align="center" style="color: blue; background-color:#ffffcc;" cellpadding="10"
|+
|-align="center"
! '''i''' || <tex>rel_i</tex> || <tex>log(i+1)</tex> || <tex>{rel_i}\over{log(i+1)}</tex>
|-align="center"
| <tex>1</tex> || <tex>3</tex> || <tex>1</tex> || <tex>3</tex>
|-align="center"
| <tex>2</tex> || <tex>3</tex> || <tex>1.585</tex> || <tex>1.893</tex>
|-align="center"
| <tex>3</tex> || <tex>2</tex> || <tex>2</tex> || <tex>1</tex>
|-align="center"
| <tex>4</tex> || <tex>2</tex> || <tex>2.322</tex> || <tex>0.861</tex>
|-align="center"
| <tex>5</tex> || <tex>1</tex> || <tex>2.585</tex> || <tex>0.387</tex>
|-align="center"
| <tex>6</tex> || <tex>0</tex> || <tex>2.807</tex> || <tex>0</tex>
|}
 
Итого <tex>nDCG@6 = {{DCG@6} \over {maxDCG@6}} = {{6.861} \over {7.141}} = 0.961</tex>.
==Методы ранжирования==
Всего выделяют три подхода к решению задачи ранжирования: поточечный (англ. pointwise (поточечный), попарный (англ. pairwise (попарный), списочный (англ. listwise (списочный). Далее будут приведены по одному методу из каждого подхода, чтобы можно былосоставить представления об их различиях и особенностях.
===Поточечный подход===
44
правки

Навигация