Изменения

Перейти к: навигация, поиск

Оценка качества в задаче кластеризации

962 байта добавлено, 18:10, 25 января 2020
Внутренние метрики оценки качества
</math>,
где:
: <math>\delta</math> {{---}} межкластерное расстояние(оценка разделения), <math>\delta(c_k, c_l) = min_{x_i \in c_k, x_j \in c_l} \|x_i - x_j\|</math>,: <math>\Delta(c_k)</math> {{---}} диаметр кластера(оценка сплоченности), <math>\Delta(c_k) = max_{x_i,x_j \in c_k} \|x_i - x_j\|</math>.
=== Обобщенный Индекс Данна (gD31, gD41, gD51, gD33, gD43, gD53) ===
Все эти вариации являются комбинациями 3 вариантов вычисления оценки разделения <math>\delta</math> и оценки компактности <math>\Delta</math>
 
Оценки разделения:
: <math>\delta^3(c_k, c_l) = \dfrac{1}{|c_k| * |c_l|} \sum_{x_i \in c_k} \sum_{x_j \in c_l} \|x_i - x_j\| </math>,
 
: <math>\delta^4(c_k, c_l) = \|\overline{c_k} - \overline{c_l}\| </math>,
 
: <math>\delta^5(c_k, c_l) = \dfrac{1}{|c_k| + |c_l|} (\sum_{x_i \in c_k} \|x_i - \overline{c_k}\| + \sum_{x_j \in c_l} \|x_j - \overline{c_l}\|) </math>,
 
Оценки компактности:
: <math>\Delta^1(c_k) = \Delta(c_k) </math>.
 
: <math>\Delta^3(c_k) = \dfrac{2}{|c_k|} \sum_{x_i \in c_k} \|x_i - \overline{c_k}\| </math>.
=== Силуэт (Silhouette) ===
Значение силуэта показывает, насколько объект похож на свой кластер по сравнению с другими кластерами.
44
правки

Навигация