Изменения

Перейти к: навигация, поиск

Оценка качества в задаче кластеризации

4 байта добавлено, 01:13, 25 января 2019
Нет описания правки
=== Связность кластеров (Cluster Cohesion) ===
Идея данного метода в том, что чем ближе друг к другу находятся объекты внутри кластеров, тем лучше разделение.
 
Таким образом, необходимо минимизировать внутриклассовое расстояние, например, сумму квадратов отклонений (within cluster sum of squares):
: <math>
=== Разделимость кластеров (Cluster Separation) ===
В данном случае идея противоположная - чем дальше друг от друга находятся объекты разных кластеров, тем лучше.  Поэтому здесь стоит задача максимизации суммы квадратов отклонений (between cluster sum of squares):
: <math>
BSS = n \cdot \sum \limits_{j=1}^{M} (\overline{x_{j}} - \overline{x})^2
</math>
Можно заметить, что два объекта влияют на <math>Г</math> только если они находятся в разных кластерах.
 
Чем больше значение метрики - тем лучше.
49
правок

Навигация