Изменения

Перейти к: навигация, поиск

Оценка качества в задаче кластеризации

216 байт убрано, 06:55, 29 января 2019
Нет описания правки
'''Проблема оценки качества в [[Кластеризация|задаче кластеризации]]''' трудноразрешима, как минимум, по двум причинам:
* Не [[Кластеризация#Теорема невозможности Клейнберга|Теорема невозможности Клейнберга]] {{---}} не существует оптимального алгоритма кластеризации. Иными словами, различные алгоритмы (или различные конфигурации одного алгоритма) выдают разные разделения на кластеры, и ни одно из них не является лучшим во всех ситуациях.
* Многие алгоритмы кластеризации не способны определить настоящее количество кластеров в данных. Чаще всего количество кластеров подается на вход алгоритма и подбирается несколькими запусками алгоритма.
== Методы оценки качества кластеризации ==
'''Метод (индекс) оценки качества кластеризации''' (англ. ''cluster validity index, CVI'') {{---}} инструментарий для количественной оценки результатов кластеризации.
Принято выделять три группы методов оценки качества кластеризации:
* '''Внутренние''' (англ. ''External'') метрики отображают качество кластеризации только по информации в данных.
* '''Относительные''' (англ. ''Relative'') метрики основаны на оценивании полученного разделения на кластеры относительно результатов работы другого алгоритма.
Иногда сложно отнести метод оценки качества кластеризации к одному одной определенной группе, поэтому нижеприведенное разделение является условным, в других источниках можно встретить иное разделение.
== Внешние метрики оценки качества ==
49
правок

Навигация