Эволюционные алгоритмы кластеризации
Формулировка задачи кластеризации в общем случае не задаёт условие близости относительно метрики (см. теорему Клейнберга); в связи с этим, многие разработанные методы и алгоритмы решения задачи кластеризации предполагают применимость конкретной меры близости объектов для анализа рассматриваемой выборки. Альтернативный подход заключается в задании индекса кластеризации как меры близости объектов внутри кластеров и использовании универсального метода для оптимизации этого индекса; эволюционные алгоритмы являются одним из семейств таких универсальных методов.
Описание метода
Для решения задачи кластеризации (hard clustering) эволюционный алгоритм использует:
- разбиения выборки в качестве особей;
- индекс кластеризации в качестве целевой функции;
- операции видоизменения разбиений в качестве мутаций;
- операции комбинирования ("скрещивания") разбиений в качестве кроссовера.
Параметры эволюционного алгоритма
Из описания выше следует, что эволюционный алгоритм кластеризации задаётся рядом гиперпараметров - таких как инициализация, применяемые мутации, схема самого алгоритма и т.п. Некоторые исследованные элементы конфигурации эволюционного алгоритма кластеризации приведены ниже.