115
правок
Изменения
→Типы задач
'''Задачи уменьшения размерности''' (англ. ''dimensionality reduction'') <br/>
{{main|Уменьшение размерности}}
Научиться описывать данные не $N$ признаками, а меньшим числом (как правило, 2-3 для повышения точности модели или последующей визуализации). В качестве примера помимо необходимости для визуализации можно привести сжатие данных. <br/>
'''Задачи кластеризации''' (англ. ''cluster analysis'')<br/>
{{main|Кластеризация}}
Разбиение данных множества объектов на похожие категорииподмножества ('''кластеры''') таким образом, чтобы объекты из одного кластера были более похожи друг на друга, чем на объекты из других кластеров по какому-либо критерию. <br/>
''Примеры:'' разбиение клиентов сотового оператора по платёжеспособности, разбиение космических объектов на похожие (галактики, планеты, звезды и так далее). <br/>
'''Задачи выявления аномалий''' (англ. ''anomaly detection'')<br/>
На основании признаков научиться различать отличать аномалии от «не-аномалий». Кажется, что от задачи классификации эта задача ничем не отличается. Но особенность выявления аномалий состоит в том, что примеров аномалий для тренировки модели у нас либо очень мало, либо нет совсем, поэтому мы не можем решать такую задачу как задачу классификации. <br/>
''Пример:'' определение мошеннических транзакций по банковской карте.