Изменения

Перейти к: навигация, поиск

Общие понятия

16 байт убрано, 15:46, 20 марта 2020
Нет описания правки
=== Типы задач ===
'''Задачи классификацииКлассификация''' (англ. ''classification'') <br/>''Цель'': научиться определять, к какому классу принадлежит объект. Область значений множества $Y$:
* $Y = \{−1, +1\}$ — классификация на 2 класса;
* $Y = \{1, . . . , M\}$ — на $M$ непересекающихся классов;
* $Y = \{0, 1\}^M$— на $M$ классов, которые могут пересекаться. <br/>
''Цель'': научиться определять, к какому классу принадлежит объект. <br/>
''Примеры'': распознавание текста по рукописному вводу; определение того, находится на фотографии человек или кот; определение, является ли письмо спамом. <br/>
''Методы'': [[Метрический классификатор и метод ближайших соседей|метод ближайших соседей]], [[Дерево решений и случайный лес|дерево решений]], [[Логистическая регрессия|логистическая регрессия]], [[Метод опорных векторов (SVM)|метод опорных векторов]], [[Байесовская классификация|байесовский классификатор]].
'''Задачи восстановления Восстановление регрессии''' (англ. ''regression'') <br/>''Цель'': получение прогноза на основе выборки объектов. Область значений множества $Y$:
* $Y = \mathbb{R}$ или $Y = \mathbb{R}^m$. <br/>
''Цель'': получать прогноз на основе выборки объектов. <br/>
''Примеры'': предсказание стоимости акции через полгода; предсказание прибыли магазина в следующем месяце; предсказание качества вина на слепом тестировании. <br/>
''Методы'': [[Линейная регрессия|линейная регрессия]], [[Дерево решений и случайный лес|дерево решений]], [[Метод опорных векторов (SVM)|метод опорных векторов]].
'''Задачи ранжированияРанжирование''' (англ. ''ranking'') <br/>
{{main|Ранжирование}}
* $Y$ {{---}} конечное упорядоченное множество. <br/>
''Цель'': научиться по множеству объектов получать множество рейтингов, упорядоченное согласно заданному отношению порядка. <br/>''Примеры'': выдача поискового запроса; подбор интересных новостей для пользователя. <br/>
''Методы'': [[Ранжирование#Поточечный подход|поточечный подход]], [[Ранжирование#Попарный подход|попарный подход]], [[Ранжирование#Списочный подход|списочный подход]].
'''Задачи уменьшения Уменьшение размерности''' (англ. ''dimensionality reduction'') <br/>
{{main|Уменьшение размерности}}
Научиться описывать данные не $N$ признаками, а меньшим числом для повышения точности модели или последующей визуализации. <br/>
''Цель'': научиться описывать данные не $N$ признаками, а меньшим числом для повышения точности модели или последующей визуализации. <br/>''Примеры'': визуализация в двумерном или трехмерном пространстве; сжатие данных. <br/>
''Методы'': [[Вариации регрессии#Гребневая регрессия (ридж-регрессия)|гребневая регрессия]], [[Вариации регрессии#Лассо-регрессия|лассо-регрессия]], [[Метод главных компонент (PCA)|метод главных компонент]], [[Стохастическое вложение соседей с t-распределением|стохастическое вложение соседей с t-распределением]].
'''Задачи кластеризацииКластеризация''' (англ. ''cluster analysis'')<br/>
{{main|Кластеризация}}
Разбиение данных множества ''Цель'': разбить множество объектов на подмножества ('''кластеры''') таким образом, чтобы объекты из одного кластера были более похожи друг на друга, чем на объекты из других кластеров по какому-либо критерию. <br/> ''Примеры'': разбиение клиентов сотового оператора по платёжеспособности; разбиение космических объектов на похожие (галактики, планеты, звезды и так далее). <br/>
''Методы'': [[Иерархическая кластеризация|иерархическая кластеризация]], [[Эволюционные алгоритмы кластеризации|эволюционные алгоритмы кластеризации]], [[EM-алгоритм]].
'''Задачи выявления Выявление аномалий''' (англ. ''anomaly detection'')<br/>
{{main|Выброс}}
На основании признаков ''Цель'': научиться различать отличать выявлять аномалиив данных. Кажется, что Отличительная особенность задачи от задачи классификации эта задача ничем не отличается. Но особенность выявления аномалий состоит в том, что {{---}} примеров аномалий для тренировки модели у нас либо очень мало, либо нет совсем, ; поэтому мы не можем решать такую задачу как задачу классификациидля ее решения необходимы специальные методы. <br/> ''Примеры'': определение мошеннических транзакций по банковской карте; сейсмология. <br/>
''Методы'': [[Выброс#Методы обнаружения выбросов|экстремальный анализ данных, аппроксимирующий метод, проецирующие методы]].
3
правки

Навигация