51
правка
Изменения
Нет описания правки
===Конструирование признаков===
[http://neerc.ifmo.ru/wiki/index.php?title=%D0%A3%D0%BC%D0%B5%D0%BD%D1%8C%D1%88%D0%B5%D0%BD%D0%B8%D0%B5_%D1%80%D0%B0%D0%B7%D0%BC%D0%B5%D1%80%D0%BD%D0%BE%D1%81%D1%82%D0%B8 [Уменьшение размерности|Конструирование признаков]] состоит из учета, статистической обработки и преобразования данных для создания признаков, используемых в модели. Чтобы понять лежащие в основе модели механизмы, целесообразно оценить связь между компонентами и понять, как алгоритмы машинного обучения будут использовать эти компоненты.
На данном этапе нужно творческое сочетание опыта и информации, полученной на этапе исследования данных. В конструирование признаков необходимо найти баланс. Важно найти и учесть информативные переменные, не создавая при этом лишние несвязанные признаки. Информативные признаки улучшают результат модели, а не информативные — добавляют в модель ненужный шум. При создании признаков необходимо учитывать все новые данные, полученные во время обучения модели.
* Обучить модель с помощью тренировочного набора данных.
* Проверить модель на тестовом наборе данных.
* Использовать ансамбль конкурирующих алгоритмов машинного обучения, а также связанные с ними параметры настройки ([[Модель алгоритма и её выбор|перебор [http://neerc.ifmo.ru/wiki/index.php?title=%D0%9C%D0%BE%D0%B4%D0%B5%D0%BB%D1%8C_%D0%B0%D0%BB%D0%B3%D0%BE%D1%80%D0%B8%D1%82%D0%BC%D0%B0_%D0%B8_%D0%B5%D1%91_%D0%B2%D1%8B%D0%B1%D0%BE%D1%80 гиперпараметров]]), которые определяют ответы на поставленный вопрос по имеющимся данным.
* Определить, какой алгоритм наиболее точно решает поставленную задачу, сравнивая метрики для все возможных вариантов.
* [[Общие понятия]]
* [[Глубокое обучение]]
* [[Оценка качества в задачах классификации и регрессии]]
* [[Модель алгоритма и её выбор]]
==Источники информации==