Изменения

Автоматическое машинное обучение

1611 байт добавлено, 00:46, 3 марта 2020

Нет описания правки

Разработка признаков состоит из 3 процессов: извлечение признаков, выбор признаков и конструирование признаков.

Этап генерации модели включает в себя выбор модели и оптимизацию гиперпараметров выбранной модели.

Аббревиатуры GD, RL, EA, BO и BOB обозначают ~~градиент-~~градиентный спуск, обучение с подкреплением, эволюционный алгоритм ~~на основе эволюции~~, байесовская оптимизация и байесовская оптимизация на основе гиперболы, соответственно.

== Подготовка данных ==

=== Выбор признаков ===

[[Файл:2_automl.png|right|thumb|Рис. 3: Итерационный процесс выбора признаков. Подмножество признаков выбирается на основе стратегии поиска, а затем оценивается. После этого выполняется процедура валидации, чтобы определить, является ли полученное подмножество валидным. Описанные выше шаги повторяются до того момента, пока не будет достигнут критерий остановки.]]

Feature selection строит подмножество объектов на основе исходного набора объектов путем сокращения нерелевантных или избыточных признаков. Это, как правило, упрощает модель, таким образом, избегая переобучения и улучшая производительность модели. Выбранные объекты обычно расходятся и сильно коррелируют со значениями объектов. Стратегия поиска для feature selection включает в себя три типа алгоритмов: полный поиск, эвристический поиск и случайный поиск. Методы оценки получившихся подмножеств можно разделить на три основные категории. Первая {{--}} это метод фильтрации, который оценивает каждый признак в соответствии с его дивергенцией или корреляцией, а затем выбирает признаки в соответствии с установленным порогом. Обычно для каждого признака используются такие методы оценки, как дисперсия, коэффициент корреляции и критерий хи-квадрат. Вторая {{--}} метод обертки, который классифицирует выборку с выбранным подмножеством признаков, после чего точность классификации используется в качестве меры для измерения качества подмножества признаков. Третий {{--}} это embedded-метод, в котором выбор осуществляется в процессе обучения. Пример embedded-методов - регуляризация и дерево принятия решений.

Amoniy

84

правки

Изменения

Автоматическое машинное обучение

Навигация

Персональные инструменты

Пространства имён

Варианты

Просмотры

Ещё

Поиск

Навигация

Инструменты