Изменения

Перейти к: навигация, поиск

Автоматическое машинное обучение

4888 байт добавлено, 16:00, 4 марта 2020
Нет описания правки
== Генерация модели ==
После генерации признаков нам нужно сгенерировать модель и задать ее гиперпараметры. Как показано на Рис. 1, генерация модели состоит из двух этапов: [[Модель алгоритма и её выбор | выбора модели]] и [[Настройка гиперпараметров | оптимизации гиперпараметров]]. <br><br>Существует два типа подходов к выбору множество способов выбора модели. Ниже приведены некоторые из них: выбор === TPOT (Tree-base Pipeline Optimization Tool) ===В основе TPOT лежит эволюционный алгоритм поиска для нахождения параметров и лучших модельных ансамблей. TPOT пытается создать конвеер, оценивает его производительность и случайным образом изменяет части конвеера в поиске наибольшей эффективности. У TPOT займет некоторое время, чтобы работать на достаточно больших наборах данных, и очень важно понять, почему. С настройками TPOT по умолчанию (100 поколений с размером популяции 100) TPOT оценит 10000 конфигураций конвеера до завершения. Чтобы понять, насколько это много, подумайте о grid search из 10000 комбинаций гиперпараметров для алгоритма машинного обучения и о том, сколько времени займет этот поиск. Это 10000 конфигураций модели вручную для оценки с 10-fold кросс-валидацией, что означает, что примерно 100000 моделей подходят и оцениваются на обучающих данных в одном grid search. Поэтому, для некоторых наборов данных требуется всего несколько минут, чтобы найти высокопроизводительную модель для работы, а некоторым может потребоваться несколько дней.=== Auto-WEKA ===Данный способ позволяет нам одновременно выбирать лучшую модель и настраивать ее гиперпараметры. На рис.3 показаны 28 базовых алгоритмов, 7 мета-алгоритмов и 2 ансамблевых алгоритма. При автоматическом выборе модели, они пробуются все, и выбирается один лучший с уже настроенными гиперпараметрами. Время работы алгоритма достаточно долгое, потому что нам нужно перебрать все возможные алгоритмы и для каждого из них настроить его гиперпараметры.{|align="center" |-valign="top" |[[Поиск архитектуры нейронной сети Файл:3_automl.png| поиск архитектуры нейронной сети (NAS)400px|thumb|Рис. 3: Алгоритмы и методы, которые поддерживаются Auto-WEKA и количество их гиперпараметров соответственно. Все алгоритмы и методы используются для задач классификации, помеченные звёздочков - также для задач регрессии.]] |[[Файл:4_automl.png|thumb|Рис. 4: Алгоритмы и методы, которые поддерживаются Auto-sklearn и количество их гиперпараметров соответственно]] |}=== Auto-sklearn ===Так же, как и в Auto-WEKA, в Auto-sklearn мы можем автоматически выбрать лучшую модель из тех, что поддерживаются, и сразу настроить ее гиперпараметры. <br>На рис.4 показано, что Auto-sklearn поддерживает 15 алгоритмов и у каждого из них свое количество гиперпараметров. <br>Сначала используется мета-обучение на основе различных признаков и мета-признаков набора данных, чтобы найти наилучшие модели. После этого используется подход байесовской оптимизации, чтобы найти лучшие гиперпараметры для выбранных моделей.
== Оценка модели ==
После того, как новая нейронная сеть была сгенерирована, ее производительность должна быть оценена. Интуитивный метод состоит в том, чтобы обучить сеть сходиться, а затем оценить ее производительность. Однако этот метод требует значительных временных и вычислительных ресурсов. Для ускорения процесса оценки модели было предложено несколько алгоритмов, которые приведены ниже.
* число операций с плавающей точкой (FLOP)
* действительная задержка
 
== См. также ==
* [[Модель алгоритма и её выбор]]
* [[Мета-обучение]]
* [[Настройка гиперпараметров]]
 
== Источники информации ==
* [https://arxiv.org/pdf/1908.00709.pdf AutoML: A Survey of the State-of-the-Art]
* [https://www.ml4aad.org/wp-content/uploads/2018/07/automl_book_draft_auto-weka.pdf Auto-WEKA: Automatic model selection in WEKA]
* [https://towardsdatascience.com/tpot-automated-machine-learning-in-python-4c063b3e5de9 TPOT Automated Machine Learning in Python]
* [https://www.automl.org/wp-content/uploads/2018/12/auto-sklearn-1.pdf Auto-sklearn: Efficient and Robust Automated Machine Learning]
84
правки

Навигация