Изменения

Автоматическое машинное обучение

2311 байт убрано, 13:23, 10 марта 2020

Нет описания правки

Существует множество способов выбора модели. Ниже приведены некоторые из них:

=== TPOT (Tree-base Pipeline Optimization Tool) ===

В основе [[Модель алгоритма и её выбор | TPOT ]] лежит эволюционный алгоритм поиска для нахождения ~~параметров~~ лучшей модели и ~~лучших модельных ансамблей~~оновременной оптимизации её гиперпараметров. Время работы TPOT пытается создать конвеер, оценивает его производительность и случайным образом изменяет части конвеера в поиске наибольшей эффективности. У TPOT займет некоторое время, чтобы работать на достаточно больших наборах сильно зависит от размера входных данных, и очень важно понять, почему. С настройками TPOT по умолчанию (100 поколений с размером популяции 100) TPOT оценит 10000 конфигураций конвеера до завершения. Чтобы понять, насколько это много, подумайте о grid search из 10000 комбинаций гиперпараметров для алгоритма машинного обучения и о том, сколько времени займет этот поиск. Это 10000 конфигураций модели для оценки с 10-fold кросс-валидацией, что означает, что примерно 100000 моделей подходят и оцениваются на обучающих данных в одном grid search. Поэтому, для некоторых наборов данных требуется всего несколько минут, чтобы найти высокопроизводительную модель для работы, а некоторым может потребоваться несколько дней.

=== Auto-WEKA ===

~~Данный способ~~ [[Модель алгоритма и её выбор | Auto-WEKA]] позволяет нам одновременно выбирать лучшую модель и настраивать ее гиперпараметры. На рис.3 показаны 28 базовых алгоритмов, 7 мета-алгоритмов и 2 ансамблевых алгоритма. При автоматическом выборе модели, они пробуются все, и выбирается один лучший с уже настроенными гиперпараметрами. Время работы алгоритма достаточно долгое, потому что нам нужно перебрать все возможные алгоритмы и для каждого из них настроить его гиперпараметры.

=== Auto-sklearn ===

Так же, как и в Auto-WEKA, в [[Модель алгоритма и её выбор | Auto-sklearn ]] мы можем автоматически выбрать лучшую модель из тех, что поддерживаются, и сразу настроить ее гиперпараметры. <br>На рис.4 показано, что Auto-sklearn поддерживает 15 алгоритмов и у каждого из них свое количество гиперпараметров. <br>Сначала используется мета-обучение на основе различных признаков и мета-признаков набора данных, чтобы найти наилучшие модели. После этого используется подход байесовской оптимизации, чтобы найти лучшие гиперпараметры для выбранных моделей.

== Оценка модели ==

После того, как новая модель была сгенерирована, ее производительность должна быть оценена. Интуитивный метод состоит в том, чтобы обучить сеть сходиться, а затем оценить ее производительность. Однако этот метод требует значительных временных и вычислительных ресурсов. Для ускорения процесса оценки модели было предложено несколько алгоритмов, которые приведены ниже.

Amoniy

84

правки

Изменения

Автоматическое машинное обучение

Навигация

Персональные инструменты

Пространства имён

Варианты

Просмотры

Ещё

Поиск

Навигация

Инструменты