Изменения

Перейти к: навигация, поиск

Автоматическое машинное обучение

2311 байт убрано, 13:23, 10 марта 2020
Нет описания правки
Существует множество способов выбора модели. Ниже приведены некоторые из них:
=== TPOT (Tree-base Pipeline Optimization Tool) ===
В основе [[Модель алгоритма и её выбор | TPOT ]] лежит эволюционный алгоритм поиска для нахождения параметров лучшей модели и лучших модельных ансамблейоновременной оптимизации её гиперпараметров. Время работы TPOT пытается создать конвеер, оценивает его производительность и случайным образом изменяет части конвеера в поиске наибольшей эффективности. У TPOT займет некоторое время, чтобы работать на достаточно больших наборах сильно зависит от размера входных данных, и очень важно понять, почему. С настройками TPOT по умолчанию (100 поколений с размером популяции 100) TPOT оценит 10000 конфигураций конвеера до завершения. Чтобы понять, насколько это много, подумайте о grid search из 10000 комбинаций гиперпараметров для алгоритма машинного обучения и о том, сколько времени займет этот поиск. Это 10000 конфигураций модели для оценки с 10-fold кросс-валидацией, что означает, что примерно 100000 моделей подходят и оцениваются на обучающих данных в одном grid search. Поэтому, для некоторых наборов данных требуется всего несколько минут, чтобы найти высокопроизводительную модель для работы, а некоторым может потребоваться несколько дней.
=== Auto-WEKA ===
Данный способ [[Модель алгоритма и её выбор | Auto-WEKA]] позволяет нам одновременно выбирать лучшую модель и настраивать ее гиперпараметры. На рис.3 показаны 28 базовых алгоритмов, 7 мета-алгоритмов и 2 ансамблевых алгоритма. При автоматическом выборе модели, они пробуются все, и выбирается один лучший с уже настроенными гиперпараметрами. Время работы алгоритма достаточно долгое, потому что нам нужно перебрать все возможные алгоритмы и для каждого из них настроить его гиперпараметры.
=== Auto-sklearn ===
Так же, как и в Auto-WEKA, в [[Модель алгоритма и её выбор | Auto-sklearn ]] мы можем автоматически выбрать лучшую модель из тех, что поддерживаются, и сразу настроить ее гиперпараметры. <br>На рис.4 показано, что Auto-sklearn поддерживает 15 алгоритмов и у каждого из них свое количество гиперпараметров. <br>Сначала используется мета-обучение на основе различных признаков и мета-признаков набора данных, чтобы найти наилучшие модели. После этого используется подход байесовской оптимизации, чтобы найти лучшие гиперпараметры для выбранных моделей.
== Оценка модели ==
После того, как новая модель была сгенерирована, ее производительность должна быть оценена. Интуитивный метод состоит в том, чтобы обучить сеть сходиться, а затем оценить ее производительность. Однако этот метод требует значительных временных и вычислительных ресурсов. Для ускорения процесса оценки модели было предложено несколько алгоритмов, которые приведены ниже.
84
правки

Навигация