Изменения

← Предыдущая правка

Поиск архитектуры нейронной сети

6396 байт добавлено, 19:19, 4 сентября 2022

м

rollbackEdits.php mass rollback

~~Neaural Architecture Search (NAS,~~ {{Определение|definition ='''Поиск архитектуры нейронной сети''' (англ. ''Neural Architecture Search, NAS'') - — это процесс автоматизации проектирования архитектурынейронной сети. Другими словами, ~~то есть нахождение нашей~~ это процесс поиска лучшей структуры модели машинного обучения. ~~Системе~~ Система NAS ~~предоставляется~~ получает на вход набор данных, и тип задачи (классификация, регрессия и т.д.), и на ~~основании которого система определяет~~ выходе дает архитектуру ~~нейронной сети~~модели. ~~Эта~~ Полученная архитектура будет работать лучше ~~всех других~~ остальных архитектур для ~~данной~~ данного типа задачи при обучении ~~предоставленным набором~~ на предоставленном наборе данных. }} NAS можно рассматривать как часть ~~AutoML (~~[[Автоматическое машинное обучение|автоматического машинного обучения (англ. ''AutoML'')]]~~), он имеет значительное совпадение~~ . NAS существенно пересекается с ~~оптимизацией гиперпараметров (~~[[Настройка гиперпараметров|оптимизацией гиперпараметров]]). ~~NAS находит архитектуру~~ Чтобы из всех возможных архитектурнайти нужную, ~~следуя~~ NAS следует стратегии поиска, которая максимизирует производительность.

== Принцип работы ==

Методы для NAS классифицируются по трем категориям: пространство поиска (англ. ''Search Space''), стратегия поиска (англ. ''Search Strategy'') и стратегия оценки эффективности (англ. ''Performance Estimation Strategy''). Схематичный принцип работы NAS отображен на рисунке 1.[[Файл:NAS 1rus.~~PNG~~png|900px|thumb|center|Рисунок 1 ~~- Абстрактная~~ — Обобщающая иллюстрация методов NAS. Стратегия поискавыбирает архитектуру <tex>A </tex> из предопределенного пространства поиска <math>A</math>. Архитектурапередается в стратегию оценки производительности, которая возвращает оценку эффективности <tex>A </tex> в стратегию поиска. ]] === Пространство поиска (англ. ''Search Space'') ===Пространство поиска определяет, какую нейронную архитектуру в принципе может обнаружить система NAS. Это может быть цепочечная архитектура (рисунок 2, слева), в которой выход уровня <tex>(n-1)</tex> подается как вход уровня <tex>(n)</tex>. Или это может быть сложная ветвистая архитектура с пропусками соединений<ref>англ. ''Multi-branch neural networks with branch control'', пример: [https://~~arxiv~~ieeexplore.ieee.org/~~pdf~~document/~~1808.05377.pdf Источник~~1323611, multi-branch network]</ref> (рисунок 2, справа)]].

~~=== Пространство поиска~~ В некоторых случаях используют спроектированный вручную каркас архитектуры (~~Search Space~~макроархитектуру) ~~===~~Пространство поиска определяет, какую нейронную архитектуру в принципе может обнаружить подход NAS. Это может быть цепочечная архитектура, ~~в которой выход уровня~~ состоящий из повторяющихся ячеек (~~n-1) подается как вход уровня (n)~~англ. ~~Или это может быть современная сложная архитектура с пропущенным соединением (multi-branch network~~''motifs/blocks/cells''). Предварительные знания о типичных свойствах архитектур способны уменьшить размер пространства поиска и упростить поиск. Тем не менее, они также могут помешать человеку найти новые архитектурные строительные блоки, которые выходят за рамки современных человеческих знаний.~~Наиболее часто используемые типы архитектур для NAS - это entire structures, cell-based structures,progressive structures and morphism-based structures.~~ [[Файл:Chain-like-NAS.png|thumb|center|Рисунок 2 - A chain-like and multi-branch network; каждый узел соответствует уровню в нейронной сети. Различные типы слоев визуализируются разными цветами. Ребро от слоя Li до слоя Lj обозначает, что Lj получает выходные данные Li в качестве входных данных.]]Иногда используют внешнюю архитектуру ручной работы (макроархитектуру) с повторяющимися мотивами или ячейками. В таких случаях ~~внешняя структура~~ каркас является ~~фиксированной~~фиксированным, а задача NAS ~~ищет только cell-~~заключается в поиске архитектурысамих ячеек. ~~Этот~~ Такой тип поиска известен как микро-поиск ~~или~~ (англ. ''cell -search.~~[[Файл:Cell-like-NAS.png|thumb|center|Рисунок 3 - слева: сell architecture, две разные ячейки, например normal cell(вверху~~'') ~~и reduction cell~~ (~~внизу~~рисунок 3)~~; справа: ячейки помещены во внешнюю структуру ручной работы]]~~.

<li style="display: inline-block;"> [[Файл:Chain_like_NAS_rus.png|thumb|400px| Рисунок 2 — цепочечная архитектура (слева) и ветвистая архитектура (справа). Различные типы слоев визуализируются разными цветами. Ребро от слоя <tex>C_i</tex> до слоя <tex>C_j</tex> означает, что <tex>C_j</tex> в качестве входных данных получает выходные данные <tex>C_i</tex>.]] </li>

<li style="display: inline-block;"> [[Файл:Cell_like_NAS_rus.png|thumb|450px| Рисунок 3 — Слева: архитектуры ячеек. Например, обычная (англ. ''normal cell'') вверху и редуцированная (англ. ''reduction cell'') внизу. Cправа: каркас архитектуры состоит из 3 ячеек, конкретные архитектуры ячеек помещены в каркас.]] </li>

</ul></div>

~~=== Стратегия~~ Предварительные знания о типичных свойствах архитектур могут уменьшить размер пространства поиска ~~(Search Strategy)===~~Стратегия поиска подробно описывает, как исследовать пространство поиска, которое часто экспоненциально велико или даже неограниченнои упростить поиск. ~~Она включает в себя классический компромисс между разведкой и эксплуатацией, поскольку, с одной стороны~~Тем не менее, ~~желательно~~ они также могут помешать человеку найти~~быстро работающие архитектуры, с другой стороны~~новые архитектурные ячейки, ~~следует избегать преждевременного схождения~~которые выходят за рамки современных человеческих знаний.

~~Для изучения пространства нейронных~~ Наиболее часто используемые типы архитектур ~~можно использовать множество различных стратегий поиска~~для NAS<ref>Источник: [https://arxiv.org/pdf/1908.00709.pdf, ~~включая~~ "AutoML: A Survey of the State-of-the-Art", стр.2]</ref>:* полные архитектуры (англ.''entire structures'~~случайный поиск~~') * прогрессивные архитектуры (англ. ''~~, '''байесовскую оптимизацию'~~progressive structures'')* архитектуры, основанные на ячейках (англ. ''~~'эволюционные методы'~~cell-based structures'')* архитектуры, ~~'''~~основанные на [~~[обучение с подкреплением]~~https://ru.wiktionary.org/wiki/%D0%BC%D0%BE%D1%80%D1%84%D0%B8%D0%B7%D0%BC морфизме] (~~reinforcement learning)~~англ. ''morphism-based structures' и '~~''методы на основе градиента'''.~~ )

=== ~~BANANAS~~ Стратегия поиска (~~Bayesian optimization with neural architectures for NAS~~англ. ''Search Strategy'') ===Стратегия поиска подробно описывает, как исследовать пространство поиска, которое часто экспоненциально велико или даже неограниченно. Она включает в себя классический компромисс между разведкой и эксплуатацией, поскольку, с одной стороны, желательно найти быстро работающие архитектуры, с другой стороны, следует избегать преждевременного схождения.

Для изучения пространства нейронных архитектур можно использовать множество различных стратегий поиска, включая случайный поиск, байесовскую оптимизацию, эволюционные методы, [[обучение с подкреплением]] и методы на основе градиента.

==== Сравнение методов стратегий поиска ====

Лучшие результаты на сегодняшний день показывает NAS с использованием стратегии байесовской оптимизации<ref>[https://arxiv.org/pdf/1910.11858.pdf, Cоответствующее исследование.]</ref> (рисунок 4).[[Файл:NAS-method-~~comparison~~comparison_rus.~~PNG~~png|~~800px~~700px|thumb|center|Рисунок 4 ~~- слева~~— Слева: результат экспериментов, минимизирующих функцию потерь и количества параметров модели~~; справа~~. Cправа: сравнение основных используемых в NAS алгоритмов. [https://arxiv.org/pdf/1910.11858.pdf, Источник, стр. 8] ]] Байесовская оптимизация (англ. ''Bayes Optimization, BO'') использует алгоритм для построения вероятностной модели целевой функции, а затем использует эту модель, чтобы выбрать наиболее перспективные гиперпараметры и оценивает выбранные гиперпараметры на истинной целевой функции. Таким образом, байесовская оптимизация может итеративно обновлять вероятностную модель, ведя учет оценок прошлых результатов. ==== BANANAS (англ. ''Bayesian optimization with neural architectures for NAS'') ====[[Файл:BANANAS alg_rus.png|400px|thumb|right| Рисунок 5 — Иллюстрация мета-нейронной сети в алгоритме BANANAS. [https://arxiv.org/pdf/1910.11858.pdf, Источник, стр. 2] ]]Сложностью применения байесовской оптимизации в NAS является обязательное наличие функции расстояния между различными архитектурами нейросети. Чтобы обойти этот момент, был разработан [https://github.com/naszilla/bananas BANANAS] — алгоритм, использующий специальную кодировку (англ. ''path encoding'') для кодирования входных архитектур и получающий на выходе вероятностные распределения (рисунок 5). Алгоритм BANANAS:#Выбираются <tex>t_0</tex> случайных архитектур из пространства поиска.#Итерационно проводится обучение ансамбля мета-нейронных сетей на выбранных архитектурах. Каждая сеть ансамбля является сетью прямой связи с полностью связанными слоями, каждому слою дается случайная инициализация весов и случайный порядок обучающего набора. Используемая функция ошибки {{---}} вариация [[%D0%9E%D1%86%D0%B5%D0%BD%D0%BA%D0%B0_%D0%BA%D0%B0%D1%87%D0%B5%D1%81%D1%82%D0%B2%D0%B0_%D0%B2_%D0%B7%D0%B0%D0%B4%D0%B0%D1%87%D0%B0%D1%85_%D0%BA%D0%BB%D0%B0%D1%81%D1%81%D0%B8%D1%84%D0%B8%D0%BA%D0%B0%D1%86%D0%B8%D0%B8_%D0%B8_%D1%80%D0%B5%D0%B3%D1%80%D0%B5%D1%81%D1%81%D0%B8%D0%B8#.D0.A1.D1.80.D0.B5.D0.B4.D0.BD.D1.8F.D1.8F_.D0.B0.D0.B1.D1.81.D0.BE.D0.BB.D1.8E.D1.82.D0.BD.D0.B0.D1.8F_.D0.BF.D1.80.D0.BE.D1.86.D0.B5.D0.BD.D1.82.D0.BD.D0.B0.D1.8F_.D0.BE.D1.88.D0.B8.D0.B1.D0.BA.D0.B0_.28.D0.B0.D0.BD.D0.B3.D0.BB._Mean_Absolute_Percentage_Error.2C_MAPE.29 | MAPE (англ. ''Mean Absolute Percentage Error'')]].##Далее формируется набор архитектур-кандидатов посредством случайных изменений лучших архитектур после обучения.##Для каждой архитектуры-кандидата определяется значение переданной на вход функции сбора [https://en.wikipedia.org/wiki/Thompson_sampling независимой выборки Томпсона] (англ. ''ITS acquisition function'').##Для архитектуры-кандидата с минимальным значением функции сбора определяется значение целевой вероятностной функции. ===Стратегия оценки эффективности (англ. ''Performance Estimation Strategy'')===Целью NAS обычно является поискархитектуры, обеспечивающей высокую точность прогнозов ~~по невидимым данным~~. ~~Performance Estimation относится к процессу~~ Определением этой точности занимается процесс оценки ~~этой производительности~~эффективности. Самый простой вариант - — выполнить стандартное обучение и проверку архитектуры данных, но это, к сожалению, вычислительно дорого и ограничивает количество архитектур, которые можно изучить. Поэтому многие недавние исследования направлены на разработку методов,способных снизить стоимость ~~этих оценок производительности~~оценки эффективности и увеличить скорость. Уже разработанные методы:*Сокращение качества оценки — более высокая скорость достигается сокращением набора данных.*Экстраполяция прямой обучения — функция оценки может быть экстраполирована после всего нескольких обучающих итераций.*Наследование / Сетевые морфизмы — параметры модели не ищутся каждый раз, они наследуются по каким-либо правилам.*Модели ''One-Shot'' / Распределение веса — обучается только одна модель, далее ее веса/параметры используются остальными моделями. == См.также ==* [[Автоматическое машинное обучение]]* [[Настройка гиперпараметров]]* [[Обучение с подкреплением]]* [[Модель алгоритма и её выбор]]* [[Эволюционные алгоритмы]]

== ~~Решения NAS~~ Примечания==~~=== Метод .. ====== Метод Neural Bayes Optimization ===~~Байесовская оптимизация (Bayes Optimization, BO) использует алгоритм для построения вероятностной модели целевой функции, а затем использует эту модель, чтобы выбрать наиболее перспективные гиперпараметры и оценивает выбранные гиперпараметры на истинной целевой функции. Следовательно, BO может итеративно обновлять вероятностную модель, ведя учет оценок прошлых результатов.<references/>

== Источники информации ==

* [https://arxiv.org/pdf/1910.11858.pdf Bayesian Optimization with Neural Architectures for Neural Architecture Search, Colin White, Willie Neiswanger, Yash Savani]

* [https://towardsdatascience.com/neural-architecture-search-nas-the-future-of-deep-learning-c99356351136 Medium Towards Data Science - Neural Architecture Search (NAS) - The Future Of Deep Learning]

*[https://arxiv.org/pdf/1808.05377.pdf Neural Architecture Search: A Survey]) [[Категория: Машинное обучение]][[Категория: Автоматическое машинное обучение]]

Maintenance script

1632

правки

Изменения

Поиск архитектуры нейронной сети

Навигация

Персональные инструменты

Пространства имён

Варианты

Просмотры

Ещё

Поиск

Навигация

Инструменты