Изменения

Механизм внимания

109 байт убрано, 00:49, 22 марта 2020

Нет описания правки

'''Механизм внимания в рекуррентных нейронных сетях''' (англ. ''attention mechanism'', ''attention model'') {{---}} дополнительный слой используемый в [[:Рекуррентные_нейронные_сети|рекуррентных нейронных сетях (сокращенно 'RNN')]] для "обращения внимания" последующих слоев сети на скрытое состояние нейронной сети <math>h_t</math> в момент времени <math>t</math>.

Изначально механизм внимания был представлен в ~~статье~~ [https://arxiv.org/abs/1409.0473|~~Neural Machine Translation by Jointly Learning to Align and Translate~~статье описывыющей данную технику] и ~~предполагал~~ ее [[:Механизм_внимания#Пример использования для архитектуры Seq2Seq|применение именно в ''Seq2Seq'' сетях]], и лишь позже был использован ~~применительно к генерацияизображениям результаты кот~~в [https://arxiv.org/abs/1502.03044|~~Show, Attend and Tell: Neural Image Caption Generation with Visual Attention~~статье применительно к генерации описания изображений].

== Обобщенное описание ==

Gpevnev

162

правки

Изменения

Механизм внимания

Навигация

Персональные инструменты

Пространства имён

Варианты

Просмотры

Ещё

Поиск

Навигация

Инструменты