85
правок
Изменения
м
====Устройство====
→Convolutional Block Attention Module
'''Convolutional Block Attention Module''' {{---}} простой, но эффективный модуль внимания для [[:Сверточные_нейронные_сети|сверточных нейросетей]]. Данный модуль внимания состоит из двух последовательно применяемых подмодулей - канального (''Channel Attention Module'', применяется ко всем каналам одного пикселя с изображения) и пространственного (''Spatial Attention Module'', применяется ко всему изображению с фиксированным каналом).
Более формально говоря: на вход подается множество признаков <math>F \in \mathbb{R}^{C \times H \times W}</math>, где <math>C</math> - число каналов, <math>H</math> - высота, а <math>W</math> - длина изображения. Канальный подмодуль <math>A_1(F)</math> принадлежит множеству <math>\mathbb{R}^{C \times 1 \times 1}</math>, а пространственный <math>A_2(F)</math> принадлежит множеству <math>\mathbb{R}^{1 \times H \times W}</math>. Таким образом применение модуля можно описать так:
*<math>F_2 = A_2(F_1) \otimes F_1</math>
Здесь за <math> \otimes </math> обозначено поэлементное произведение, а тензоры <math>A_1(F)</math> и <math>A_2(F_1)</math> копируются вдоль недостающих измерений. <math>F_2 \in \mathbb{R}^{C \times H \times W}</math> является выходным множеством признаков.
=== Channel Attention Module ===