89
правок
Изменения
→Конформер
===Конформер===
[[Файл:Conformer.png|400px|thumb|right|'''a.''' Схема архитектуры Конформер.<br> '''b.''' Блок конформера.]]
Архитектура трансформер, основанная на [[Механизм внимания#Self-Attention|самовнимании]] позволяет фиксировать взаимодействия на большом расстоянии, однако не очень хорошо извлекает точные паттерны локальных признаков. [[Сверточные нейронные сети]], наоборот, эффективно используют локальные признаки, но требуют большого числа слоев для захвата глобального контекста. Архитектура Конформер (англ. ''Conformer'') берет лучшее от двух подходов, комбинируя свертки и механизм самовнимания, достигая $WER$ $21.19\%/43.39\%$ на LibriSpeech.
Кодировщик сначала обрабатывает входные данные с помощью сверточной нейронной сети, состоящей из слоя [[Сверточные нейронные сети#Пулинговый слой|пулинга]], [[Нейронные сети, перцептрон|полносвязного слоя]] и [[Сверточные нейронные сети#Пулинговый слой|дропаута]]), а затем с помощью последовательности блоков конформера.