89
правок
Изменения
→Conformer encoder
==Обучение с частичным привлечением учителя для автоматического распознавания речи==
===Conformer encoderКонформер===[[Файл:Conformer.png|600px|thumb|right|'''a.''' Схема архитектуры Конформер: кодировщик сначала обрабатывает входные данные с помощью CNN(состоящей из слоя пулинга, полносвязного слоя и дропаута), а затем с помощью последовательности блоков конформера.<br> '''b.''' Блок конформера состоит из двух модулей прямой связи (англ. ''feed forward'') между которыми расположены модуль многоголового самовнимания (англ. ''Multi-Head Self Attention'') и модуль свертки.]]Архитектура трансформер, основанная на [[Механизм внимания#Self-Attention|самовнимании]] позволяет фиксировать взаимодействия на большом расстоянии, однако не очень хорошо извлекает точные паттерны локальных признаков. [[Сверточные нейронные сети]], наоборот, эффективно используют локальные признаки, но требуют большого числа слоев для захвата глобального контекста. Архитектура Конформер берет лучшее от двух подходов, комбинируя свертки и механизм самовнимания.
===wav2vec===