Изменения

Перейти к: навигация, поиск

Участница:DespairedController/Черновик:Распознавание речи

723 байта добавлено, 17:16, 2 января 2021
Кодировщик Конформер
==Обучение с частичным привлечением учителя для автоматического распознавания речи==
===Кодировщик Конформер===
[[Файл:Conformer.png|400px|thumb|right|'''a.''' Схема архитектуры Конформер.<br> '''b.''' Блок конформера.]]
Архитектура трансформер, основанная на [[Механизм внимания#Self-Attention|самовнимании]] позволяет фиксировать взаимодействия на большом расстоянии, однако не очень хорошо извлекает точные паттерны локальных признаков. [[Сверточные нейронные сети]], наоборот, эффективно используют локальные признаки, но требуют большого числа слоев для захвата глобального контекста. Архитектура Конформер (англ. ''Conformer'') берет лучшее от двух подходов, комбинируя свертки и механизм самовнимания, достигая $WER$ $2.1\%/4.3\%$ на LibriSpeech.
Кодировщик сначала обрабатывает входные данные с помощью CNN(сверточной нейронной сети, состоящей из слоя [[Сверточные нейронные сети#Пулинговый слой|пулинга]], [[Нейронные сети, перцептрон|полносвязного слоя]] и [[Сверточные нейронные сети#Пулинговый слой|дропаута]]), а затем с помощью последовательности блоков конформера.
Блок Конформера состоит из двух модулей прямой связи (англ. ''feed forward''), между которыми расположены модуль многоголового самовнимания (англ. ''Multi-Head Self Attention'') и модуль свертки, с последующим слоем нормализации.
<br>
<br>
[[Файл:Multi_Head_Self_Attention_module.png|400px300px|thumb|right|Модуль многоголового самовнимания]]
'''Модуль многоголового самовнимания'''<br>
В модуле используется блок многоголового внимания с относительным позиционным кодированием (англ. ''Multi-Head Attention with Relational Positional Encoding''). Использование относительного позиционного кодирования[https://arxiv.org/pdf/1901.02860.pdf] позволяет модулю самовнимания лучше обобщать при различной длине ввода, а результирующий кодировщик более устойчив к неоднородности длины высказывания.
===wav2vec===
89
правок

Навигация