Изменения

Участница:DespairedController/Черновик:Распознавание речи

69 байт убрано, 23:06, 20 января 2021

м

→‎Конформер

===Конформер===

[[Файл:Conformer.png|600px|thumb|right|'''Рисунок 1.''' Схема архитектуры Конформер (a) и схема блоков конформера (b)]]

~~Архитектура~~ Трансформер, ~~основанная~~ основанный на [[Механизм внимания#Self-Attention|самовнимании]] позволяет фиксировать глобальные зависимости, однако не очень хорошо извлекает точные паттерны локальных признаков. [[Сверточные нейронные сети]], наоборот, эффективно используют локальные признаки, но требуют большого числа слоев для захвата глобального контекста. ~~Архитектура~~ Конформер (англ. ''Conformer'') берет лучшее от двух подходов, комбинируя свертки и механизм самовнимания, достигая $WER$ $1.9\%/3.9\%$ на LibriSpeech test/test-other.

Энкодер сначала обрабатывает входные данные с помощью сверточной нейронной сети, состоящей из слоя [[Сверточные нейронные сети#Пулинговый слой|пулинга]], [[Нейронные сети, перцептрон|полносвязного слоя]] и [[Практики реализации нейронных сетей#Дропаут|дропаута]], а затем с помощью последовательности блоков Конформера.

'''Модули прямой связи'''

[[Файл:FFN.png|600px|thumb|right|'''Рисунок 4.''' Схема модуля прямой связи]]

В отличие от ~~архитектуры~~ Трансформера, в ~~которой~~ котором единственный модуль прямой связи следует за модулем внимания и состоит из двух линейных преобразований и нелинейной активации между ними, в Конформере два модуля прямой связи, состоящие из слоя нормализации и двух линейных слоев. Кроме того для регуляризации используется функция активации ''swish'' и [[Практики реализации нейронных сетей#Дропаут|дропаут]].

===wav2vec===

DespairedController

89

правок

Изменения

Участница:DespairedController/Черновик:Распознавание речи

Навигация

Персональные инструменты

Пространства имён

Варианты

Просмотры

Ещё

Поиск

Навигация

Инструменты