24
правки
Изменения
→wav2vec
'''Модель'''
# ''Энкодер признаков'' (англ. feature encoderFeature Encoder) $f: X \to Z$ реализован на основе [[Сверточные нейронные сети#Сверточный слой|сверточного слоя]]. Преобразует мел спектрограммы $X$, разбитые на $T$ временных интервалов, в наборы признаков $\{z_1, \dots, z_T\}$, которые описывают исходные данные в каждом из $T$ интервалов. <br># ''Контекстная сеть'' (англ. context networkContext Network) $g: Z \to C$ реализована на основе линейного слоя и слоя, состоящего из $N$ Конформеров. Преобразует наборы признаков $\{z_1, \dots, z_T\}$, полученные в результате работы энкодера признаков, в контекстные вектора $\{c_1, \dots, c_T\}$. <br># ''Модуль линейного слоя'' (англ. linear layer moduleLinear Layer Module) $u: Z \to T$ реализован на основе линейного слоя. Преобразует наборы признаков $\{z_1, \dots, z_T\}$, полученные в результате работы энкодера признаков, в целевые вектора $\{t_1, \dots, t_T\}$. <br>
{|align="center"