Изменения

Векторное представление слов

3 байта убрано, 02:18, 12 января 2021

→‎BERT

[[File:Bert.png|500px|thumb|Архитектура BERT]]

BERT {{---}} это многослойный двунаправленный [[:Автокодировщик|кодировщик]] Transformer. В данной архитектуре используется двунаправленное [[:Механизм внимания|самовнимание]](англ. self-attention).

Модель используется в совокупности с некоторым классификатором, на вход которого подается результат работы BERT {{---}} векторное представление входных данных.

В основе обучения модели лежат две идеи.

Точно так же, как и в обычном трансформере, BERT принимает на вход последовательность слов, которая затем продвигается вверх по стеку энкодеров.

Каждый слой энкодера применяет ~~внутреннее внимание (self-attention)~~ самовнимание и передает результаты в сеть прямого распространения, после чего направляет его следующему энкодеру.

Для каждой позиции на выход подается вектор размерностью <math>hiddenSize</math> (<math>768</math> в базовой модели).

Avpotapov

38

правок

Изменения

Векторное представление слов

Навигация

Персональные инструменты

Пространства имён

Варианты

Просмотры

Ещё

Поиск

Навигация

Инструменты