Изменения

Перейти к: навигация, поиск

Рекуррентные нейронные сети

1205 байт добавлено, 03:54, 21 января 2021
Нет описания правки
=== Двунаправленные рекуррентные сети ===
[[File:biRNN.png|450px|thumb|[https://miro.medium.com/max/955/1*6QnPUSv_t9BY9Fv8_aLb-Q.png Двунаправленная рекуррентная сеть]]]
Двунаправленная рекуррентная сеть (англ. Bidirectional Recurrent Neural Network, biRNN) представляет собой две однонаправленные рекуррентные сети, одна из которых обрабатывает входную последовательность в прямом порядке, а другая {{---}} в обратном. Таким образом, для каждого элемента входной последовательности считается два вектора скрытых состояний, на основе которых вычисляется выход сети. Данная архитектура позволяет сети иметь контекст и из прошлого, и из будущего, что решает проблему однонаправленных рекуррентных сетей. Для обучения biRNN используются те же алгоритмы, что и для RNN.
 
=== Seq-2-seq сети ===
[[File:Seq2seq.png|450px|thumb|[https://www.machinelearningmastery.ru/img/0-927694-803579.png Seq-2-seq сеть] {{Clear}}]]
Seq-2-seq (Sequence to sequence, Seq2seq) сеть используется для трансляции одной последовательности в другую. Она состоит из двух рекуррентных сетей: кодировщика и декодировщика. Кодировщик вычисляет вектор, кодирующий входную последовательность. Далее данный вектор передается декодировщику, который в свою очередь по полученному скрытому представлению восстанавливает целевую последовательность. При этом каждый посчитанный выход используется для обновления скрытого представления.
<br clear="both" />.
== Пример кода ==
14
правок

Навигация