Изменения

Перейти к: навигация, поиск

Распознавание изогнутого текста

131 байт добавлено, 15:10, 21 января 2021
Архитектура
[[Файл:Esir arch.png|800px|thumb|left|Рисунок 10 {{---}} Iterative Rectification Network]]
<br clear=all>
*Recognition Network (сеть распознавания). Используется sequence-to-sequence модель с механизмом внимания. Система состоит из кодера и декодера. В кодировщик поступает выпрямленное изображение текста размером 32x100 пикселей. Используется 53-слойная остаточная сеть для извлечения признаков, за остаточной сетью следует два слоя двунаправленной [[:Долгая_краткосрочная_память|LSTM]]. Декодер использует LuongAttention механизм<ref name="luong">[https://arxiv.org/pdf/1508.04025.pdf Minh-Thang Luong, Hieu Pham, and Christopher D. Manning, состоящий из 2"Effective approaches to attention-слойных LSTM вниманияbased neural machine translation" (2015)]</ref> механизм. На этапе вывода используется beam search.
==== Точность ====
238
правок

Навигация