Изменения

Перейти к: навигация, поиск

Распознавание изогнутого текста

21 байт добавлено, 19:28, 20 января 2021
Архитектура
На вход рекогнайзеру подается так называемая позиционно-ориентированная маска внимания. Она представляет собой конкатенацию двух других масок: маски областей текста и многослойной маски точек внимания символов. Каждый слой маски символов сопоставлен с соответствующим слоем маски областей текста. Данные, представленные в таком виде (особенно важно сопоставление между двумя масками), сильно облегчают рекогнайзеру работу (выполняя часть этой работы за него). Тем самым рекогнайзер превращается в легковесный инструмент и перестает быть отдельным слоем.
Первоначальная обработка изображения происходит с помощью ResNet50 <ref name="resnet"/> остаточной [[:Сверточные_нейронные_сети|свёрточной нейронной сети]].
<br clear=all>
[[file:WorkflowOfMANGO.png|800px|left|thumb|Архитектура MANGO]]
<br clear=all>
 
==== Точность ====
[[:Оценка_качества_в_задачах_классификации|F-мера]]:
238
правок

Навигация