Изменения

Перейти к: навигация, поиск

Распознавание изогнутого текста

2 байта добавлено, 21:55, 18 января 2021
м
Нет описания правки
==== Архитектура ====
Итак, MANGO имеет однослойную архитектуру. Но это вовсе не значит, что работу этой модели нельзя разделить на этапы. В действительности MANGO, как и другие модели, не может выполнить сразу оба этапа каким-то одним инструментом. MANGO все еще разделяет свою работу на детекцию и распознавание. Особенность этой модели в том, что данные , спустя этап детекции , имеют такой вид, что рекогнайзер представляет собой легковесный инструмент. В действительности Это достигается тем, что этап детекции в MANGO уже включает в себя элементы распознавания. Разберемся как это происходит.
На вход рекогназеру подается так называемая позиционно-ориентированная маска внимания. Она представляет собой конкатенацию двух других масок: маски областей текста и многослойной маски точек внимания символов. Каждый слой маски символов сопоставлен с соответствующим слоем маски областей текста. Данные, представленные в таком виде (особенно важно сопоставление между двумя масками), сильно облегчает рекогнайзеру работу (выполняя часть этой работы за него), и рекогнайзер превращается в легковесный инструмент и перестает быть отдельным слоем.
94
правки

Навигация