Изменения

Перейти к: навигация, поиск

Распознавание изогнутого текста

78 байт добавлено, 15:28, 21 января 2021
TextPerceptron (2020)
<br>Статья о модели доступна по [https://arxiv.org/pdf/2002.06820.pdf ссылке].
<br clear=all>
[[Файл:Tperc sch.png|500px|thumb|left|Рисунок 20 {{---}} [https://arxiv.org/pdf/2002.06820.pdf Схема работы TextPerceptron]]]
<br clear=all>
Детектор текста использует ResNet<ref name="resnet"/> и FPN<ref name="fpn"/> как основу, и реализуется путем одновременного изучения трех задач: многоклассовой семантической сегментации с учетом порядка, регрессии угла и регрессии смещения границ. STM отвечает за объединение детекции и распознания. Для этого STM генерирует доверительные точки и настраивает их позиции, на основе чего "выпрямляет" текст с помощью TPS (Thin-plate splines) для дальнейшего распознавания. В модуле распознавания может использоваться любой sequence-based метод. Примерная визуализация архитектуры представлена ниже (см. Рисунок 21).
<br clear=all>
[[file:Tperc arch.png|800px|left|thumb|Рисунок 21 {{---}} [https://arxiv.org/pdf/2002.06820.pdf Архитектура TextPerceptron]]]
<br clear=all>
238
правок

Навигация