Изменения

Распознавание изогнутого текста

62 байта добавлено, 23:01, 20 января 2021

→‎TextFuseNet (2020)

==== Архитектура ====

[[file:tfn_arch.png|800px|left|thumb|Рисунок 4 {{---}} Архитектура TextFuseNet]]

Общая архитектура TextFuseNet представлена выше(см. Рисунок 4). Для получения глобального представления используется семантическая сегментация. Далее, с помощью Mask R-CNN<ref name="rcnn"/> в ветвях Detection и Mask определяются признаки на буквенном и словесном уровнях. Для слияния уровней используется модуль multi-path fusion (~~представлено снизу~~см. Рисунок 5), что позволяет TextFuseNet изучать более дифференцированное представление и выдавать более точные результаты детекции текста.

[[file:tfn_mpf.png|500px|left|thumb|Рисунок 5 {{---}} Работа модуля multi-path fusion]]

KingKongWukong

94

правки

Изменения

Распознавание изогнутого текста

Навигация

Персональные инструменты

Пространства имён

Варианты

Просмотры

Ещё

Поиск

Навигация

Инструменты