94
правки
Изменения
→TextFuseNet (2020)
==== Архитектура ====
[[file:tfn_arch.png|800px|left|thumb|Рисунок 4 {{---}} Архитектура TextFuseNet]]
<br clear=all>
Общая архитектура TextFuseNet представлена выше(см. Рисунок 4). Для получения глобального представления используется семантическая сегментация. Далее, с помощью Mask R-CNN<ref name="rcnn"/> в ветвях Detection и Mask определяются признаки на буквенном и словесном уровнях. Для слияния уровней используется модуль multi-path fusion (представлено снизусм. Рисунок 5), что позволяет TextFuseNet изучать более дифференцированное представление и выдавать более точные результаты детекции текста.
<br clear=all>
[[file:tfn_mpf.png|500px|left|thumb|Рисунок 5 {{---}} Работа модуля multi-path fusion]]
<br clear=all>