Изменения

Перейти к: навигация, поиск

Распознавание изогнутого текста

1622 байта добавлено, 18:43, 17 января 2021
Модели для детекции
== Модели для детекции ==
=== TextSnake (20202018) ===
==== Краткое описание и особенности ====
TextSnake использует сверточную нейронную сеть, подробная архитектура которой представлена на изображении:
[[file:TextSnakeArchitecture.png|800px500px]]
==== Точность ====
*TotalText: 78.4
*CTW1500: 75.6
 
=== TextFuseNet (2020) ===
 
==== Краткое описание и особенности ====
Основной особенностью TextFuseNet является выделение большего количества признаков и их слияние для более точного определения текстовых областей. TextFuseNet опирается на Mask R-CNN и Mask TextSpotter и рассматривает детекцию текста как задачу сегментации. Но отличительной особенностью данной модели является выделение признаков на трёх уровнях: буквенном, словесном и глобальном.
 
==== Архитектура ====
[[file:tfn_arch.png|800px]]
 
Общая архитектура TextFuseNet представлена выше. Для получения глобального представления используется семантическая сегментация. Далее, с помощью Mask R-CNN в ветвях Detection и Mask определяются признаки на буквенном и словесном уровнях. Для слияния уровней используется модуль multi-path fusion (представлено снизу), что позволяет TextFuseNet изучать более дифференцированное представление и выдавать более точные результаты детекции текста.
 
[[file:tfn_mpf.png|500px]]
238
правок

Навигация