Изменения

Перейти к: навигация, поиск

Распознавание изогнутого текста

113 байт добавлено, 18:13, 15 января 2021
Нет описания правки
В решении задачи распознавания текста двумя основными составляющими являются определение области текста и распознавание содержимого области. В сообществе исследователей выделяют три разных вида ориентации текста - horizontal, multi-oriented, curved (усл. горизонтальная, множественная, изогнутая). Очевидно, что правильность определения области текста напрямую влияет на качество работы распознающих моделей. Долгое время распознавание изогнутого текста казалось крайне сложной задачей - до тех пор, пока не появились способы весьма точно определять контуры объектов на изображениях ([см./например] Mask R-CNN). Использование методов сегментации изображения позволяет добиться хороших результатов на существующих датасетах.
== Модели, способные распознавать изогнутый текст и датасеты ==Все представленные ниже модели показывают Датасеты, способствовавшие исследованиям в области распознавания изогнутого текста:*TotalText*SCUT-CTW1500 Модели, показывающие хорошие результаты, независимо от ориентации текста:
*TextFuseNet
*CharNet H-88
*PSENet
*SLPR
 
== TotalText (2017) ==
238
правок

Навигация