238
правок
Изменения
→Вступление
== Вступление ==
В решении задачи распознавания текста двумя основными составляющими являются определение области текста и распознавание содержимого области. В сообществе исследователей выделяют три разных вида ориентации текста: horizontal, multi-oriented, curved (усл. горизонтальная, множественная, изогнутая). Очевидно, что правильность определения области текста напрямую влияет на качество работы распознающих моделей. Долгое время распознавание изогнутого текста казалось крайне сложной задачей {{---}} до тех пор, пока не появились способы весьма точно определять контуры объектов на изображениях ([см./например] , Mask R-CNN). Использование методов сегментации изображения позволяет добиться хороших результатов на существующих датасетах.
== Существующие модели и датасеты ==