Изменения

Перейти к: навигация, поиск

Распознавание изогнутого текста

132 байта добавлено, 19:11, 20 января 2021
SCUT-CTW1500 (2017)
SCUT-CTW1500 должен был привлечь внимание к той же проблеме, что и TotalText. Они были опубликованы практически одновременно (TotalText 27 октября 2017, а SCUT-CTW1500 6 декабря 2017). Вероятно, они разрабатывались независимо друг от друга {{---}} авторы SCUT-CTW1500 утверждали, что они являются первооткрывателями полигонального подхода, хотя TotalText был опубликован немного раньше. Позднее авторы TotalText добавили ссылку на SCUT-CTW1500 в качестве дополнения к своему датасету. SCUT-CTW1500 включает в себя 1500 изображений (1000 для обучения, 500 для проверки), на которых содержится более 10 тысяч областей с текстом, и на каждом изображении как минимум один раз встречается изогнутый текст. Здесь, как и в TotalText, groundtruth {{---}} фигура, состоящая из нескольких полигонов. Оба этих датасета (а точнее, модели, обученные на них) стали прорывом {{---}} они первые начали использовать полигональный groundtruth.
Сейчас TotalText и SCUT-CTW1500 все реже используются как два независимых датасета. Датасет ArT <ref name="art">[https://arxiv.org/pdf/1909.07145.pdf "ICDAR2019 Robust Reading Challenge on Arbitrary-Shaped Text - RRC-ArT"]</ref> объединил их в себе и стал самым большим датасетом изогнутого текста.
== Модели для детекции ==
238
правок

Навигация