Изменения

Перейти к: навигация, поиск

Распознавание изогнутого текста

87 байт добавлено, 16:01, 19 января 2021
Модели end-to-end
SCUT-CTW1500 должен был привлечь внимание к той же проблеме, что и TotalText. Они были опубликованы практически одновременно (TotalText 27 октября 2017, а SCUT-CTW1500 6 декабря 2017). Вероятно, они разрабатывались независимо друг от друга - авторы SCUT-CTW1500 утверждали, что они являются первооткрывателями полигонального подхода, хотя TotalText был опубликован немного раньше. Позднее авторы TotalText добавили ссылку на SCUT-CTW1500 в качестве дополнения к своему датасету. SCUT-CTW1500 включает в себя 1500 изображений (1000 для обучения, 500 для проверки), на которых содержится более 10 тысяч областей с текстом, и на каждом изображении как минимум один раз встречается изогнутый текст. Здесь, как и в TotalText, groundtruth - фигура, состоящая из нескольких полигонов. Оба этих датасета (а точнее, модели, обученные на них) стали прорывом - они первые начали использовать полигональный groundtruth.
В 2021 году Сейчас TotalText и SCUT-CTW1500 уже не все реже используются как два независимых датасета. Датасет ArT объединил их в себе и стал самым большим датасетом изогнутого текста.
== Модели для детекции ==
*Total-Text: 84.6%
*CTW1500: 83.4%
 
== Модели для распознавания ==
== Модели end-to-end ==
<br clear=all>
 
=== Mask TextSpotter (2018) ===
238
правок

Навигация