238
правок
Изменения
→Mask TextSpotter (2018)
=== Mask TextSpotter (2018) ===
Mask TextSpotter является одной из первых E2E моделей, тренированных на датасете наборе данных TotalText. Она не была призвана распознавать именно изогнутый текст, но отличительной чертой модели Mask TextSpotter являлось как раз то, что она сравнительно неплохо с ним справлялась. Разработчики Mask TextSpotter применили недавно опубликованную нейронную сеть с архитектурой Mask R-CNN<ref name="rcnn"/> для выделения контуров объектов на изображении, которая и позволила сделать шаг вперед в распознавании изогнутого текста.
==== Архитектура ====