Изменения

Перейти к: навигация, поиск

Известные наборы данных

2198 байт добавлено, 23:47, 12 января 2021
ICDAR
| Английский
| обнаружение текста, сегментация текста, распознавание символов, '''сквозное распознавание'''
|}
 
===ICDAR 2019===
 
{| class="wikitable"
|-
! Наименование датасета
! Тип текста
! Количество объектов
! Количество обучающих объектов
! Количество тестовых объектов
! Количество слов
! Количество обучающих слов
! Количество тестовых слов
! Язык текста на изображениях
! Задачи
|-
| ICDAR 2019 "COCO-Text"
| набор данных, основанный на датасете "MS COCO"<ref>https://vision.cornell.edu/se3/wp-content/uploads/2019/01/ICDAR2017b.pdf</ref>, где собраны обычные изображения ежедневных сцен, на которых, возможно, есть текст
| 63686
| 43686
| 10000 {---} валидирующая выборка, 10000 {---} тестовая
| 173589
| не описано
| не описано
| Французский
| '''сквозное распознавание'''
|-
| ICDAR 2019 "Multi-lingual Scene Text"<ref>https://arxiv.org/pdf/1907.00945.pdf</ref>
| изображения с текстом на 10 различных языках
| 20 000 (2 000 для каждого языка) + 277 000 сгенерированных изображения
| 10 000
| 10 000
| не описано
| не описано
| не описано
| Английский, Арабский, Бенгальский, Деванагари, Китайский, Французский, Немецкий, Японский, Корейский
| обнаружение текста, идентификация скрипта, сквозное распознавание
|-
| ICDAR 2019 "Scene Text Visual Question Answering"
| набор данных, включающий
23 038 изображений с 31 791 парой вопросов и ответов.
где ответ всегда основан на присутствующих текстовых экземплярах
на изображении.
| -
| -
| -
| -
| -
| -
| Английский
| ответ на вопрос, связанный с изображением
|}
61
правка

Навигация