Изменения

Перейти к: навигация, поиск

Известные наборы данных

102 байта добавлено, 02:02, 12 января 2021
Нет описания правки
===ICDAR 2013===
ICDAR 2013 {{| class="wikitable"|-! Наименование датасета! Тип текста! Количество объектов! Количество слов! Язык текста на изображениях! Размер изображений! Задачи|--}} набор данных включает | ICDAR 2013 "Born Digital Images"| изображения, извлеченные с веб-страниц и сообщений электронной почты. В датасете содержится репрезентативная выборка веб-страниц различных категорий (новости| 561, личныеиз них обучающий набор из 420 изображений и тестовый набор из 141 изображений| 5003, коммерческиеиз них обучающий набор из 3564 слов и тестовый набор из 1439 слов| Английский| 100х100px| обнаружение текста, социальныесегментация текста, правительственные и т.д.)распознавание символов|-| ICDAR 2013 "Focused Scene Text" | изображения с текстом на вывесках, а также электронные письма разного типа (спам, информационные бюллетени логотипах и т.д.) на трех языках {{---}} Английский| 462, Испанский, Французский, в пропорциях, которые отражают их использование в реальном мире. Размер набора данных составляет 561 изображение с минимальным размером 100x100 пикселей. Коллекция была разделена на из них обучающий набор из 420 229 изображений и тестовый набор из 141 изображения. Для задачи распознавания слов учитывались только слова длиной от 3 символов. Набор данных содержит 5003 таких слова233 изображений| 1943, из которых 3564 составляют них обучающий набориз 848 слов и тестовый набор из 1095 слов| Английский| 100х100px| обнаружение текста, сегментация текста, а 1439 {{---}распознавание символов|} тестовый. 
{|align="center"
|-valign="top"
|[[Файл:ICDAR2013Sample.png |600px|thumb|Сэмпл из датасета ICDAR2013"Born Digital Images"]]
|}
 
{|align="center"
|-valign="top"
|[[Файл:ICDAR203Scene.png |600px|thumb|Сэмпл из датасета ICDAR2013 "Focused Scene Text"]]
|}
 
==См.также==
61
правка

Навигация