Изменения

Перейти к: навигация, поиск

Известные наборы данных

4790 байт добавлено, 04:46, 16 января 2021
м
Структура датасета и примеры изображений
| 173589 слов
| не описано
|-
| Pointing'04
| Изображения лиц людей с разными углами поворота и наклона
| 15 сетов по 186 изображений в каждом
| 93
| 7.9% <ref>https://www.researchgate.net/publication/221125207_Generalized_subspace_based_high_dimensional_density_estimation</ref>
|-
| FASSEG
| Изображения лиц людей под с разными угламиповорота, как в оригинале, так и в сегментированном виде
| Часть frontal01: 70, часть frontal02: 70, часть multipose01: 200
| frontal01 и frontal02 {{---}} разделяют изображение на 6 различных сегментов, multipose01 {{---}} 13 углов поворота
| 7.73%<ref>https://github.com/massimomauro/FASSEG-repository/blob/master/papers/multiclass_face_segmentation_ICIP2015.pdf</ref> для сегментации, 22.6%<ref>https://github.com/massimomauro/FASSEG-repository/blob/master/papers/pose_estimation_by_segmentation_ICME2017.pdf</ref> для определения поз|-| MPI| Изображения повседневной деятельности людей в различных позах| 25 тысяч| 410| ~10% <ref>http://human-pose.mpi-inf.mpg.de/#results</ref>
|}
| -
| Английский
| обнаружение текста, сегментация текста, распознавание символов, '''сквозное распознавание'''
|}
|}
 
==Pointing'04==
 
===Описание===
 
Pointing'04 <ref>http://crowley-coutaz.fr/FGnet/reports/Pointing04-Proceedings.pdf</ref> {{---}} база данных изображений лиц в разных позах 15-ти человек. Для каждого человека представлено 93 позы, при этом каждая фотография предложена в двух вариантах освещения и масштаба (две разные сессии). Снимки, сделанные во время первого сеанса, используются в качестве обучающих данных, а изображения из второго сеанса используются в качестве данных тестирования. 93 позы включают комбинации 13-и поз поворота и 7-и поз наклона вместе с двумя крайними случаями наклона при отсутствии поворота.
 
===Пример сета изображений===
 
{|align="center"
|-valign="top"
|[[Файл:Pointing.png|600px|thumb|Пример сета изображений Pointing'04[https://www.researchgate.net/publication/221545772_Evaluation_of_Head_Pose_Estimation_for_Studio_Data Источник]]]
|}
==FASSEG==
===Описание===
Репозиторий FASSEG<ref>http://massimomauro.github.io/FASSEG-repository/</ref> (англ. FAce Semantic SEGmentation ) состоит из двух наборов данных (Frontal01 и Frontal02) для сегментации лиц в фронтальном положении и одного набора данных (Multipose01) с лицами в нескольких позах.
Frontal01 содержит 70 сегментированных изображений лиц и исходные изображения RGB. Исходные лица в основном взяты из наборов данных MIT-CBCL<ref>[http://cbcl.mit.edu/software-datasets/FaceData2.html</ref> MIT-CBCL] и FEI<ref>[http://www.fei.edu.br/~cet/facedatabase.html</ref>FEI].
Frontal02 {{---}} это «высокоточный» Frontal01. Он содержит те же изображения, что и Frontal01, но с гораздо более точной сегментацией.
Multipose01 содержит более 200 размеченных лиц в 13 -ти позах (от -90 градусов до 90 градусов). Исходные лица взяты из базы данных Pointing04<ref>[http://crowley-coutaz.fr/FGnet/reports/Pointing04-Proceedings.pdf</ref>Pointing'04].
===Сегментация===
*Рот
*Волосы (вместе с бровями)
*Фонизображения
*Кожа
 
===Примеры изображений===
{|align="center"
|-valign="top"
|[[Файл:FASSEG1.png|300px|thumb|Пример изображений из датасетов Frontal01 и Frontal02 [https://raw.githubusercontent.com/massimomauro/FASSEG-dataset/master/other/V1V2_diff.png ИсточникОригинал]]]
|[[Файл:FASSEG2.png|400px|thumb|Пример изображений из датасета Multipose01 [https://github.com/massimomauro/FASSEG-repository/blob/master/papers/pose_estimation_by_segmentation_ICME2017.pdf Источник]]]
|}
 
 
==MPI==
 
===Описание===
 
MPI Human Pose <ref>http://human-pose.mpi-inf.mpg.de/</ref> (англ. Max Planck Institute) {{---}} это набор данных, позволяющий определять различные виды активности человека по позам на изображениях и аннотациям к ним. Набор данных включает около 25 тысяч изображений, содержащих более 40 тысяч людей с указанным положением отдельных частей тела. Изображения систематически собирались с использованием установленной таксономии повседневной деятельности человека. В целом набор данных охватывает 410 видов деятельности человека, каждое изображение снабжено меткой активности. Каждое изображение было извлечено из видео с YouTube и снабжено предшествующими и последующими кадрами без аннотации. Кроме того, для тестового набора приложены более детальные аннотации, включая сгибы частей тела и ориентации туловища и головы.
 
===Структура датасета и примеры изображений===
 
{|align="right"
|-valign="top"
|[[Файл: MPI1.jpg|500px|thumb|Пример изображений из подкласса датасета MPI [http://human-pose.mpi-inf.mpg.de/#dataset Источник]]]
|}
 
Датасет представлен двадцатью различными классами активности: езда на велосипеде, упражнения, танцы, рыбалка и охота, домашняя активность, ремонт, отдых, активность на природе, игра на музыкальных инструментах, религиозная деятельность, бег, самоуход, спорт, передвижение на транспорте, волонтерство, прогулки, активность на воде, зимние виды активности, разное.
 
Каждый класс также разделен на уникальные подклассы.
 
Датасет снабжен документацией с описанием структуры объектов и методами взаимодействия с ними, всю необходимую информацию по датасету, как и сами исходники, можно получить по [http://human-pose.mpi-inf.mpg.de/ ссылке].
==См.также==
27
правок

Навигация