Изменения

Перейти к: навигация, поиск

Известные наборы данных

9 байт добавлено, 18:34, 22 января 2021
Нет описания правки
===Поиск и аннотация изображений===
Изображения для набора данных были получены с сайта [https://www.flickr.com/ Flickr ] и отфильтрованы с помощью [https://www.mturk.com/ Amazon Mechanical Turk]. Каждое изображение аннотировано границей области, содержащей птицу, грубой сегментацией птиц, набором меток атрибутов и текстовым описанием. Примеры аннотированных изображений представлены на рисунке 14.
{|align="center"
==Visual Genome==
[[Файл:Visual_Genome_учфьзду.png|мини| 600px|Рисунок 18. Результат визуализации]]
===Описание===
Visual Genome {{---}} это набор данных, связывающий изображения со словесным описанием их содержимого. Является исчерпывающим набором данных для обучения и тестирования моделей компьютерного зрения, обеспечивает обширный анализ содержимого в изображениях изображений с учетом зависимостей между объектами. Это позволяет использовать набор данных для решения большого количества различных задач: от поиска . Например, поиск объектов до поиска , поиск отношений, требующих дальнейшего вывода, и даже задачи, связанные с ответами на вопросы.
Изображение часто представляет сложную картину, которую невозможно полностью раскрыть одним предложением. Существующие наборы данных, такие как Flickr 30K, ориентированы на высокоточное описание всего изображения в целом. Вместо этого для каждого изображения в Visual Genome собираются более 50 описаний для разных регионов изображения, обеспечивая тем самым намного более полный набор описаний.
Анонимный участник

Навигация