Изменения

Перейти к: навигация, поиск

Известные наборы данных

13 байт убрано, 04:02, 12 января 2021
Описание
[[Файл:Visual_Genome_учфьзду.png|мини| 600px|Результат визуализации]]
===Описание===
Visual Genome {{---}} это набор данных, связывающий изображения с словестным описанием их содержимого. Является исчерпывающим набором данных для обучения и тестирования моделей компьютерного зрения, обеспечивает обширный анализ содержимого в изображениях с учетом зависимостей между объектами. Это позволяет многосторонне изучать изображениеиспользовать набор данных для решения большого количества различных задач: от информации на уровне пикселей, такой как объектыпоиска объектов, до поиска отношений, требующих дальнейшего вывода, и даже более глубокие задачи, такие как ответы связанные с ответами на вопросы.
Изображение часто представляет сложную картину, которую невозможно полностью раскрыть одним предложением. Существующие наборы данных, такие как Flickr 30K, ориентированы на высокоточное описание всего изображения в целом. Вместо этого для каждого изображения в Visual Genome, собираются более 50 описаний для разных регионов изображения, обеспечивая тем самым намного более полный набор описаний сценариев.
Набор данных содержит более 108К изображений, каждое из которых имеет в среднем 35 объектов, 26 атрибутов и 21 парное отношение между объектами. В данном наборе данных происходит канонизация объектов, атрибутов, отношений и словосочетаний в описаниях регионов и пар вопрос-ответ в синсеты из [https://ru.wikipedia.org/wiki/WordNet WordNet]. Cинсет {{---}} это набор даных, элементы в котором считаются семантически эквивалентными для поиска или восстановления информации. Visual Genome является самым большим набором данных с описаниями изображений, объектов, атрибутов, отношений и пар вопрос-ответ.
Анонимный участник

Навигация