Изменения

Известные наборы данных

14 байт убрано, 03:16, 12 января 2021

→‎Описание

Visual Genome {{---}} это набор данных, связывающий изображения с словестным описанием их содержимого. Является исчерпывающим набором данных для обучения и тестирования моделей компьютерного зрения, обеспечивает обширный анализ содержимого в изображениях с учетом зависимостей между объектами. Это позволяет многосторонне изучать изображение: от информации на уровне пикселей, такой как объекты, до отношений, требующих дальнейшего вывода, и даже более глубокие задачи, такие как ответы на вопросы.

~~Набор данных содержит более 108К изображений, каждое из которых имеет в среднем 35 объектов~~Изображение часто представляет сложную картину, ~~26 атрибутов и 21 парное отношение между объектами~~которую невозможно полностью раскрыть одним предложением. ~~В данном наборе~~ Существующие наборы данных ~~происходит канонизация объектов~~, ~~атрибутов~~такие как Flickr 30K, ~~отношений и словосочетаний~~ ориентированы на высокоточное описание всего изображения в ~~описаниях регионов и пар вопрос-ответ~~ целом. Вместо этого для каждого изображения в ~~синсеты из [https://ru.wikipedia.org/wiki/WordNet WordNet]. Cинсет {{---}} это набор даных~~Visual Genome, ~~элементы в котором считаются семантически эквивалентными~~ собираются более 50 описаний для ~~поиска или восстановления информации. Вместе эти аннотации представляют самый плотный и самый большой~~ разных регионов изображения, обеспечивая тем самым намного более полный набор ~~данных с описаниями изображений, объекты, атрибуты, отношения и пары вопрос-ответ~~описаний сценариев.

~~Изображение часто представляет сложную картину~~Набор данных содержит более 108К изображений, каждое из которых имеет в среднем 35 объектов, ~~которую невозможно полностью раскрыть одним предложением~~26 атрибутов и 21 парное отношение между объектами. ~~Существующие наборы~~ В данном наборе данныхпроисходит канонизация объектов, ~~такие как Flickr 30K~~атрибутов, ~~ориентированы на высокоточное описание изображения~~отношений и словосочетаний в описаниях регионов и пар вопрос-ответ в синсеты из [https://ru. ~~Вместо этого~~ wikipedia.org/wiki/WordNet WordNet]. Cинсет {{---}} это набор даных, элементы в котором считаются семантически эквивалентными для ~~каждого изображения в~~ поиска или восстановления информации. Visual Genomeявляется самым большим набором данных с описаниями изображений, объектов, ~~собираются более 50 описаний для разных регионов изображения~~атрибутов, ~~обеспечивая намного более полный набор описаний сценариев~~отношений и пар вопрос-ответ.

===Код===

Анонимный участник

178.66.20.131

Изменения

Известные наборы данных

Навигация

Персональные инструменты

Пространства имён

Варианты

Просмотры

Ещё

Поиск

Навигация

Инструменты