Изменения

Генерация изображения по тексту

455 байт добавлено, 13:49, 12 января 2021

Add inception scores for 5th model (Inferring Semantic Layout)

Возможности предложенной модели были продемонстрированы на сложном наборе данных MS-COCO dataset<ref name="MSCOCO"/>. Оказывается, модель может существенно улучшить качество изображения, интерпретируемость вывода и семантическое выравнивание вводимого текста по сравнению с существующими подходами.

{| class="wikitable"

|+ '''Inception scores для сгенерированных изображений в тестовом наборе MS-COCO<ref name="MSCOCO" />'''

|-

! Модель !! Inception Score

|-

| style = "text-align: right" | StackGAN || style = "text-align: center" | <tex>8.45 \pm 0.03</tex>

|-

| style = "text-align: right" | Рассматриваемая модель || style = "text-align: center" | <tex>11.46 \pm 0.09</tex>

|}

Создание изображения из общего предложения «люди, едущие на слонах, идущих по реке» требует множества рассуждений о различных визуальных концепциях, таких как категория объекта (люди и слоны), пространственные конфигурации объектов (верховая езда), контекст сцены (прогулка по реке) и т. д., что намного сложнее, чем создание одного большого объекта, как в более простых наборах данных. Существующие подходы не привели к успеху в создании разумных изображений для таких сложных текстовых описаний из-за сложности обучения прямому преобразованию текста в пиксель из обычных изображений.

Hakimov

135

правок

Изменения

Генерация изображения по тексту

Навигация

Персональные инструменты

Пространства имён

Варианты

Просмотры

Ещё

Поиск

Навигация

Инструменты