Изменения

Перейти к: навигация, поиск

Генерация изображения по тексту

455 байт добавлено, 13:49, 12 января 2021
Add inception scores for 5th model (Inferring Semantic Layout)
Возможности предложенной модели были продемонстрированы на сложном наборе данных MS-COCO dataset<ref name="MSCOCO"/>. Оказывается, модель может существенно улучшить качество изображения, интерпретируемость вывода и семантическое выравнивание вводимого текста по сравнению с существующими подходами.
 
{| class="wikitable"
|+ '''Inception scores для сгенерированных изображений в тестовом наборе MS-COCO<ref name="MSCOCO" />'''
|-
! Модель !! Inception Score
|-
| style = "text-align: right" | StackGAN || style = "text-align: center" | <tex>8.45 \pm 0.03</tex>
|-
| style = "text-align: right" | Рассматриваемая модель || style = "text-align: center" | <tex>11.46 \pm 0.09</tex>
|}
Создание изображения из общего предложения «люди, едущие на слонах, идущих по реке» требует множества рассуждений о различных визуальных концепциях, таких как категория объекта (люди и слоны), пространственные конфигурации объектов (верховая езда), контекст сцены (прогулка по реке) и т. д., что намного сложнее, чем создание одного большого объекта, как в более простых наборах данных. Существующие подходы не привели к успеху в создании разумных изображений для таких сложных текстовых описаний из-за сложности обучения прямому преобразованию текста в пиксель из обычных изображений.
135
правок

Навигация