Изменения

Генерация изображения по тексту

2438 байт убрано, 18:18, 12 января 2021

м

Обзор генеративных моделей

Мы редко задумываемся о том, как много мы знаем о мире, в котором живем. Мы знаем, что он состоит из трехмерных сред, из объектов, которые перемещаются, сталкиваются и взаимодействуют, Автоматический синтез реалистичных высококачественных изображений из ~~людей, которые ходят, разговаривают~~ текстовых описаний был бы интересен и ~~думают~~довольно полезен, из животных, которые пасутся, летают, бегают или лают, из мониторов, отображающих информацию, закодированную с помощью определенного языкатак как имеет множество практических применений. ~~Мы знаем~~, ~~какая сейчас погода~~но современные системы искусственного интеллекта все еще далеки от этой цели, ~~кто выиграл баскетбольный матч, и что произошло~~ так как это является довольно сложной задачей в ~~1970 году~~области компьютерного зрения. ~~Это огромный объем информации, к которому, в общем-то, несложно найти путь~~ Однако в физическом мире атомов или в цифровом мире битов. Остается только разработать модели и алгоритмы, способные анализировать последние годы были разработаны универсальные и понимать это несметное множество данных. Дело в том, что нейронные сети, используемые в качестве генеративных моделей, располагают значительно меньшим количеством параметров по сравнению с объемом данных, на которых они обучаютсямощные рекуррентные архитектуры нейронных сетей для изучения различных представлений текстовых признаков. ~~Поэтому, чтобы обобщить данные~~Между тем, ~~модели вынуждены выявлять и эффективно интернализировать их сущность.~~ ~~Один из наиболее перспективных способов достижения этой цели — разработка~~ глубокие сверточные '''~~генеративных моделей~~генеративные состязательные сети''' (англ. ''[[Generative Adversarial Nets (GAN)|Generative ~~Model''~~Adversarial Nets, GANs]])начали генерировать весьма убедительные изображения определенных категорий, таких как лица, обложки альбомов и интерьеры комнат. ~~Процесс обучения генеративной модели выглядит так: собирается достаточно большой массив данных из какой~~Образцы, генерируемые существующими подходами "текст-~~либо области (например~~изображение", ~~миллионы изображений~~могут приблизительно отражать смысл данных описаний, ~~предложений или звуков~~ но они не содержат необходимых деталей и тярких частей объекта. ~~д.)~~Мы рассмотрим глубокую архитектуру и формулировку GAN, объединим достижения в моделировании текста и изображений, ~~а затем модель обучается генерировать такие данные самостоятельно~~переводя визуальные концепции из символов в пиксели.

Например, автоматический синтез реалистичных высококачественных изображений из текстовых описаний был бы довольно интересен и полезен, так как имеет множество практических применений== Обзор генеративных моделей ==Сообщество глубокого обучения быстро совершенствует генеративные модели.Среди них можно выделить три перспективных типа: авторегрессионные модели, но современные системы искусственного интеллекта все еще далеки от этой цели, так как это является довольно сложной задачей в области компьютерного зрения. Однако в последние годы были разработаны универсальные [[Вариационный автокодировщик|вариационные автокодировщики (VAE)]] и мощные рекуррентные архитектуры нейронных сетей для изучения различных представлений текстовых признаков. Между тем, глубокие сверточные '''генеративные состязательные сети''' (англ. [[Generative Adversarial Nets (GAN)|~~Generative Adversarial Nets, GANs~~генеративные состязательные сети]]~~) начали генерировать весьма убедительные~~ .На данный момент самые качественные изображения ~~определенных категорий~~генерируют сети GAN (фотореалистичные и разнообразные, ~~таких как лица, обложки альбомов и интерьеры комнат~~с убедительными деталями в высоком разрешении). Образцы, генерируемые существующими подходами "текст-изображение", могут приблизительно отражать смысл данных описаний, но они не содержат необходимых деталей и ярких частей объектаПоэтому в данной статье мы сосредоточимся на моделях GAN.

Это захватывающая и быстро меняющаяся область, предоставляющая возможности генеративных моделей в их способности генерировать реалистичные примеры в различных проблемных областях, особенно в задачах перевода с изображения на изображение, таких как перевод фотографий лета на зиму или дня на ночь, а также в создании фотореалистичных фотографий объектов, животных и людей, таких, что даже люди не могут сказать, являются они поддельными или нет. В этой статье мы рассмотрим глубокую архитектуру и формулировку GAN, объединим достижения в моделировании текста и изображений, переводя визуальные концепции из символов в пиксели.

~~== GAN ==~~

=== DCGAN ===

'''Глубокая сверточная генеративная состязательная сеть''' (англ. ''Deep Convolutional Generative Adversarial Network, DCGAN'') {{---}} обусловлена текстовыми признаками, кодируемыми гибридной сверточно-рекуррентной

Geny200

89

правок

Изменения

Генерация изображения по тексту

Навигация

Персональные инструменты

Пространства имён

Варианты

Просмотры

Ещё

Поиск

Навигация

Инструменты