Изменения

Перейти к: навигация, поиск

Генерация изображения по тексту

2438 байт убрано, 18:18, 12 января 2021
м
Обзор генеративных моделей
{{В разработке}}
Мы редко задумываемся о том, как много мы знаем о мире, в котором живем. Мы знаем, что он состоит из трехмерных сред, из объектов, которые перемещаются, сталкиваются и взаимодействуют, Автоматический синтез реалистичных высококачественных изображений из людей, которые ходят, разговаривают текстовых описаний был бы интересен и думаютдовольно полезен, из животных, которые пасутся, летают, бегают или лают, из мониторов, отображающих информацию, закодированную с помощью определенного языкатак как имеет множество практических применений. Мы знаем, какая сейчас погодано современные системы искусственного интеллекта все еще далеки от этой цели, кто выиграл баскетбольный матч, и что произошло так как это является довольно сложной задачей в 1970 годуобласти компьютерного зрения. Это огромный объем информации, к которому, в общем-то, несложно найти путь Однако в физическом мире атомов или в цифровом мире битов. Остается только разработать модели и алгоритмы, способные анализировать последние годы были разработаны универсальные и понимать это несметное множество данных. Дело в том, что нейронные сети, используемые в качестве генеративных моделей, располагают значительно меньшим количеством параметров по сравнению с объемом данных, на которых они обучаютсямощные рекуррентные архитектуры нейронных сетей для изучения различных представлений текстовых признаков. Поэтому, чтобы обобщить данныеМежду тем, модели вынуждены выявлять и эффективно интернализировать их сущность. Один из наиболее перспективных способов достижения этой цели — разработка глубокие сверточные '''генеративных моделейгенеративные состязательные сети''' (англ. ''[[Generative Adversarial Nets (GAN)|Generative Model''Adversarial Nets, GANs]])начали генерировать весьма убедительные изображения определенных категорий, таких как лица, обложки альбомов и интерьеры комнат. Процесс обучения генеративной модели выглядит так: собирается достаточно большой массив данных из какойОбразцы, генерируемые существующими подходами "текст-либо области (напримеризображение", миллионы изображениймогут приблизительно отражать смысл данных описаний, предложений или звуков но они не содержат необходимых деталей и тярких частей объекта. д.)Мы рассмотрим глубокую архитектуру и формулировку GAN, объединим достижения в моделировании текста и изображений, а затем модель обучается генерировать такие данные самостоятельнопереводя визуальные концепции из символов в пиксели.
Например, автоматический синтез реалистичных высококачественных изображений из текстовых описаний был бы довольно интересен и полезен, так как имеет множество практических применений== Обзор генеративных моделей ==Сообщество глубокого обучения быстро совершенствует генеративные модели.Среди них можно выделить три перспективных типа: авторегрессионные модели, но современные системы искусственного интеллекта все еще далеки от этой цели, так как это является довольно сложной задачей в области компьютерного зрения. Однако в последние годы были разработаны универсальные [[Вариационный автокодировщик|вариационные автокодировщики (VAE)]] и мощные рекуррентные архитектуры нейронных сетей для изучения различных представлений текстовых признаков. Между тем, глубокие сверточные '''генеративные состязательные сети''' (англ. [[Generative Adversarial Nets (GAN)|Generative Adversarial Nets, GANsгенеративные состязательные сети]]) начали генерировать весьма убедительные .На данный момент самые качественные изображения определенных категорийгенерируют сети GAN (фотореалистичные и разнообразные, таких как лица, обложки альбомов и интерьеры комнатс убедительными деталями в высоком разрешении). Образцы, генерируемые существующими подходами "текст-изображение", могут приблизительно отражать смысл данных описаний, но они не содержат необходимых деталей и ярких частей объектаПоэтому в данной статье мы сосредоточимся на моделях GAN.
Это захватывающая и быстро меняющаяся область, предоставляющая возможности генеративных моделей в их способности генерировать реалистичные примеры в различных проблемных областях, особенно в задачах перевода с изображения на изображение, таких как перевод фотографий лета на зиму или дня на ночь, а также в создании фотореалистичных фотографий объектов, животных и людей, таких, что даже люди не могут сказать, являются они поддельными или нет. В этой статье мы рассмотрим глубокую архитектуру и формулировку GAN, объединим достижения в моделировании текста и изображений, переводя визуальные концепции из символов в пиксели.
== GAN ==
=== DCGAN ===
'''Глубокая сверточная генеративная состязательная сеть''' (англ. ''Deep Convolutional Generative Adversarial Network, DCGAN'') {{---}} обусловлена текстовыми признаками, кодируемыми гибридной сверточно-рекуррентной
89
правок

Навигация