Изменения

Вписывание части изображения

66 байт добавлено, 21:05, 10 января 2021

Нет описания правки

=== Свертки ===

~~В подрисовке~~ Для вписывания изображения помимо классической свертки широко используются другие способы перехода от слоя к слою. Подробнее про свертки можно прочитать в конспекте [[Сверточные нейронные сети]]

# '''Расширенная свертка (англ. Dilated convolution)'''. Данный способ позволяет сохранить качество изображении, уменьшив затраты на память и вычисления.

# '''Частичная свертка (англ. Partial convolution).''' Данная свертка дает лучшее качество на масках произвольной формы. Классическая свертка предполагает, что все пиксели валидны, а частичная учитывает количество стертых пикселей в рассматриваемой матрице.

=== SC-FEGAN<ref>[https://github.com/run-youngjoo/SC-FEGAN Face Editing Generative Adversarial Network with User's Sketch and Color, Youngjoo Jo, Jongyoul Park]</ref> ===

SC-FEGAN позволяет производить высококачественные изображения лиц, ~~учитывая передаваемые~~ за счет эскизов, передаваемых пользователем ~~эскизы на местах~~ вместо стертых частей изображения. Иными словами пользователь может ~~легко редактировать изображения~~стереть фрагмент, ~~стирая фрагменты, которые~~ который он хочет изменить, нарисовать на его месте желаемый объект, и ~~подставляя туда эскизы~~полученный эскиз, а также его цветовая палитра, ~~которые~~ будут отражены в ~~генерируемом~~ сгенерированном фрагменте.

Дискриминатор данной сети принимает на вход сгенерированное изображение, маску и рисунок пользователя. Итоговая функция потерь формируется из выхода дискриминатора и функций сравнения изображения с оригинальным (per-pixel loss, perceptual loss, style loss).

=== Pluralistic Image Completion<ref>[https://github.com/lyndonzheng/Pluralistic-Inpainting Pluralistic Image Completion, Chuanxia Zheng, Tat-Jen Cham, Jianfei Cai]</ref> ===

Главное отличие этой модели от других {{---}} способность выдавать несколько вариантов заполнения отсутствующих областей изображения. Обычно модели генерируют ~~лишь~~ только один вариант, пытаясь приблизиться к оригинальному изображению. Используя же данную модель, человек может выбрать то сгенерированное изображение, которое выглядит более реалистичным, получая таким образом более ~~качественное изображение~~ качественные изображения на выходе.

Данная модель добивается такого эффекта путем пропускания входного изображения через две параллельные сети. Первая сеть {{---}} реконструирующая. Она пытается приблизить выходное изображение к оригинальному. Вторая сеть {{---}} генерирующая, работающая с априорным распределением отсутствующих областей и выборками известных пикселей. Каждая сеть имеет свой дискриминатор, помогающий обучить модель. Кроме выхода дискриминатора для обучения также используются функции сравнения полученного изображения с оригинальным.

=== Deep Image Prior<ref>[https://arxiv.org/pdf/1711.10925v4.pdf Deep Image Prior, Dmitry Ulyanov, Andrea Vedaldi, Victor Lempitsky]</ref> ===

[[Файл:DeepImagePrior_minimization.jpeg|thumb|550px|~~Визуализации минимизации функции потерь в модели~~ Процесс восстановления изображения с помощью Deep Image Prior.]]

Как известно, большинство методов глубокого обучения требуют больших наборов данных для тренировки. В отличие от них Deep Image Prior не требует никакой предварительной обучающей выборки кроме одного изображения, которое надо исправить. Для этого сеть учится извлекать полезную информации из самого обрабатываемого изображения. Данный метод применяется для таких задач как вписывание части изображения, удаление шума и увеличение разрешения фотографий.

Анонимный участник

45.136.246.66

Изменения

Вписывание части изображения

Навигация

Персональные инструменты

Пространства имён

Варианты

Просмотры

Ещё

Поиск

Навигация

Инструменты