Изменения

Задача трансляции изображений

2503 байта добавлено, 22:28, 9 января 2021

→‎Полное описание архитектуры

==== Полное описание архитектуры ====

Для того, чтобы описать полный пайплайн работы Pix2Pix, обратимся к примеру:

Пусть у вас есть набор пар, состоящий из реальных фотографий и их сегментаций. Вы хотите научиться генерировать из сегментированных изображений реальные.

* Вы помещаете сегментированное изображение в генератор U-Net, и он генерирует некоторый выход.

* Дальше сгенерированное изображение (фотография) соединяется с исходным входным изображением (сегментированное), и это все идет в PatchGan дискриминатор, который выводит матрицу классификации, состоящую из значений между 0 и 1, которая показывает, насколько реальны или поддельны разные части этого изображения.

* Затем для вычисления ошибки дискриминатора проводится 2 сравнения:

** сравнение матрицы классификации от {объединения сгенерированного изображения (фотография) с исходным входным изображением (сегментированное)} с матрицей из всех 0

** матрицы классификация от {объединения реального изображения (фотография) с исходным входным изображением (сегментированнное)} с матрицей из всех 1

* Затем для вычисления ошибки генератора проводится сравнение матрицы классификации от {объединения сгенерированного изображения с исходным входным изображением} с матрицей из всех 1, которое считается с помощью BCE Loss, которое впоследствии суммируется с попиксельным сравнением реального изображения со сгенерированным, домноженным на <tex>\lambda</tex>

[[File:Pix2pix-UNet-128-GAN-network-architecture.png|700px|center|thumb|Архитектура Pix2Pix.]]

Spovar

99

правок

Изменения

Задача трансляции изображений

Навигация

Персональные инструменты

Пространства имён

Варианты

Просмотры

Ещё

Поиск

Навигация

Инструменты