Изменения

Перейти к: навигация, поиск

Задача трансляции изображений

2503 байта добавлено, 22:28, 9 января 2021
Полное описание архитектуры
==== Полное описание архитектуры ====
 
Для того, чтобы описать полный пайплайн работы Pix2Pix, обратимся к примеру:
 
Пусть у вас есть набор пар, состоящий из реальных фотографий и их сегментаций. Вы хотите научиться генерировать из сегментированных изображений реальные.
* Вы помещаете сегментированное изображение в генератор U-Net, и он генерирует некоторый выход.
* Дальше сгенерированное изображение (фотография) соединяется с исходным входным изображением (сегментированное), и это все идет в PatchGan дискриминатор, который выводит матрицу классификации, состоящую из значений между 0 и 1, которая показывает, насколько реальны или поддельны разные части этого изображения.
* Затем для вычисления ошибки дискриминатора проводится 2 сравнения:
** сравнение матрицы классификации от {объединения сгенерированного изображения (фотография) с исходным входным изображением (сегментированное)} с матрицей из всех 0
** матрицы классификация от {объединения реального изображения (фотография) с исходным входным изображением (сегментированнное)} с матрицей из всех 1
* Затем для вычисления ошибки генератора проводится сравнение матрицы классификации от {объединения сгенерированного изображения с исходным входным изображением} с матрицей из всех 1, которое считается с помощью BCE Loss, которое впоследствии суммируется с попиксельным сравнением реального изображения со сгенерированным, домноженным на <tex>\lambda</tex>
[[File:Pix2pix-UNet-128-GAN-network-architecture.png|700px|center|thumb|Архитектура Pix2Pix.]]
99
правок

Навигация