Изменения

Перейти к: навигация, поиск

Задача трансляции изображений

1156 байт добавлено, 19:29, 9 января 2021
Pix2Pix
=== Архитектура ===
Pix2Pix представляет собой условные порождающие состязательные сети реализует архитектуру условных порождающих состязательных сетей (англ. CGAN) с модификациями, где для генератора взята U-Net<ref>[https://sci-hub.do/10.1007/978-3-319-24574-4_28 U-Net: Convolutional Networks for Biomedical Image Segmentation]</ref>-основанная архитектура, а для дискриминатора используется сверточный классификатор PatchGAN<ref>[https://sci-hub.do/10.1007/978-3-319-46487-9_43 Precomputed Real-Time Texture Synthesis with Markovian Generative Adversarial Networks]</ref>, который штрафует структуру только в масштабе участков изображения.
Генератор CGAN'a работает следующим образом: на вход подается one-hot вектор класса x и вектор шума z, в результате прохода через условный генератор выдается сгенерированное изображение этого класса, <tex>G: \{x,z\} \to y</tex>. <br>В генератор Pix2Pix работает похожим образом, но вместо вектора класса подается изображение, а вектор шума и вовсе убирается, потому что он не вносит значительной случайности для результата работы генератора. Генератор обучается с целью, чтобы его выходящие изображения максимально правдоподобными, дискриминатор же учится как можно лучше отличать фальшивые изображения от реальных. [[File:Training_CGAN_pix2pix.png|700px|center|thumb|Пример процесса обучениягенератора и дискриминатора для Pix2Pix.]]
=== Примеры ===
99
правок

Навигация