Изменения

Перейти к: навигация, поиск

Задача трансляции изображений

3 байта добавлено, 19:24, 12 января 2021
м
Генератор
[[File:UNet_generator_pix2pix.png|400px|right|thumb|Архитектура Pix2Pix генератора.]]
Для генератора Pix2Pix используется UNetU-net-генератор.<br>'''UNetU-net-генератор'''<ref name="unet">[https://sci-hub.do/10.1007/978-3-319-24574-4_28 U-Net: Convolutional Networks for Biomedical Image Segmentation]</ref> {{---}} это модель encoder-decoder с добавлением пропускаемых соединений (англ. ''skip-connections'') между зеркальными слоями в стеках кодировщика и декодера.
Алгоритм работы генератора:
* на вход подается изображение;
* далее последовательно применяются свертка, [[Batch-normalization | батч-нормализация]] (англ. Batch Norm layer), функция активации LeakyReLU и пулинг, что, тем самым, уменьшает количество признаков;
* при этом, следуя архитектуре UNetU-net, добавляются пропускаемые соединения между каждым слоем <tex>i</tex> и слоем <tex>n - i</tex>, где <tex>n</tex> {{---}} общее количество слоев; каждое пропускаемое соединение просто объединяет все каналы на уровне <tex>i</tex> с другими на слое <tex>n - i</tex>; таким образом, информация, которая могла быть сильно сжата (потеряна), может доходить до некоторых более поздних слоев;
* после того, как получен слой минимального размера, начинается работа декодера, который делает то же, что и кодировщик, с отличием в слое, обратном пулингу, который увеличивает количество признаков;
* также в декодере добавляется dropout, чтобы достигнуть стохастичности на выходе генератора.
111
правок

Навигация