Изменения

Перейти к: навигация, поиск

Задача трансляции изображений

30 байт добавлено, 23:41, 9 января 2021
Нет описания правки
}}
Другими словами, задача состоит в том, чтобы научиться преобразовывать изображение из одной области в другую, получая в итоге изображение со стилем (характеристиками) последней.
аИ
[[Файл:Horse2zebra.gif|600px|thumb|right|Пример работы трансляции изображения: превращение лошади в зебру, и наоборот. (CycleGan)<ref name="cycle">[https://github.com/junyanz/CycleGAN CycleGAN {{---}} GitHub]</ref>]]
Как работает генератор:
* на вход подается изображение <tex>x</tex>
* далее последовательно применяются свертка, [[Batch-normalization | батч-нормализация ]] (англ. Batch Norm layer)<ref>[https://en.wikipedia.org/wiki/Batch_normalization Batch normalization {{---}} Wikipedia]</ref>, функция активации LeakyReLU и пулинг, что, тем самым, уменьшает количество признаков
* при этом, следуя архитектуре UNet, добавляются пропускаемые соединения между каждым слоем <tex>i</tex> и слоем <tex>n - i</tex>, где <tex>n</tex> {{---}} общее количество слоев; каждое пропускаемое соединение просто объединяет все каналы на уровне <tex>i</tex> с другими на слое <tex>n - i</tex>; таким образом, информация, которая могла быть сжата слишком много (потеряна), может все еще проникать и все еще добраться до некоторых из более поздних слоев
* после того, как достигнут слой минимального размера, начинается работа декодера, который в сущности делает то же, что и кодировщик, только содержит слой, обратный пулингу, который увеличивает количество признаков
Анонимный участник

Навигация