Изменения

Перейти к: навигация, поиск

Neural Style Transfer

941 байт убрано, 23:19, 17 апреля 2019
Content Loss
Во время каждой итерации все три изображения, передаются через модель VGG16. Значения функции активации нейронов, которые кодируют представление признаков данного изображения на определенных слоях, принимаются как входные данные для этих двух функций потерь. Также стоит добавить: изначально мы случайным образом инициализируем сгенерированное изображение, например, матрицей случайного шума такого же разрешения, как и изображение контента. С каждой итерацией мы изменяем сгенерированное изображение, чтобы минимизировать общую потерю '''L'''.
== Content Loss Функция потери контента ==
Потери контента легко рассчитать, давайте возьмем Возьмем функциональное представление только одного из уровней, давайте рассмотрим 7-й го сверточного слой свертки vgg16VGG16. Чтобы вычислить потерю контента, мы пропускаем и изображение контента, и сгенерированное изображение через vgg16 VGG16 и получаем значения функции активации (то есть выходы) 7-го слоя конвоя для обоих этих изображений, для которых имеется Relu. После каждого сверточного слоя идет ReLu, поэтому мы будем обозначать выход этого слоя в целом как relu_3_3, (поскольку это выход третьего сверточного слоя третьего набора / блока сверток ) (для справки см. рис. Рисунок 2 и 6). Наконец, мы находим L2 Норму -норму поэлементного вычитания между этими двумя матрицами значений функции активации следующим образом: Это поможет сохранить исходный контент в сгенерированном изображении, убедившись, что минимизируется разница в представлении объектов, которая логически фокусируется на разнице между содержимым обоих изображений.
Чтобы поместить эту потерю в математическую форму или уравнение, которое мы можем вычислить. Допустим, у нас есть функция Content loss, которая принимает в качестве входных данных три аргумента[[Файл: изображение контента C, сгенерированное изображение G и слой L, активацию которого мы будем использовать для вычисления потерьImage7. Теперь давайте обозначим каждый слой активации изображения контента как a[Ljpeg|500px|center](C), а слой активации сгенерированного изображения как a[L](G).
[[Файл:Image7Это поможет сохранить исходный контент в сгенерированном изображении, а также минимизировать разницу в представлении признаков, которое логически фокусируется на разнице между содержимым обоих изображений.jpeg|500px|center]]
== Style Loss ==
Анонимный участник

Навигация