Изменения

Generative Adversarial Nets (GAN)

1312 байт добавлено, 06:55, 21 января 2021

Нет описания правки

Генератор хорошо обученной сети $-$ функция

$g : Z \rightarrow X$, где $Z \subseteq (\mathbb{R})^{d}$ $-$ скрытое пространство размерности $d$, для которого обычно применимо Гауссово распределение в многомерном случае. $X$ $-$ пространство изображений, где у каждого изображения существует набор характеристик вроде возраста или пола. Пусть нам дана функция оценки $f_{S} : X \rightarrow S$, где $S \subseteq (\mathbb{R})^{m}$ $-$ пространство изображений размерности $m$. Тогда $s = f_{S}(g(z))$, где $z \in Z$, $s \in S$ $-$ связь между точкой в скрытом подпространстве и характеристиками получившегося изображения.

Установлено, что при движении между двумя точками $z_1$ и $z_2$ характеристики меняются постепенно, без скачков. Тогда по этому направлению в $Z$ можно построить гиперплоскость.

Тогда сделаем предположение, при котором для любого бинарного параметра существует гиперплоскость, что все образцы с одной стороны от нее имеют одинаковое значение этого параметра.

Заведем следующую функцию "расстояния":

~~Манипуляции в скрытом подпространстве~~ $d(~~рис. 16~~n, z)= n^{T}z$, где $n \in \mathbb{R}^{d}$. ~~Сделаем предположение, при котором~~ Это не является расстоянием строго из-за наличия отрицательных значений (но знак нам необходим для ~~любого бинарного~~ определения знака параметра ~~существует гиперплоскость~~характеристики).Ожидается, что ~~все образцы с одной стороны~~ функция оценки $f$ по данному параметру линейно зависит от ~~нее имеют одинаковое значение этого параметра.~~ "расстояния": $f(g(z)) = \lambda d(n, z)$ В таком случае выраженность характеристики зависит от "расстояния " до этой гиперплоскости. Аналогично происходит и в случае нескольких характеристик: $f_{S}(g(z)) = \Lambda N^{T}z$, где $\Lambda$ - диагональная матрица с линейными коэффициентами $\lambda_{i}$ для каждой из характеристик, $N = [n_1, . . . ~~Тогда проецируя векторы нормали этих гиперплоскостей~~ , n_m]$ $-$ границы. В случае если $\Lambda$ $-$ диагональная, то проблемы запутывания нет. В противном случае проделаем манипуляции в скрытом подпространстве (рис. 16). Проецируя, можно найти ~~такие направления~~ такое направление $n_1 - (n_1^{T} - n_2)n_2$ в скрытом подспространстве, что вдоль этих направлений у сгенерированных изображений будем изменяться ~~одна величина~~ характеристика $1$ в независимости от ~~другой~~характеристики $2$. При слишком большом $расстоянии $ от гиперплоскости соответствующая характеристика слишком сильно делает лицо непохожим на изначальное, но это объяснимо нормальным распределением вектора шума.

[[File:SubspaceManipulation.png|200px|thumb|center|Рисунок 16. Манипулирование подпространством. Источник:https://arxiv.org/pdf/1907.10786.pdf]]

SemBarner

101

правка

Изменения

Generative Adversarial Nets (GAN)

Навигация

Персональные инструменты

Пространства имён

Варианты

Просмотры

Ещё

Поиск

Навигация

Инструменты