Изменения

Перейти к: навигация, поиск

Generative Adversarial Nets (GAN)

1312 байт добавлено, 06:55, 21 января 2021
Нет описания правки
Генератор хорошо обученной сети $-$ функция
$g : Z \rightarrow X$, где $Z \subseteq (\mathbb{R})^{d}$ $-$ скрытое пространство размерности $d$, для которого обычно применимо Гауссово распределение в многомерном случае. $X$ $-$ пространство изображений, где у каждого изображения существует набор характеристик вроде возраста или пола. Пусть нам дана функция оценки $f_{S} : X \rightarrow S$, где $S \subseteq (\mathbb{R})^{m}$ $-$ пространство изображений размерности $m$. Тогда $s = f_{S}(g(z))$, где $z \in Z$, $s \in S$ $-$ связь между точкой в скрытом подпространстве и характеристиками получившегося изображения.
Установлено, что при движении между двумя точками $z_1$ и $z_2$ характеристики меняются постепенно, без скачков. Тогда по этому направлению в $Z$ можно построить гиперплоскость.
Тогда сделаем предположение, при котором для любого бинарного параметра существует гиперплоскость, что все образцы с одной стороны от нее имеют одинаковое значение этого параметра.
Заведем следующую функцию "расстояния":
Манипуляции в скрытом подпространстве $d(рис. 16n, z)= n^{T}z$, где $n \in \mathbb{R}^{d}$. Сделаем предположение, при котором Это не является расстоянием строго из-за наличия отрицательных значений (но знак нам необходим для любого бинарного определения знака параметра существует гиперплоскостьхарактеристики).Ожидается, что все образцы с одной стороны функция оценки $f$ по данному параметру линейно зависит от нее имеют одинаковое значение этого параметра. "расстояния": $f(g(z)) = \lambda d(n, z)$ В таком случае выраженность характеристики зависит от "расстояния " до этой гиперплоскости. Аналогично происходит и в случае нескольких характеристик: $f_{S}(g(z)) = \Lambda N^{T}z$, где $\Lambda$ - диагональная матрица с линейными коэффициентами $\lambda_{i}$ для каждой из характеристик, $N = [n_1, . . . Тогда проецируя векторы нормали этих гиперплоскостей , n_m]$ $-$ границы. В случае если $\Lambda$ $-$ диагональная, то проблемы запутывания нет. В противном случае проделаем манипуляции в скрытом подпространстве (рис. 16). Проецируя, можно найти такие направления такое направление $n_1 - (n_1^{T} - n_2)n_2$ в скрытом подспространстве, что вдоль этих направлений у сгенерированных изображений будем изменяться одна величина характеристика $1$ в независимости от другойхарактеристики $2$.  При слишком большом $расстоянии $ от гиперплоскости соответствующая характеристика слишком сильно делает лицо непохожим на изначальное, но это объяснимо нормальным распределением вектора шума.
[[File:SubspaceManipulation.png|200px|thumb|center|Рисунок 16. Манипулирование подпространством. Источник:https://arxiv.org/pdf/1907.10786.pdf]]
101
правка

Навигация