Изменения

Блендинг изображений

2723 байта добавлено, 04:33, 7 января 2021

Почти дописал второй проход, попытался увеличить междустрочный интервал у кода, но безуспешно...

# Для каждого слоя $l$ некоторым алгоритмом cтроится стилевой маппинг $P_l$, который сопоставляет столбцам из $F_l[I]$ столбцы из $F_l[S]$.

# Изображение $O$ восстанавливается градиентным спуском по пространству изображений, используя некоторую функцию потерь.

'''fun''' $SinglePassHarmonization$( $I$, // Входное изображение ~~Mask~~$M$, // Маска $S$, // Стилевое изображение

$\pi$, // Алгоритм построения стилевого маппинга

$\mathcal{L}$ // Функция потерь

):

~~F_I :~~// Строим матрицы $F[I]$ и $F[S]$ с помощью свёрточной сети VGG-19 $F[I] \leftarrow ComputeNeuralActivations(I)$ ~~F_S :=~~ $F[S] \leftarrow ComputeNeuralActivations(S)$ ~~P :~~// Строим стилевой маппинг $P \leftarrow \pi$(~~F_I~~F[I], ~~Mask~~M, ~~F_S~~F[S])$ // Градиентным спуском ищем изображение $O := $, которое минимизирует $\mathcal{L}$ $O \leftarrow Reconstruct(I, ~~Mask~~M, S, P, $\mathcal{L})$)

'''return''' $O$

===Первый проход===

Первый проход делает грубую гармонизацию, но при этом он хорошо работает с любыми стилями. Здесь используется алгоритм <code>IndependentMapping</code> для построения стилевого маппинга. Этот алгоритм для каждого столбца $j$ в $F_l[I]$ ищет столбец $p(j)$ в $F_l[S]$, такой что евклидово расстояние между патчем $F_l[I]$ с центром $j$ и патчем $F_l[S]$ с центром $p(j)$ минимально (метод ближайшего соседа).

'''fun''' $IndependentMapping$( ~~F_I~~$F[I]$, // Выходы слоёв после входного изображения $Mask$, // Маска ~~F_S~~ $F[S]$ // Выходы слоёв после стилевого изображения

):

'''for''' $l ~~'''~~\in~~''' range(~~[1, : L)]$: // L = количество слоёв сети '''for''' $j ~~'''~~\in~~''' range(~~[1~~, M[l~~: M_l])$: ~~ // M[l] = количество признаков на выходе l-го слоя сети ~~ '''if''' $j ~~'''~~\in~~'''~~ Resize(Mask, l)$: // рассматриваем патчи только внутри маски, которую нужно масштабираовать в соответсвии с размером слоя $l $ $p(j) := \leftarrow NearestNeighborIndex(~~F_I~~F[I], j, ~~F_S~~F[S])$ ~~P :=~~ $P_l \leftarrow MakeStyleMapping(p) $ // Делаем стилевой маппинг для слоя $l$ с помощью функции $p(j) $ '''return''' $P$

В первом проходе используется модифицированная функция потерь $\mathcal{L}_{Gatys}$, с тем лишь отличием, что к $F_l[S]$ применяется стилевой маппинг $P_l$.

===Второй проход===

<div style="font-size:130%; line-height: 3em;">Второй проход делает более качественную гармонизацию после первого прохода. Здесь мы будем использовать более сложный алгоритм <code>ConsistentMapping</code> построения стилевого маппинга и более сложную функцию потерь. Суть этого алгоритма в том, чтобы найти стилевой мапинг на некотором слое $l_{ref}$ и перенести этот маппинг на остальные слои.Также, мы будем предпочитать маппинги, в которых смежные патчи в $F_l[S]$ остаются смежными после мапинга, чтобы обеспечить пространсвенную согласованность (видимо таким образом мы хотим переносить сложные текстуры более качественно, например мазки кистью). </div> <pre style="font-size:130%; line-height: 2em;">'''fun''' ConsistentMapping( $F[I]$, // Выходы слоёв после входного изображения $Mask$, // Маска $F[S]$ // Выходы слоёв после стилевого изображения ): // Сначала посчитаем маппинг как в IndependentMapping только для слоя $l_{ref}$ '''for''' $j \in [1 : M_{l_{ref}}]$: '''if''' $j \in Resize(Mask, l_{ref})$: $p_0(j) \leftarrow NearestNeighborIndex(F[I], j, F[S])$ // Далее обеспечиваем пространсвенную согласованность '''for''' $j \in [1 : M_{l_{ref}}]$: '''if''' $j \in Resize(Mask, l_{ref})$: $q \leftarrow p_0(j)$ $CSet \leftarrow \{q\}$ // Инициализируем множество кандидатов на новый маппинг '''for''' $o \in {N, NE, E, SE, S, SW, W, NW}$: // Перебираем все смежные патчи $CSet \leftarrow CSet \cup \{p_0(j + o) - o\}$ // Добавляем в кандидаты патч, сосед которого является маппингом для нашего соседа в соответсвующем направлении $p(j) \leftarrow argmin_{c \in CSet}\displaystyle\sum_o \|(F_{l_{ref}}[S]_c - F_{l_{ref}}[S]_{p_0(j + o)}\|^2$ P := MakeStyleMapping(p) // Делаем стилевой маппинг с помощью функции p(j) '''return''' P</pre>

{{Определение

===Итоговый алгоритм===

'''fun''' Harmonization(

I, // Входное изображение

S // Стилевое изображение

):

// Грубый проход алгоритма. Каждый слой рассматривается отдельно при построении стилевого маппинга.

I' := SinglePassHarmonization(I, Mask, S, IndependentMapping, $\mathcal{L}_1$)

// Улучшение результата. Стилевой маппинг строится консистентно для всех слоёв.

O := SinglePassHarmonization(I', Mask, S, ConsistentMapping, $\mathcal{L}_2$)

'''return''' O

* '''TODO''' как подбирать гиперпараметры $w_{style}$, $w_{hist}$, $w_{tv}$, $\alpha$, $\beta$, $\gamma$

Wafemand

58

правок

Изменения

Блендинг изображений

Навигация

Персональные инструменты

Пространства имён

Варианты

Просмотры

Ещё

Поиск

Навигация

Инструменты