Изменения
→Функция потерь на основе корреляций матрицы Грама
=== Функция потерь на основе корреляций матрицы Грама ===
Теперь, как вы можете видеть, как каждый элемент матрицы Грама содержит меру корреляции всех каналов относительно друг друга. Обозначим матрицу Грама стилевого изображения слоя <math>l</math> как <math>GM[l](S)</math>, а матрицу Грама сгенерированного изображения того же слоя <math>GM[l](G)</math>. Обе матрицы грамм были вычислены из одного и того же слоя, следовательно, с использованием одного и того же числа каналов, что привело к тому, что он стал матрицей итоговая матрица размера ''"количество каналов" x "количество каналов"''. Теперь, если мы найдем сумму квадратов разности или L2-норму вычитания элементов этих двух матриц и попытаемся минимизировать ее, то в конечном итоге это приведет к минимизации разницы между изображением стиля и сгенерированным изображением.
[[Файл:Image10.jpeg|500px|center]]
В вышеприведенном уравнении <math>N_{l}</math> представляет номер канала в карте признаков / выходных данных уровня <math>l</math>, а <math>M_{l}</math> представляет высоту <math>height* ширину width</math> карты объектов признаков / выходных данных слоя <math>l</math>.
В то время как при вычислении потери стиля мы используем несколько уровней активации, это позволяет нам назначать разные весовые коэффициенты для потери на каждом уровне.