Soft-Max и Soft-Arg-Max — различия между версиями

Версия 19:00, 1 июля 2022

Содержание

1 Soft-Arg-Max
2 Soft-Max
- 2.1 Плохой Soft-Max
- 2.2 Хороший Soft-Max
3 Связь между вариациями Soft-Max
4 Примечания
5 Источники

Soft-Arg-Max

Постановка задачи

Пусть есть задача мягкой классификации:

Алгоритм выдает значения [math]L_{1}, L_{2},\ldots, L_{n}[/math], где [math]n[/math] — число классов.

[math]L_{i}[/math] — уверенность алгоритма в том, что объект принадлежит классу [math]i[/math],

Для этих значений необходимо найти такие [math]p_{1},\ldots,p_{n}[/math], что:

[math]\sum_{i}p_{i}=1[/math]

То есть [math]p_{1},\ldots,p_{n}[/math] — распределение вероятностей

Для этого выполним преобразование:

Тогда выполняется следующее:

Модель [math]a[/math], возвращающая [math]L_{i}[/math], после преобразования будет возвращать [math]p_{i}[/math] и останется дифференцируемой
[math]p =[/math] soft-arg-max[math]\left ( L \right )[/math]

Пусть [math]y = [/math] soft-arg-max[math]\left ( x \right )[/math], тогда:

У soft-arg-max такое название, так как это, по сути, гладкая аппроксимация модифицированного arg-max.

Свойства soft-arg-max

Вычисляет по вектору чисел вектор с распределением вероятностей
Можно интерпретировать как вероятность нахождения максимума в [math]i[/math]-й координате
soft-arg-max soft-arg-max[math]\left ( x,y,z\right )[/math]
Предыдущее свойство используют для устойчивости вычислений при

Модификация soft-arg-max

soft-arg-max

Данная модификация полезна, когда необходимо контролировать распределение вероятностей, получаемое soft-arg-max. Чем больше параметр [math]t[/math], тем больше получаемые вероятности будут похожи на равномерное распределение.

Soft-Max

Плохой Soft-Max

рис.1 Плохой Soft-Max (помечен красным)

рис.2 Хороший Soft-Max (помечен оранжевым)

Зададим функцию soft-max таким образом:

soft-maxsoft-arg-max

Гладкая аппроксимация максимума. Математическое ожидание или средневзвешенное, где веса — экспоненты значений соответствующих элементов. Сохраняет некоторые свойства максимума:

soft-max[math]\left ( a,a,a\right ) = a[/math]
soft-max soft-max[math]\left ( x,y,z\right ) + a[/math]

Заданный выше soft-max — "плохой" в связи с тем, что мы считаем средневзвешенное значение, которое всегда будет меньше максимума, что приведёт к проблемам с поиском максимума.

Хороший Soft-Max

soft-max

Не сохраняется свойство soft-max[math]\left(a,a,a\right)=a[/math]
Производная равна soft-arg-max

В этом случае сохраняется монотонность, значит, не возникнет проблем с поиском минимума и максимума.

Связь между вариациями Soft-Max

Обозначим "плохой" soft-max как bad-soft-max. Тогда:

bad-soft-maxsoft-arg-max
[math]\nabla[/math]soft-max soft-arg-max
[math]\log\left(\right.[/math]soft-arg-maxsoft-max

Примечания

В большинстве статей пишется soft-max, хотя вместо этого подразумевается soft-arg-max
soft-arg-max можно называть также как обобщённая (многомерная) сигмоида
soft-arg-max является алгоритмом подсчёта весов для soft-max

Источники

Лекция 7. Байесовские методы А. Забашта
Лекция 7. Автоматическое дифференцирование и нейронные сети С. Муравьёв

@@ Строка 70: / Строка 70: @@
 *'''bad-soft-max'''<tex>\left(x_{1},\ldots,x_{n}\right)=\left \langle x,  \right .</tex>'''soft-arg-max'''<tex>\left . \left (x_{1},\ldots,x_{n} \right )  \right \rangle</tex>
-*<tex>\nabla</tex>'''soft-max'''<tex>\left(x_{1},\ldots,x_{n}\right)=</tex>'''soft-arg-max'''<tex>\left(x_{1},\ldots,x_{n}\right)</tex>
+*<tex>\nabla</tex>'''soft-max'''<tex>\left(x_{1},\ldots,x_{n}\right)=</tex> '''soft-arg-max'''<tex>\left(x_{1},\ldots,x_{n}\right)</tex>
 *<tex>\log\left(\right.</tex>'''soft-arg-max'''<tex>_{i}\left(x_{1},\ldots,x_{n}\right)\left.\right) = x_{i} -</tex>'''soft-max'''<tex>\left(x_{1},\ldots,x_{n}\right)</tex>
 ==Примечания==
 *В большинстве статей пишется '''soft-max''', хотя вместо этого подразумевается '''soft-arg-max'''

Soft-Max и Soft-Arg-Max — различия между версиями

Версия 19:00, 1 июля 2022

Содержание

Soft-Arg-Max

Постановка задачи

Свойства soft-arg-max

Модификация soft-arg-max

Soft-Max

Плохой Soft-Max

Хороший Soft-Max

Связь между вариациями Soft-Max

Примечания

Источники

Навигация

Персональные инструменты

Пространства имён

Варианты

Просмотры

Ещё

Поиск

Навигация

Инструменты