Изменения

Перейти к: навигация, поиск

Обучение с подкреплением

Нет изменений в размере, 20:53, 13 января 2019
м
Нет описания правки
Пример. Награда для стратегии с различными <tex>\epsilon</tex>:
[[File:epsEps-greedy.jpgpng]]
== Метод UCB (upper confidence bound) ==
77
правок

Навигация