Вклад участника
(новейшие | старейшие) Просмотреть (20 более новых | 20 более старых) (20 | 50 | 100 | 250 | 500)
- 13:49, 28 января 2019 (разн. | история) . . (+93) . . Методы policy gradient и алгоритм асинхронного актора-критика (→Алгоритм актора-критика с преимуществом)
- 13:47, 28 января 2019 (разн. | история) . . (+5) . . Методы policy gradient и алгоритм асинхронного актора-критика (→Использование будущего выигрыша вместо полного выигрыша)
- 13:47, 28 января 2019 (разн. | история) . . (+10) . . Методы policy gradient и алгоритм асинхронного актора-критика (→Алгоритм актора-критика с преимуществом)
- 13:45, 28 января 2019 (разн. | история) . . (+45) . . Методы policy gradient и алгоритм асинхронного актора-критика (→Алгоритм Actor-Critic)
- 13:44, 28 января 2019 (разн. | история) . . (+473) . . Методы policy gradient и алгоритм асинхронного актора-критика
- 05:52, 28 января 2019 (разн. | история) . . (+2612) . . Методы policy gradient и алгоритм асинхронного актора-критика
- 04:52, 28 января 2019 (разн. | история) . . (0) . . Н Файл:Actor-critic-nn.png (текущая)
- 04:50, 28 января 2019 (разн. | история) . . (+7609) . . Методы policy gradient и алгоритм асинхронного актора-критика
- 04:29, 28 января 2019 (разн. | история) . . (0) . . Н Файл:Async-actor-critic.png (текущая)
- 22:22, 25 января 2019 (разн. | история) . . (+947) . . Методы policy gradient и алгоритм асинхронного актора-критика
- 20:53, 25 января 2019 (разн. | история) . . (-69) . . Методы policy gradient и алгоритм асинхронного актора-критика
- 20:50, 25 января 2019 (разн. | история) . . (-18 212) . . Обучение с подкреплением
- 20:50, 25 января 2019 (разн. | история) . . (+18 361) . . Н Методы policy gradient и алгоритм асинхронного актора-критика (Новая страница: «== Policy gradient и алгоритм Actor-Critic == В алгоритме Q-learning агент обучает функцию полезности дейст…»)
- 20:48, 25 января 2019 (разн. | история) . . (+107) . . Машинное обучение (→Обучение с подкреплением)
- 01:59, 25 января 2019 (разн. | история) . . (+57) . . Н Категория:Обучение с подкреплением (Новая страница: «Категория: Машинное обучение») (текущая)
- 01:57, 25 января 2019 (разн. | история) . . (+130) . . Обучение с подкреплением
- 14:46, 24 января 2019 (разн. | история) . . (+2) . . Обучение с подкреплением (→Алгоритм Actor-Critic)
- 14:44, 24 января 2019 (разн. | история) . . (+4) . . Обучение с подкреплением (→Использование будущего выигрыша вместо полного выигрыша)
- 04:07, 24 января 2019 (разн. | история) . . (+4191) . . Обучение с подкреплением
- 02:17, 24 января 2019 (разн. | история) . . (+4001) . . Обучение с подкреплением
(новейшие | старейшие) Просмотреть (20 более новых | 20 более старых) (20 | 50 | 100 | 250 | 500)