Вклад участника

Поиск вклада

Показать только вклад, сделанный с новых учётных записей
IP-адрес или имя участника:

Пространство имён: Обратить выбранное Связанное пространство

Фильтр меток:

Показывать только правки, являющиеся последними версиями Показывать только правки, являющиеся созданием страниц Скрыть малые правки

С даты:
По дату:

(новейшие | старейшие) Просмотреть (20 более новых | 20 более старых) (20 | 50 | 100 | 250 | 500)

13:49, 28 января 2019 (разн. | история) . . (+93)‎ . . Методы policy gradient и алгоритм асинхронного актора-критика ‎ (→‎Алгоритм актора-критика с преимуществом)
13:47, 28 января 2019 (разн. | история) . . (+5)‎ . . Методы policy gradient и алгоритм асинхронного актора-критика ‎ (→‎Использование будущего выигрыша вместо полного выигрыша)
13:47, 28 января 2019 (разн. | история) . . (+10)‎ . . Методы policy gradient и алгоритм асинхронного актора-критика ‎ (→‎Алгоритм актора-критика с преимуществом)
13:45, 28 января 2019 (разн. | история) . . (+45)‎ . . Методы policy gradient и алгоритм асинхронного актора-критика ‎ (→‎Алгоритм Actor-Critic)
13:44, 28 января 2019 (разн. | история) . . (+473)‎ . . Методы policy gradient и алгоритм асинхронного актора-критика ‎
05:52, 28 января 2019 (разн. | история) . . (+2612)‎ . . Методы policy gradient и алгоритм асинхронного актора-критика ‎
04:52, 28 января 2019 (разн. | история) . . (0)‎ . . Н Файл:Actor-critic-nn.png ‎ (текущая)
04:50, 28 января 2019 (разн. | история) . . (+7609)‎ . . Методы policy gradient и алгоритм асинхронного актора-критика ‎
04:29, 28 января 2019 (разн. | история) . . (0)‎ . . Н Файл:Async-actor-critic.png ‎ (текущая)
22:22, 25 января 2019 (разн. | история) . . (+947)‎ . . Методы policy gradient и алгоритм асинхронного актора-критика ‎
20:53, 25 января 2019 (разн. | история) . . (-69)‎ . . Методы policy gradient и алгоритм асинхронного актора-критика ‎
20:50, 25 января 2019 (разн. | история) . . (-18 212)‎ . . Обучение с подкреплением ‎
20:50, 25 января 2019 (разн. | история) . . (+18 361)‎ . . Н Методы policy gradient и алгоритм асинхронного актора-критика ‎ (Новая страница: «== Policy gradient и алгоритм Actor-Critic == В алгоритме Q-learning агент обучает функцию полезности дейст…»)
20:48, 25 января 2019 (разн. | история) . . (+107)‎ . . Машинное обучение ‎ (→‎Обучение с подкреплением)
01:59, 25 января 2019 (разн. | история) . . (+57)‎ . . Н Категория:Обучение с подкреплением ‎ (Новая страница: «Категория: Машинное обучение») (текущая)
01:57, 25 января 2019 (разн. | история) . . (+130)‎ . . Обучение с подкреплением ‎
14:46, 24 января 2019 (разн. | история) . . (+2)‎ . . Обучение с подкреплением ‎ (→‎Алгоритм Actor-Critic)
14:44, 24 января 2019 (разн. | история) . . (+4)‎ . . Обучение с подкреплением ‎ (→‎Использование будущего выигрыша вместо полного выигрыша)
04:07, 24 января 2019 (разн. | история) . . (+4191)‎ . . Обучение с подкреплением ‎
02:17, 24 января 2019 (разн. | история) . . (+4001)‎ . . Обучение с подкреплением ‎

(новейшие | старейшие) Просмотреть (20 более новых | 20 более старых) (20 | 50 | 100 | 250 | 500)

Вклад участника

Навигация

Персональные инструменты

Пространства имён

Варианты

Просмотры

Ещё

Поиск

Навигация

Инструменты