Вклад участника
(новейшие | старейшие) Просмотреть (50 более новых | 50 более старых) (20 | 50 | 100 | 250 | 500)
- 13:49, 28 января 2019 (разн. | история) . . (+93) . . Методы policy gradient и алгоритм асинхронного актора-критика (→Алгоритм актора-критика с преимуществом)
- 13:47, 28 января 2019 (разн. | история) . . (+5) . . Методы policy gradient и алгоритм асинхронного актора-критика (→Использование будущего выигрыша вместо полного выигрыша)
- 13:47, 28 января 2019 (разн. | история) . . (+10) . . Методы policy gradient и алгоритм асинхронного актора-критика (→Алгоритм актора-критика с преимуществом)
- 13:45, 28 января 2019 (разн. | история) . . (+45) . . Методы policy gradient и алгоритм асинхронного актора-критика (→Алгоритм Actor-Critic)
- 13:44, 28 января 2019 (разн. | история) . . (+473) . . Методы policy gradient и алгоритм асинхронного актора-критика
- 05:52, 28 января 2019 (разн. | история) . . (+2612) . . Методы policy gradient и алгоритм асинхронного актора-критика
- 04:52, 28 января 2019 (разн. | история) . . (0) . . Н Файл:Actor-critic-nn.png (текущая)
- 04:50, 28 января 2019 (разн. | история) . . (+7609) . . Методы policy gradient и алгоритм асинхронного актора-критика
- 04:29, 28 января 2019 (разн. | история) . . (0) . . Н Файл:Async-actor-critic.png (текущая)
- 22:22, 25 января 2019 (разн. | история) . . (+947) . . Методы policy gradient и алгоритм асинхронного актора-критика
- 20:53, 25 января 2019 (разн. | история) . . (-69) . . Методы policy gradient и алгоритм асинхронного актора-критика
- 20:50, 25 января 2019 (разн. | история) . . (-18 212) . . Обучение с подкреплением
- 20:50, 25 января 2019 (разн. | история) . . (+18 361) . . Н Методы policy gradient и алгоритм асинхронного актора-критика (Новая страница: «== Policy gradient и алгоритм Actor-Critic == В алгоритме Q-learning агент обучает функцию полезности дейст…»)
- 20:48, 25 января 2019 (разн. | история) . . (+107) . . Машинное обучение (→Обучение с подкреплением)
- 01:59, 25 января 2019 (разн. | история) . . (+57) . . Н Категория:Обучение с подкреплением (Новая страница: «Категория: Машинное обучение») (текущая)
- 01:57, 25 января 2019 (разн. | история) . . (+130) . . Обучение с подкреплением
- 14:46, 24 января 2019 (разн. | история) . . (+2) . . Обучение с подкреплением (→Алгоритм Actor-Critic)
- 14:44, 24 января 2019 (разн. | история) . . (+4) . . Обучение с подкреплением (→Использование будущего выигрыша вместо полного выигрыша)
- 04:07, 24 января 2019 (разн. | история) . . (+4191) . . Обучение с подкреплением
- 02:17, 24 января 2019 (разн. | история) . . (+4001) . . Обучение с подкреплением
- 00:03, 24 января 2019 (разн. | история) . . (+1997) . . Обучение с подкреплением
- 21:24, 23 января 2019 (разн. | история) . . (+1564) . . Обучение с подкреплением
- 20:53, 23 января 2019 (разн. | история) . . (0) . . Н Файл:Policy-gradient-trajectories.png (текущая)
- 18:20, 23 января 2019 (разн. | история) . . (+55) . . Н Файл:Policy-gradient-reinforce.png (Схема policy gradient алгоритма REINFORCE) (текущая)
- 18:17, 23 января 2019 (разн. | история) . . (+2739) . . Обучение с подкреплением
- 16:46, 23 января 2019 (разн. | история) . . (+3714) . . Обучение с подкреплением
- 17:32, 16 июня 2015 (разн. | история) . . (-4064) . . Теорема о базах (Убрал все ненужные леммы)
- 17:20, 16 июня 2015 (разн. | история) . . (+141) . . Оператор замыкания для матроидов (→Источники информации)
- 17:19, 16 июня 2015 (разн. | история) . . (+917) . . Оператор замыкания для матроидов (Дополнительное свойство замыкания)
- 17:00, 16 июня 2015 (разн. | история) . . (+2066) . . Оператор замыкания для матроидов (Альтернативное определение оператора замыкания)
- 19:53, 15 июня 2015 (разн. | история) . . (+141) . . Теорема о базах (→Источники информации)
- 18:31, 15 июня 2015 (разн. | история) . . (+34) . . Теорема о базах
- 18:20, 15 июня 2015 (разн. | история) . . (+4862) . . Теорема о базах (Сильная теорема о базах дописана)
- 14:41, 15 июня 2015 (разн. | история) . . (+1185) . . Теорема о базах (Лемма о циклах)
- 00:04, 12 июня 2015 (разн. | история) . . (+783) . . Теорема о базах
- 22:41, 11 июня 2015 (разн. | история) . . (+89) . . Теорема о базах (Добавлены см. также)
- 22:38, 11 июня 2015 (разн. | история) . . (+366) . . Теорема о базах (Добавлены источники)
- 21:51, 11 июня 2015 (разн. | история) . . (+21) . . Теорема о базах (Добавлен английский термин)
- 21:27, 11 июня 2015 (разн. | история) . . (+48) . . Теорема о базах (Обернул множество баз в mathcal)
- 16:12, 14 июня 2014 (разн. | история) . . (-138) . . СНМ с операцией удаления за О(1)
- 16:05, 14 июня 2014 (разн. | история) . . (0) . . СНМ с операцией удаления за О(1) (→Реализация операции Find)
- 16:05, 14 июня 2014 (разн. | история) . . (0) . . СНМ с операцией удаления за О(1) (→Выводы)
- 12:38, 14 июня 2014 (разн. | история) . . (+180) . . СНМ с операцией удаления за О(1)
- 12:34, 14 июня 2014 (разн. | история) . . (+60) . . СНМ с операцией удаления за О(1) (→Анализ операции DeleteLeaf)
- 12:32, 14 июня 2014 (разн. | история) . . (+50) . . СНМ с операцией удаления за О(1) (→Основные положения)
- 12:21, 14 июня 2014 (разн. | история) . . (+46) . . СНМ с операцией удаления за О(1)
- 12:19, 14 июня 2014 (разн. | история) . . (+6) . . СНМ с операцией удаления за О(1) (→Find)
- 12:19, 14 июня 2014 (разн. | история) . . (+12) . . СНМ с операцией удаления за О(1) (→Модификации для 2-го соображения)
- 12:19, 14 июня 2014 (разн. | история) . . (+6) . . СНМ с операцией удаления за О(1) (→Идея)
- 12:18, 14 июня 2014 (разн. | история) . . (+6) . . СНМ с операцией удаления за О(1) (→Введение)
(новейшие | старейшие) Просмотреть (50 более новых | 50 более старых) (20 | 50 | 100 | 250 | 500)