Вклад участника
28 января 2019
Методы policy gradient и алгоритм асинхронного актора-критика
Алгоритм актора-критика с преимуществом
+93
Методы policy gradient и алгоритм асинхронного актора-критика
Использование будущего выигрыша вместо полного выигрыша
+5
Методы policy gradient и алгоритм асинхронного актора-критика
Алгоритм актора-критика с преимуществом
+10
Методы policy gradient и алгоритм асинхронного актора-критика
Алгоритм Actor-Critic
+45
Методы policy gradient и алгоритм асинхронного актора-критика
Нет описания правки
+473
Методы policy gradient и алгоритм асинхронного актора-критика
Нет описания правки
+2612
Файл:Actor-critic-nn.png
Нет описания правки
Методы policy gradient и алгоритм асинхронного актора-критика
Нет описания правки
+7609
Файл:Async-actor-critic.png
Нет описания правки
25 января 2019
Методы policy gradient и алгоритм асинхронного актора-критика
Нет описания правки
+947
Методы policy gradient и алгоритм асинхронного актора-критика
Нет описания правки
-69
Обучение с подкреплением
Нет описания правки
-18 212
Методы policy gradient и алгоритм асинхронного актора-критика
Новая страница: «== Policy gradient и алгоритм Actor-Critic == В алгоритме Q-learning агент обучает функцию полезности дейст…»
Машинное обучение
Обучение с подкреплением
+107
Категория:Обучение с подкреплением
Новая страница: «Категория: Машинное обучение»
Обучение с подкреплением
Нет описания правки
+130
24 января 2019
Обучение с подкреплением
Алгоритм Actor-Critic
+2
Обучение с подкреплением
Использование будущего выигрыша вместо полного выигрыша
+4
Обучение с подкреплением
Нет описания правки
+4191
Обучение с подкреплением
Нет описания правки
+4001
Обучение с подкреплением
Нет описания правки
+1997
23 января 2019
Обучение с подкреплением
Нет описания правки
+1564
Файл:Policy-gradient-trajectories.png
Нет описания правки
Файл:Policy-gradient-reinforce.png
Схема policy gradient алгоритма REINFORCE
Обучение с подкреплением
Нет описания правки
+2739
Обучение с подкреплением
Нет описания правки
+3714
16 июня 2015
Теорема о базах
Убрал все ненужные леммы
-4064
Оператор замыкания для матроидов
Источники информации
+141
Оператор замыкания для матроидов
Дополнительное свойство замыкания
+917
Оператор замыкания для матроидов
Альтернативное определение оператора замыкания
+2066
15 июня 2015
Теорема о базах
Источники информации
+141
Теорема о базах
Нет описания правки
+34
Теорема о базах
Сильная теорема о базах дописана
+4862
Теорема о базах
Лемма о циклах
+1185
12 июня 2015
11 июня 2015
Теорема о базах
Добавлены см. также
+89
Теорема о базах
Добавлены источники
+366
Теорема о базах
Добавлен английский термин
+21
Теорема о базах
Обернул множество баз в mathcal
+48
14 июня 2014
СНМ с операцией удаления за О(1)
Нет описания правки
-138
СНМ с операцией удаления за О(1)
Реализация операции Find
СНМ с операцией удаления за О(1)
Выводы
СНМ с операцией удаления за О(1)
Нет описания правки
+180
СНМ с операцией удаления за О(1)
Анализ операции DeleteLeaf
+60
СНМ с операцией удаления за О(1)
Основные положения
+50
СНМ с операцией удаления за О(1)
Нет описания правки
+46
СНМ с операцией удаления за О(1)
Find
+6
СНМ с операцией удаления за О(1)
Модификации для 2-го соображения
+12
СНМ с операцией удаления за О(1)
Идея
+6
СНМ с операцией удаления за О(1)
Введение
+6