Изменения

Перейти к: навигация, поиск

Общие понятия

56 байт добавлено, 21:16, 24 января 2019
Нет описания правки
==== Обучение с подкреплением (англ. ''Reinforcement learning'') ====
{{main|Обучение с подкреплением}}
Частный случай обучения с учителем, сигналы подкрепления (правильности ответа) выдаются не учителем, а некоторой средой, с которой взаимодействует программа. Размеченность данных зависит от среды.
115
правок

Навигация