115
правок
Изменения
Нет описания правки
==== Обучение с подкреплением (англ. ''Reinforcement learning'') ====
{{main|Обучение с подкреплением}}
Частный случай обучения с учителем, сигналы подкрепления (правильности ответа) выдаются не учителем, а некоторой средой, с которой взаимодействует программа. Размеченность данных зависит от среды.