Разница между обучением с учителем и обучением с подкреплением заключается в подходе к обучению:
- Обучение с учителем предполагает, что модель обучается на размеченных данных, то есть каждый обучающий пример в наборе данных имеет соответствующую метку или целевое значение. 4 Цель модели — научиться предсказывать метки для новых, невиданных данных. 4
- Обучение с подкреплением — это тип машинного обучения, при котором агент обучается взаимодействовать с окружающей средой, чтобы максимизировать некоторую целевую функцию или награду. 4 Агент принимает решения, выполняет действия и получает обратную связь в виде награды или наказания. 4
Таким образом, при обучении с учителем модель обучается на основе заранее размеченных данных, а при обучении с подкреплением — через взаимодействие с окружающей средой, получая за каждое действие оценку (награду или наказание). 14