Вопросы к Поиску с Алисой
Основное отличие обучения с подкреплением от контролируемого обучения заключается в подходе к обучению и в том, как система получает информацию. www.sap.com
Контролируемое обучение («обучение с учителем») предполагает использование ИИ всего изученного в прошлом к новым данным. www.zeluslugi.ru Для предсказания будущих событий используются помеченные пользователем примеры. www.zeluslugi.ru Машина получает ключ к ответу и учится путём нахождения корреляций между всеми правильными результатами. www.sap.com
Обучение с подкреплением не включает ключ к ответу, а вводит набор допустимых действий, правил и потенциальных конечных состояний. www.sap.com Система учится при помощи опыта и вознаграждения. www.sap.com В моделях обучения с подкреплением «вознаграждение» является числовым и запрограммировано в алгоритме как нечто, что система стремится собрать. www.sap.com
Таким образом, контролируемое обучение ориентировано на работу с помеченными данными, а обучение с подкреплением — на решение задач, где желаемый результат является изменчивым и система должна учиться при помощи опыта и взаимодействия с окружающей средой. www.sap.com www.ultralytics.com