Вопросы к Поиску с Алисой
Возможно, имелись в виду различия между обучением без учителя (самообучением) и обучением с подкреплением.
Обучение без учителя (самообучение, unsupervised learning) заключается в том, что нейросеть получает на входе неразмеченные данные и старается сама найти в них общие признаки и связи. practicum.yandex.ru Модель пытается самостоятельно найти корреляции в данных, извлекая полезные признаки и анализируя их. neurohive.io
Обучение с подкреплением (reinforcement learning) предполагает, что нейронная сеть получает входные данные и случайным образом их обрабатывает. practicum.yandex.ru Потом результат её работы оценивают по определённым критериям. practicum.yandex.ru Нейросеть видит эти критерии и в следующий раз обрабатывает данные так, чтобы им соответствовать. practicum.yandex.ru Для этого не нужен учитель или специальный обучающий набор данных — только чёткие задачи и критерии оценки их выполнения. practicum.yandex.ru
Таким образом, основное отличие заключается в том, что при обучении без учителя нет явных указаний, что делать с данными, а при обучении с подкреплением алгоритм обучают при помощи системы поощрений: за правильные действия агент получает награду. neurohive.io