Обучающая выборка играет важную роль в настройке гиперпараметров модели, так как на ней модель учится, настраивает параметры и находит закономерности. blog.skillfactory.ru
Обучающая выборка должна быть достаточно большой и разнообразной, чтобы модель могла хорошо «научиться». blog.skillfactory.ru
Некоторые особенности роли обучающей выборки:
- Если использовать всю обучающую выборку для подбора гиперпараметров, можно переоценить производительность модели на тестовых данных. 4brain.ru
- Важно сбалансировать между «подгонкой» модели под обучающие данные (переобучение) и слишком обобщённым представлением, которое может упустить важные закономерности (недообучение). habr.com
- Если модель будет слишком простой, она будет показывать недостаточную точность из-за того, что у неё не хватает выразительной способности описать реальную зависимость. deepmachinelearning.ru
- Если же модель будет слишком сложной, она начнёт перенастраиваться на особенности реализации обучающей выборки, что также негативно повлияет на её обобщающую способность на тестовых данных. deepmachinelearning.ru