Обучающая выборка играет важную роль в настройке гиперпараметров модели, так как на ней модель учится, настраивает параметры и находит закономерности. 2
Обучающая выборка должна быть достаточно большой и разнообразной, чтобы модель могла хорошо «научиться». 2
Некоторые особенности роли обучающей выборки:
- Если использовать всю обучающую выборку для подбора гиперпараметров, можно переоценить производительность модели на тестовых данных. 4
- Важно сбалансировать между «подгонкой» модели под обучающие данные (переобучение) и слишком обобщённым представлением, которое может упустить важные закономерности (недообучение). 5
- Если модель будет слишком простой, она будет показывать недостаточную точность из-за того, что у неё не хватает выразительной способности описать реальную зависимость. 3
- Если же модель будет слишком сложной, она начнёт перенастраиваться на особенности реализации обучающей выборки, что также негативно повлияет на её обобщающую способность на тестовых данных. 3