Разница между обучающей и тестовой выборками данных заключается в их назначении:
- Обучающая выборка — это данные, которые используют, чтобы обучить модель, настроить параметры и найти закономерности. 1 Она должна быть достаточно большой и разнообразной, чтобы модель могла хорошо «научиться». 1
- Тестовая выборка — это данные, которые используют для контроля и оценки производительности. 1 Результаты на тестовой выборке показывают, насколько хорошо модель будет работать в реальных условиях. 1 Тестовая выборка полностью независимая от обучающей, она не участвует в процессе обучения. 24
Обычно данные делятся в пропорции 70–80% на обучение и 20–30% на тестирование. 3