Пример тестовых, тренировочных и валидационных данных в Data Science можно рассмотреть на примере временного ряда — котировок цены финансового актива в зависимости от времени торгов. 2 Для наглядности можно вытянуть все строки в горизонталь и разделить их на выборки. 2
Пример с датасетом из 10 000 строк: 2 сначала отделяют 1000 строк — тестовый набор. 2 Модель не должна тренироваться на этих строках, она будет на них проверяться. 2 Оставшиеся 9 000 строк разбивают на тренировочный и валидационный наборы. 2
Ещё один пример — датасет COCO, который состоит из 5000 изображений. 3 Из них выделяют 3500 изображений для тренировочного набора, 1000 изображений для валидационного набора и 500 изображений для тестового набора. 3