Некоторые методы кросс-валидации для временных рядов:
- Перекрёстная проверка сгруппированных временных рядов. 1 Данные разделяют на группы в зависимости от определённых критериев (например, географии, сегмента клиентов). 1 Каждую группу используют в качестве тестового набора, а остальные данные служат в качестве обучающего набора. 1
- Перекрёстная проверка очищенных временных рядов. 1 Этот подход применяют при работе с финансовыми временными рядами, которые часто содержат события, способные исказить оценку эффективности модели. 1 При таком методе устраняют все точки данных, которые возникают в течение определённого временного диапазона (например, через 5 дней) после события. 1
- Метод скользящего окна. 3 Например, если есть ежедневные данные за год, то для обучения и проверки используют месяц. 3 Сначала для обучения берут данные января, а для проверки — февраля, затем для обучения — февраль, для проверки — март и так далее. 3
- Метод вставки зазора между обучением и проверкой. 3 Его используют, когда данные недоступны сразу или нужно использовать самые последние из них для оценки обученной модели. 3
- TimeSeriesSplit. 23 Это вариация k-фолда, которая возвращает первые k фолдов в качестве обучающего набора, а (k+1)-й фолд — в качестве тестового набора. 2
Главная сложность кросс-валидации на временных рядах в том, что данные не должны пересекаться по времени: тренировочные данные должны идти строго до тестовых. 45