Вопросы к Поиску с Алисой
Вычислительная сложность — основная проблема большинства методов кросс-валидации. blog.skillfactory.ru
Когда процесс разделения данных на обучающую и тестовую выборки повторяется несколько раз, это требует больших ресурсов — временных и системных. blog.skillfactory.ru Если данных слишком много или модель довольно сложная, такой метод может занять много времени, что в реальной жизни не всегда удобно. blog.skillfactory.ru
Ещё одна проблема кросс-валидации — зависимость от случайности. skvorets.ru Результат зависит от того, какие именно данные попадут в тренировочную и тестовую выборки. skvorets.ru Если выборка данных мала, то результат может сильно варьироваться в зависимости от того, как именно они были разделены. skvorets.ru
Кроме того, кросс-валидация не всегда даёт точную оценку производительности модели, если данные сильно зависят от времени или последовательности. skvorets.ru Например, в задачах прогнозирования временных рядов или в анализе потоков данных, когда порядок примеров имеет значение, случайное разделение данных может привести к искажению оценки модели. skvorets.ru