K-блочная кросс-валидация (K-Fold Cross-Validation). blog.skillfactory.ru sky.pro Данные делятся на несколько равных частей (К): одна используется для проверки, остальные — для обучения. blog.skillfactory.ru Процесс повторяется столько раз, на сколько частей поделили данные. blog.skillfactory.ru После окончания обучения результаты тестов приводят к среднему значению. blog.skillfactory.ru
Оставить-P-выборок (Leave-P-Out Cross-Validation). blog.skillfactory.ru sky.pro При этом типе валидации в каждой итерации из датасета удаляется P объектов для тестирования, а остальные используются для обучения. blog.skillfactory.ru Процесс повторяется со всеми возможными комбинациями. blog.skillfactory.ru
Кросс-валидация на временных рядах (Time Series Cross-Validation). blog.skillfactory.ru В отличие от обычной K-блочной кросс-валидации, где данные делятся случайным образом на обучающие и тестовые группы, здесь учитывается их временная структура. blog.skillfactory.ru Главная сложность в том, что данные не должны пересекаться по времени: тренировочные данные должны идти строго до тестовых. blog.skillfactory.ru
Вложенная кросс-валидация (Nested CV). dzen.ru Это комбинация k-Fold и Hold-Out: набор сначала делится на несколько подмножеств. dzen.ru Затем производится удерживающая проверка для каждого подмножества. dzen.ru
Бутстрэп (Bootstrap Cross-Validation — BS CV). dzen.ru Выбирает записи случайным образом. dzen.ru В каждом подмножестве есть повторения из-за случайности выбора. dzen.ru Итоговая эффективность — это среднее всех итераций. dzen.ru
Примеры полезных ответов Поиска с Алисой на вопросы из разных сфер. Вопросы сгенерированы нейросетью YandexGPT для актуальных тем, которые определяются на базе обобщённых запросов к Поиску с Алисой.