Вопросы к Поиску с Алисой
Stratified K-Fold считается улучшенной версией K-Fold, потому что она решает проблему, связанную с распределением классов в несбалансированных наборах данных. skvorets.ru apxml.com
В стандартном K-Fold данные распределяются в фолды случайным образом. apxml.com Это может привести к тому, что в некоторых фолдах не будет примеров одного из классов. apxml.com Например, если в наборе данных 95% примеров одного класса и 5% — другого, то в одном из фолдов не окажется ни одного примера второго класса. skvorets.ru
Stratified K-Fold сначала группирует данные по метке класса, а затем пропорционально выбирает примеры из каждого класса для создания фолдов. apxml.com Это гарантирует, что представление классов сохранится в подмножествах для обучения и проверки, которые создаются на каждой итерации процесса кросс-валидации. apxml.com
Таким образом, Stratified K-Fold помогает обеспечить, чтобы модель обучалась на репрезентативных данных, что предотвращает проблемы с недостаточной выборкой для менее распространённых классов. skvorets.ru