Стратифицированное разделение выборки отличается от случайного тем, что при стратифицированном разделении учитываются классы данных, а при случайном — нет. 2
Случайное разделение проводится с использованием функции случайной генерации. 2 Этот метод позволяет быстро разделить даже большие наборы данных. 2 Однако если в наборе есть несбалансированные классы, данные могут быть распределены между выборками неравномерно. 2
Стратифицированное разделение предполагает, что перед случайным отбором данные делят на подгруппы по определённому признаку. 2 Затем из каждой группы выбирают пропорциональное количество записей. 2 Такой тип деления помогает сохранить сбалансированность классов. 2
Кроме того, стратифицированная выборка позволяет получить более точные результаты, чем простая случайная выборка (при одинаковом размере выборки). 3 Это связано с тем, что дисперсия внутри слоёв меньше, чем дисперсия совокупности в целом. 3