Стратифицированное разделение данных предполагает разделение генеральной совокупности на группы (страты) на основе определённого признака или признаков. 1 Чтобы эти группы были равновероятно представлены в выборке, берут случайным образом элементы из каждой группы с равной вероятностью. 1
Случайное разделение — это наиболее распространённый метод, при котором данные случайным образом делятся на тренировочные и тестовые наборы. 2 Обычно используется соотношение 70/30 или 80/20. 2 Этот метод прост в реализации и подходит для большинства задач. 2
Таким образом, основное отличие в том, что при случайном разделении отбираются элементы из генеральной совокупности случайным образом, а при стратифицированном — элементы из каждой группы (страты). 1