Разница между bagging и random forest заключается в том, как происходит обучение деревьев решений. 24
Bagging предполагает обучение нескольких деревьев решений на bootstrap-образцах обучающего набора. 2 Для каждой модели в ансамбле используется разная случайная подгруппа исходного датасета. 5 При этом для принятия решения о лучшем разбиении на уровне узла в алгоритме bagging используются все признаки. 4
Random forest — это вариация bagging, в которой в качестве базовых моделей используются деревья решений. 3 При обучении каждого дерева используется случайная подгруппа обучающих данных и случайная подгруппа признаков. 3 При этом во время предсказания алгоритм random forest агрегирует прогнозы всех индивидуальных деревьев решений, чтобы сделать окончательное предсказание с более высокой точностью и контролировать переобучение. 3