Алгоритм Random Forest («случайный лес») считается устойчивым к переобучению, потому что в нём каждое дерево строится независимо друг от друга на разных подвыборках обучающих данных. 1
При этом при обучении каждого дерева используются разные комбинации признаков объектов, для которых делается предсказание, — поэтому деревья не похожи друг на друга. 1 Благодаря разнообразию деревьев можно повысить точность предсказания относительно точности отдельного дерева. 1
Кроме того, при тестировании результат выводится путём усреднения прогнозов, полученных от каждого дерева. 2 Это устраняет смещения и делает итоговое выходное значение достаточно точным и устойчивым к отдельным выбросам. 4