Глубина деревьев в случайном лесу должна быть ограничена при ансамблировании, потому что у неглубоких деревьев малое число параметров. education.yandex.ru Они способны запомнить только верхнеуровневые статистики обучающей подвыборки. education.yandex.ru Такие статистики во всех подвыборках будут похожи, но не очень подробно описывают целевую зависимость. education.yandex.ru Поэтому при изменении обучающей подвыборки предсказание на тестовом объекте будет стабильным, но не точным (низкая дисперсия, высокое смещение). education.yandex.ru
У глубоких деревьев нет проблем запомнить подвыборку подробно. education.yandex.ru Поэтому предсказание на тестовом объекте будет сильнее меняться в зависимости от обучающей подвыборки, но в среднем будет близко к истине (высокая дисперсия, низкое смещение). education.yandex.ru
Таким образом, рекомендуется использовать максимальную глубину деревьев, кроме случаев, когда объектов слишком много и получаются очень глубокие деревья, построение которых занимает значительное время. alexanderdyakonov.wordpress.com Неглубокие деревья рекомендуют использовать в задачах с большим числом шумовых объектов (выбросов). alexanderdyakonov.wordpress.com