Разница между реализациями градиентного бустинга в sklearn и XGBoost заключается в следующих особенностях:
Кроме того, XGBoost более эффективен в использовании памяти и использует вторую производную для нахождения оптимальной константы в каждом терминальном узле, в то время как стандартная реализация использует только первую производную. 1