Чтобы обнаружить объекты-выбросы в алгоритме AdaBoost, можно отсеивать объекты с большими значениями весов. 3 Вес объекта постепенно увеличивается, если он плохо обрабатывается композицией и, скорее всего, является шумовым. 3 Поэтому при дальнейшем обучении последующих алгоритмов такие объекты рекомендуется просто отбрасывать. 3
Также для общего обнаружения выбросов в числовых величинах можно использовать график BoxPlot. 1 Он подходит, если нужно проверить наличие выбросов в данных, где есть числовые величины. 1
Ещё одна проблема, с которой сталкивается AdaBoost при наличии значительного уровня шума в исходных данных, — переобучение. 2 Экспоненциальная функция потерь присваивает слишком высокие веса наиболее трудным объектам, на которых ошибаются большинство базовых алгоритмов. 2 Чаще всего именно эти объекты оказываются шумовыми выбросами, в результате чего AdaBoost начинает обучать на шум, что ведёт к переобучению. 2 Проблема решается путём уменьшения числа выбросов или применения более мягких функций потерь. 2