Вопросы к Поиску с Алисой
Чтобы обнаружить объекты-выбросы в алгоритме AdaBoost, можно отсеивать объекты с большими значениями весов. proproprogs.ru Вес объекта постепенно увеличивается, если он плохо обрабатывается композицией и, скорее всего, является шумовым. proproprogs.ru Поэтому при дальнейшем обучении последующих алгоритмов такие объекты рекомендуется просто отбрасывать. proproprogs.ru
Также для общего обнаружения выбросов в числовых величинах можно использовать график BoxPlot. yandex.ru Он подходит, если нужно проверить наличие выбросов в данных, где есть числовые величины. yandex.ru
Ещё одна проблема, с которой сталкивается AdaBoost при наличии значительного уровня шума в исходных данных, — переобучение. dspace.tltsu.ru Экспоненциальная функция потерь присваивает слишком высокие веса наиболее трудным объектам, на которых ошибаются большинство базовых алгоритмов. dspace.tltsu.ru Чаще всего именно эти объекты оказываются шумовыми выбросами, в результате чего AdaBoost начинает обучать на шум, что ведёт к переобучению. dspace.tltsu.ru Проблема решается путём уменьшения числа выбросов или применения более мягких функций потерь. dspace.tltsu.ru