Вопросы к Поиску с Алисой
Разница между винсоризацией и стандартной обработкой данных заключается в подходе к обработке выбросов — значений, которые находятся «далеко за пределами» основной массы данных. en.wikipedia.org
Винсоризация предполагает замену экстремальных значений на менее экстремальные. fastercapital.com Например, при 90%-ной винсоризации все данные ниже 5-го процентиля будут равны 5-му процентилю, а все данные выше 95-го процентиля — 95-му процентилю. en.wikipedia.org
Стандартная обработка может включать и другие методы, например, обрезку. fastercapital.com Она предполагает удаление определённого процента точек данных с обоих концов распределения. fastercapital.com
Таким образом, винсоризация предпочтительнее, если нужно сохранить все данные, но смягчить влияние выбросов, а обрезка — когда можно позволить себе потерять некоторые данные без ущерба для анализа. fastercapital.com