Вопросы к Поиску с Алисой
RobustScaler следует использовать вместо StandardScaler, когда в данных есть выбросы (крайние значения). proclusacademy.com stackoverflow.com
StandardScaler использует завышенные значения среднего и стандартного отклонения, которые увеличиваются из-за выбросов. proclusacademy.com Это уменьшает относительное расстояние между выбросами и другими точками данных. proclusacademy.com В результате при наличии выбросов StandardScaler даёт искажённое представление об исходном распределении. proclusacademy.com
RobustScaler не страдает от этого дефекта, так как устойчив к выбросам. proclusacademy.com Он не приводит данные строго к одному диапазону и не меняет структуру распределения, в частности не изменяет расстояние между основной массой данных и выбросами. www.dmitrymakarov.ru
Это происходит потому, что усреднение в RobustScaler происходит по разнице между третьим и первым квартилями, то есть робастными статистическими показателями. www.dmitrymakarov.ru