Статистические выбросы негативно влияют на результаты регрессионного анализа. 1 Они могут искажать регрессионную зависимость и препятствовать её обнаружению. 5
Если выбросы единичны, то в этом нет большой угрозы для моделирования. 3 Хуже, если выбросов много, особенно если они двух или более переменных образуют общее скопление. 3
Для обработки таких наблюдений в регрессионном анализе используют три подхода: 3
- Фиксация и удаление выбросов с помощью Анализа Кластеров и Выбросов до проведения регрессионного анализа. 3
- Выполнение Множественной Линейной Регрессии с включением всех данных и созданием стандартизированного графика остатков, на котором можно проследить как выбросы, так и точки с чрезмерным влиянием. 3 После удаления и тех, и других можно снова протестировать модель — если результаты будут улучшены, следует отказаться от наблюдений, содержащих выбросы и точки чрезмерного влияния. 3
- Применение робастной регрессии — одного из приёмов «надёжной статистики». 3