Разрыв между фактическими и предсказанными значениями в регрессии может возникать по нескольким причинам:
- Невозможность линейной функции достаточно хорошо описать данные. 1 Например, если данные имеют сильный разброс относительно линии регрессии. 1
- Влияние выбросов. 4 Выбросы оказывают огромное влияние на регрессию. 4
- Наличие внешних переменных. 2 Если в модель не включены существенные переменные, они могут оказывать значительное влияние на переменные, которые учтены в модели, что делает результаты нестабильными. 2
- Зависимость наблюдений. 2 Если наблюдения влияют друг на друга, это делает значения параметров нестабильными и приводит к тому, что модель не может описать все данные в целом. 2
Для оценки величины разрыва между фактическими и предсказанными значениями используются метрики, такие как среднеквадратичная ошибка (RMSE) и средняя абсолютная ошибка (MAE). 1