Проверка распределения остатков в линейной регрессии важна, потому что это позволяет оценить, выполняются ли условия применимости модели. 5 Вот некоторые из них:
- Правильный выбор модели. 1 Остатки модели относительно её прогнозных значений должны быть распределены случайным образом без систематической составляющей. 1 График остатков показывает выбросы в данных. 1
- Нормальность распределения остатков. 15 Среднее значение остатков должно быть равно нулю. 1 Если это не так, то модель регулярно недооценивает фактические значения (если среднее значение меньше нуля) или переоценивает (если среднее больше нуля). 1
- Гомоскедастичность остатков. 14 Одинаковая изменчивость остатков предполагает, что дисперсия остатков не изменяется для различных наблюдений. 1 Гетероскедастичность остатков показывает, что модель ошибается сильнее при более высоких или более низких значениях признаков. 1
Проверить нормальность остатков можно визуально с помощью гистограммы или критериев нормальности распределения. 1