Высокое значение R-квадрата (коэффициента детерминации) не всегда указывает на хорошую модель прогнозирования по нескольким причинам:
- Автоматическое увеличение при добавлении предикторов. sky.pro Значение R-квадрата никогда не уменьшается при добавлении новых переменных, даже если они не имеют реальной предиктивной силы. sky.pro
- Нечувствительность к переобучению. sky.pro Высокое значение R-квадрата может быть результатом переобучения модели, что снижает её обобщающую способность. sky.pro
- Ограниченная применимость для нелинейных моделей. sky.pro Для сложных нелинейных зависимостей R-квадрат может недооценивать реальное качество модели. sky.pro
- Проблемы с временными рядами. sky.pro Для временных данных высокое значение R-квадрата может быть следствием общих трендов, а не реальной взаимосвязи. sky.pro
- Чувствительность к выбросам. sky.pro Отдельные экстремальные наблюдения могут существенно искажать значение R-квадрата. sky.pro
Кроме того, высокие значения R-квадрата не свидетельствуют о наличии причинно-следственной зависимости между переменными. books.econ.msu.ru ru.wikipedia.org
Таким образом, R-квадрат должен рассматриваться как один из компонентов более широкой стратегии оценки моделей. sky.pro