Разница между MSE и RMSLE при оценке регрессионных моделей заключается в подходе к измерению ошибки:
- MSE (средняя квадратическая ошибка) — среднее значение квадратов ошибок между прогнозируемыми и фактическими значениями. 3 Эту метрику используют, если большие ошибки недопустимы и должны сильно влиять на модель. 2 Она чувствительна к выбросам, так как ошибка возрастает квадратично. 2
- RMSLE (логарифмическая среднеквадратическая ошибка) — метрика, в которой логарифмирование позволяет сделать величину ошибки более устойчивой, когда разность между фактическим и предсказанным значениями различается на порядок и выше. 1 При этом может быть затруднена интерпретация из-за нелинейности. 1
Таким образом, RMSE предпочтительнее MSE в линейной регрессии, потому что он находится в тех же единицах измерения, что и переменная ответа, что упрощает интерпретацию. 3