Некоторые методы и метрики оценки модели, которые должен знать каждый:
- Кросс-валидация. 37 Метод оценки производительности модели путём разделения данных на несколько частей, обучения модели на одной части и тестирования на другой. 7 Помогает учесть вариабельность в данных и предотвратить переобучение. 3
- Кривые обучения и валидации. 3 Позволяют оценить, как качество модели меняется в зависимости от размера обучающей выборки. 3
- Матрица ошибок (Confusion Matrix). 34 Полезна для задач классификации, позволяет визуализировать количество и тип ошибок, сделанных моделью. 3 Из неё можно вычислить точность, полноту, специфичность и другие метрики. 3
- Кривая ROC и площадь под кривой ROC (AUC-ROC). 3 Эти метрики используются для задач бинарной классификации и измеряют способность модели различать классы и минимизировать ложно положительные и ложно отрицательные предсказания. 3
- Для задач регрессии: среднеквадратичная ошибка (MSE) — среднее значение квадрата разницы между прогнозами модели и фактическими значениями; средняя абсолютная ошибка (MAE) — среднее абсолютное значение разницы между прогнозами модели и фактическими значениями; R-квадрат (R2) — измеряет объяснённую моделью дисперсию данных. 3
- Для задач классификации: точность (Accuracy) — доля правильных ответов модели среди всех предсказаний; точность (Precision) — доля истинно положительных ответов среди всех положительных ответов модели; полнота (Recall) — доля истинно положительных ответов среди всех правильных ответов; F1-мера — гармоническое среднее между точностью и полнотой. 13
Выбор подходящей метрики зависит от типа задачи, особенностей данных и целей проекта. 8