Разница между внутренними и внешними метриками оценки кластеризации заключается в том, что внутренние метрики оценивают качество кластеризации, основываясь только на наборе данных, без использования какой-либо внешней информации. 34 Внешние метрики используют информацию об истинном разбиении на кластеры, сравнивая результат кластеризации с заранее известным разделением на классы. 25
Таким образом, внутренние метрики помогают выбрать оптимальное количество кластеров, определить их значимость и устойчивость, в то время как внешние метрики позволяют оценить, являются ли кластеры значимыми и могут ли они использоваться для прогнозирования результатов и принятия решений. 1
В качестве метрик для внутренней оценки используются, например, индекс Калинского-Харабаша, индекс Дэвиса-Болдина и коэффициент силуэта. 1 Для внешней оценки применяются такие метрики, как точность, прецизионность, запоминание и F1 score. 1