Индекс Данна считается одной из метрик качества кластеризации, потому что позволяет сравнивать различные варианты кластеризации и определять, какое разбиение на число кластеров даёт наиболее достоверную и выраженную группировку. 2
Индекс Данна сравнивает межкластерное расстояние с диаметром кластера. 1 Считается, что если диаметр кластера мал по сравнению с межкластерным расстоянием, то кластеры полученной структуры достаточно компактны и отделимы. 1 Следовательно, чем больше значение индекса, тем лучше кластеризация. 1
Однако у индекса Данна есть и недостатки: он чувствителен к шуму и выбросам в данных. 1 Чтобы устранить эту погрешность, были созданы модификации индекса, которые касаются измерения межкластерного расстояния. 1
Для повышения эффективности в оценке качества кластеризации и получения объективного результата лучше пользоваться не одним индексом, а их совокупностью. 1