Для выбора числа k для алгоритма кластеризации «метод k-средних», не смотря на кластеры, можно использовать два метода: 1
- «Метод локтя». 14 Строится график зависимости функции потерь от количества кластеров k. 1 Если представить, что график — это «рука», то лучшее значение количества кластеров будет там, где «локоть» этой «руки». 1
- Метод силуэта. 1 Этот метод использует «рейтинг силуэта», находящийся в диапазоне от -1 до 1 для каждого количества кластеров. 1 Количество кластеров с максимальным рейтингом обычно является оптимальным. 1
Также можно последовательно увеличивать количество кластеров, прогонять через модель и анализировать внутрикластерное расстояние. 2 Как только расстояние стабилизируется, это и будет оптимальное решение по количеству классов. 2