Иерархическая кластеризация строит древовидную структуру кластеров и объединяет объекты на основе их близости. 35 Некоторые преимущества:
- не требует предварительного задания числа кластеров; 5
- подходит для визуализации с помощью дендрограмм. 5
Некоторые недостатки:
- высокая вычислительная сложность для больших наборов данных; 5
- трудно определять, на каком уровне дендрограммы резать для получения кластеров. 5
K-средних — метод кластеризации, который разбивает данные на k кластеров. 5 Некоторые преимущества: простота и скорость. 5
Некоторые недостатки:
- чувствительность к выбору начальных центров и числу кластеров; 5
- низкая точность на данных с несферической формой кластеров; 3
- плохо работает в случае, когда один кластер значительно больше остальных, и они находятся близко друг от друга — возникает эффект «расщепления» большого кластера. 4