Отличие между различными методами иерархического кластерного анализа в SPSS заключается в способе вычисления расстояний между кластерами. 3
Некоторые методы и их особенности:
- «Межгрупповая связь» (Between-groups linkage). 3 Дистанция между кластерами равна среднему значению всех расстояний между всеми возможными парами точек из обоих кластеров. 3 Этот метод устанавливается по умолчанию. 3
- «Внутригрупповая связь» (Within-groups linkage). 3 Дистанция между двумя кластерами рассчитывается на основании всех возможных пар наблюдений, принадлежащих обоим кластерам, при этом учитываются пары наблюдений, образующиеся внутри кластеров. 3
- «Ближайший сосед» (Nearest neighbor). 3 Дистанция между двумя кластерами определяется как расстояние между парой наблюдений, расположенных друг к другу ближе всего, при этом каждое наблюдение берётся из своего кластера. 3
- «Самый дальний сосед» (Furthest neighbor). 3 Дистанция между двумя кластерами определяется как расстояние между самыми удалёнными друг от друга значениями наблюдений, при этом каждое наблюдение берётся из своего кластера. 3
- «Центроидная кластеризация» (Centroid clustering). 3 В обоих кластерах рассчитываются средние значения переменных, относящихся к ним наблюдений. 3 Затем расстояние между двумя кластерами рассчитывается как дистанция между двумя осредненными наблюдениями. 3
- «Медианная кластеризация» (Median clustering). 3 Тот же центроидный метод, но центр объединённого кластера вычисляется как среднее всех объектов. 3
- «Метод Варда» (Ward-Method). 3 Сначала в обоих кластерах для всех имеющихся наблюдений производится расчёт средних значений отдельных переменных. 3
Каждый из этих методов приводит к разной кластеризации, и нельзя однозначно сказать, какой из них лучший. 5 Например, если нужно найти кластеры в форме «цепи», то рекомендуется использовать методы «Межгрупповая связь» и «Ближайший сосед». 5 Если же нужно найти кластеры в форме «кластера», то лучше применять методы «Внутригрупповая связь» и «Самый дальний сосед». 5