Основная идея метода k-средних (k-means) заключается в том, что кластеризация выполняется не за один раз. 1
Алгоритм работает так: 1
- Задают количество кластеров, которое нужно выделить в данных. 13
- Выбирают случайные центры кластеров для набора данных. 3
- Каждая точка данных присваивается к ближайшему центру кластера. 3 Это делается путём расчёта расстояния (обычно евклидова) между каждой точкой данных и каждым центром. 3
- Центры обновляются как среднее значение всех точек, принадлежащих каждому кластеру. 3
- Этот шаг повторяется до тех пор, пока центры не перестанут меняться или до достижения заданного критерия сходимости. 3
Цель алгоритма — минимизировать суммарное расстояние точек кластеров от их центров. 34