Алгоритм DBSCAN считается устойчивым к выбросам в данных, потому что он способен хорошо находить шумы и выбросы. 1 Это происходит в тех случаях, когда точку невозможно отнести ни к какому из существующих кластеров, то есть в окрестности данной точки находится мало точек-соседей. 1
Способность алгоритма находить выбросы можно использовать для фильтрации этих самых выбросов. 1 После того, как в наборе данных не останется выбросов, каждый кластер будет точно описывать группу, на положение центра кластера не будут влиять выбросы и шумы, и можно будет лучше проводить анализ данных. 1
Кроме того, DBSCAN создаёт окружность эпсилон-радиуса вокруг каждой точки данных и классифицирует их на базовую точку, граничную точку и шум. 4 Точка данных является центральной, если круг вокруг неё не менее minPoints точек. 4 Если количество точек меньше minPoints, то оно классифицируется как граничная точка, а если нет других точек в пределах эпсилон-радиуса, то точка рассматривается как шум. 4