Некоторые преимущества алгоритма DBSCAN по сравнению с другими методами кластеризации:
- Не требует заранее указывать количество кластеров, в отличие от метода k-средних. 14
- Может находить кластеры произвольной формы, в том числе полностью окружённые (но не связанные с) другими кластерами. 14
- Устойчив к выбросам. 13
- Требует лишь двух параметров и большей частью нечувствителен к порядку точек в базе данных. 14
- Разработан для применения с базами данных, которые позволяют ускорить запросы в диапазоне значений, например, с помощью R*-дерева. 14
Некоторые недостатки алгоритма DBSCAN:
- Не полностью однозначен — краевые точки, которые могут быть достигнуты из более чем одного кластера, могут принадлежать любому из этих кластеров, что зависит от порядка просмотра точек. 14
- Качество DBSCAN зависит от измерения расстояния, используемого в функции regionQuery(P,ε). 14 Для кластеризации данных высокой размерности наиболее часто используемая метрика расстояний (евклидова) может оказаться почти бесполезной. 14
- DBSCAN не может хорошо кластеризовать наборы данных с большой разницей в плотности, поскольку не удаётся выбрать приемлемую для всех кластеров комбинацию параметров. 14