Библиотека DBSCAN помогает обнаруживать выбросы в многомерных наборах данных путём группировки вместе плотно упакованные точки (точки со многими соседними соседями). 3 При этом как выбросы помечаются точки, которые лежат поодиночке в областях с низкой плотностью (у которых ближайшие соседи слишком далеко). 3
DBSCAN учитывает два основных параметра для формирования кластера с ближайшей точкой данных и на основе региона с высокой или низкой плотностью обнаруживает выбросы: 1
После того, как в наборе данных не останется выбросов, каждый кластер будет точно описывать группу, на положение центра кластера не будут влиять выбросы и шумы, и можно будет лучше проводить анализ данных. 2