Некоторые основные различия между классификаторами K-ближайших соседей и соседями по радиусу:
Количество используемых примеров:
- Классификатор K-ближайших соседей (KNN) предполагает получение всего набора обучающих данных и его сохранение. ru.python-3.com Во время прогнозирования для каждого нового примера находятся K-ближайшие примеры в наборе обучающих данных. ru.python-3.com
- Классификатор соседей по радиусу (Radius Neighbours) находит все примеры в наборе обучающих данных, которые находятся в заданном радиусе от нового примера. ru.python-3.com
Применение:
- Классификатор K-ближайших соседей наиболее часто используемая техника. scikit-learn.ru Оптимальный выбор значения K сильно зависит от данных: в общем случае большее значение K подавляет влияние шума, но делает границы классификации менее чёткими. scikit-learn.ru
- Классификатор соседей по радиусу может быть более подходящим для задач прогнозирования, когда в пространстве признаков имеются разреженные области. ru.python-3.com Подход не позволяет примерам, которые находятся далеко в пространстве признаков, внести свой вклад в прогноз. ru.python-3.com
Таким образом, классификатор K-ближайших соседей лучше подходит для ситуаций, где важно учитывать определённое фиксированное количество примеров, а классификатор соседей по радиусу — для случаев, когда желательно, чтобы вклад соседей был пропорционален плотности примеров в пространстве признаков. scikit-learn.ru ru.python-3.com