Некоторые методы поиска k ближайших чисел к заданному значению:
- Метод k-ближайших соседей (k Nearest Neighbors, или kNN). 34 Алгоритм машинного обучения с учителем, который используется для решения задач классификации и регрессии. 4 Суть метода в том, чтобы найти заранее определённое количество обучающих образцов, наиболее близких по расстоянию к новой точке, и предсказать метку на их основе. 3
Порядок действий метода: 4
- Загрузить данные. 4
- Инициализировать k путём выбора оптимального числа соседей. 4
- Для каждого образца в данных вычислить расстояние между примером запроса и текущим примером из данных. 4
- Добавить индекс образца в упорядоченную коллекцию, как и его расстояние. 4
- Отсортировать упорядоченную коллекцию расстояний и индексов от наименьшего до наибольшего, в порядке возрастания. 4
- Выбрать первые k записей из отсортированной коллекции. 4
- Взять метки выбранных k записей. 4
- Если стоит задача регрессии, вернуть среднее значение выбранных ранее k меток. 4
- Если задача классификации, вернуть наиболее часто встречающееся значение выбранных ранее меток k. 4
Также для поиска k ближайших чисел к заданному значению можно использовать локально-чувствительное хэширование. 1 При этом методе строится хэш-функция, отображающая метрически близкие объекты в одинаковые значения. 1 Затем, отобразив целевой объект в какое-то значение хэш-функции, можно сразу найти похожие объекты. 1