Методы кластеризации в контролируемом обучении используют для повышения точности алгоритмов. 2 Для этого точки данных объединяют в аналогичные группы и используют метки кластеров в качестве независимых переменных в алгоритме контролируемого машинного обучения. 2
Методы кластеризации применяют, когда нужно решить задачу классификации, но обучающую выборку собрать затруднительно (дорого или долго). 3 При этом валидационную выборку для оценки результатов кластеризации собрать значительно проще, так как для неё требуется меньше примеров. 3
При использовании методов кластеризации важно обратить внимание на такие аспекты, как обработка выбросов в данных и обеспечение того, чтобы каждый кластер имел достаточную совокупность. 2
Стоит помнить, что точность работы контролируемых методов значительно выше, поэтому, если обучающую выборку всё-таки можно собрать, лучше решать задачу классификации, чем задачу кластеризации. 3