Вопросы к Поиску с Алисой
Разница между SMOTE и ASMO при работе с несбалансированными данными заключается в подходе к генерации новых примеров. loginom.ru
SMOTE (Synthetic Minority Over-sampling Technique) создаёт искусственные наблюдения, которые похожи на имеющиеся в миноритарном классе, но не дублируют их. loginom.ru dzen.ru Алгоритм работает эффективно, когда в векторном пространстве есть области, «населённые» преимущественно миноритарным классом. loginom.ru Если примеры миноритарного класса расположены равномерно, то в результате только увеличивается перемешивание классов, что затрудняет классификацию. loginom.ru
ASMO (Adaptive Synthetic Minority Oversampling) — модификация SMOTE, которая делает его более адаптивным к различным наборам данных с несбалансированными классами. loginom.ru Алгоритм генерирует искусственные записи в пределах отдельных кластеров на основе всех классов. loginom.ru Для каждого примера миноритарного класса находят m ближайших соседей, и на основе них (также как в SMOTE) создаются новые записи. loginom.ru
Таким образом, SMOTE больше подходит для случаев, когда есть области, преимущественно населённые миноритарным классом, а ASMO эффективен при работе с наборами данных, где примеры миноритарного класса расположены равномерно. loginom.ru