Для решения задачи бинарной классификации, зная только положительные примеры, можно использовать следующие подходы:
- Алгоритм машины опорных векторов (SVM). 2 При моделировании одного класса алгоритм фиксирует плотность большинства классов и классифицирует примеры на экстремумах функции плотности как выбросы. 2
- Применение нейросетей типа автоенкодера. 1 Он учится «восстанавливать» данные на одном классе из тренировочной выборки. 1 На этапе использования автоенкодер будет отлично восстанавливать данные из этого класса и существенно ошибаться при восстановлении данных, не принадлежащих этому классу, что и будет признаком того, что это некоторая аномалия. 1
Также важно обеспечить баланс между положительными и отрицательными примерами. 3 Этого можно достичь с помощью методов повторной выборки, таких как избыточная выборка класса меньшинства, недостаточная выборка класса большинства, или методов генерации синтетических данных, например SMOTE (Synthetic Minority Over-sampling Technique). 3