Некоторые преимущества метода случайного удаления данных при коррекции дисбаланса классов:
- Устранение дисбаланса. 2 Метод направлен на устранение дисбаланса по классам путём случайного исключения экземпляров класса большинства. 2
- Возможность использования оставшихся данных. 4 После вычета сбалансированного подмножества для локального обучения модели, оставшиеся данные могут быть использованы для локального тестирования модели. 4
- Сокращение влияния случайных факторов. 4 Такой подход позволяет сократить влияние случайных факторов на работу нейронной сети, что важно при инициализации весовых коэффициентов и формировании обучающей выборки. 4
- Увеличение количества используемых при обучении данных. 4 Это может быть особенно важно, когда количество данных ограничено. 4
Однако у метода есть и недостаток: он теряет информацию о данных класса большинства. 2