Принцип сбалансированной выборки данных для анализа заключается в обеспечении примерно равного соотношения категорий в исходном наборе данных. 2
Это важно, например, в задачах классификации. 2 Если в исходных данных категории представлены неравномерно (например, 98% «нет»), то для повышения качества настройки модели рекомендуется сбалансировать обучающую выборку. 2
Многие модели машинного обучения, например, нейронные сети, дают более надёжные прогнозы на основе обучения со сбалансированными данными. 3