Метрика accuracy может быть ненадёжной при анализе несбалансированных данных, потому что она не показывает, как качественно модель предсказывает каждый из классов. 1
Например, если большинство примеров принадлежит к одному классу, accuracy для этого класса будет выше, чем для другого. 2 Полагаясь на это значение, можно подумать, что для любой выборки (независимо от её класса) модель сделает правильный прогноз в определённом проценте случаев. 2 Это неверно, так как для другого класса модель может работать очень плохо. 2
Также в случае несбалансированных данных классификаторы с меньшим значением accuracy могут давать лучший прогноз при решении прикладных задач, чем классификаторы, имеющие более высокие значения этого параметра. 3