Выбросы влияют на точность статистических расчётов следующим образом:
- Искажают и сокращают информацию, содержащуюся в источнике данных или процедуре их генерации. 4 Например, несколько экстремальных выбросов в истории продаж способны серьёзно изменить средний чек, а построенный на этих данных график не будет отражать реального положения дел. 1
- Могут привести к неверным выводам. 4 Это связано с тем, что многие методы статистической обработки данных и получаемые статистики чувствительны к наличию выбросов. 4 Например, выборочные среднее и стандартное отклонения могут изменить свои значения при наличии даже одного выброса. 4
- Снижают точность предсказательных моделей. 1 Большинство аналитических алгоритмов, работая с наборами, в которых присутствует заметное количество экстремальных значений, пытаются найти идеально описывающее всю совокупность данных решение. 1 Однако, как правило, в итоге получается модель, которая плохо описывает и экстремальные выбросы, и остальные средние значения. 1
При этом в некоторых случаях удаление выбросов способствует получению объектов изучения с нормальным распределением, что расширяет спектр инструментов для последующего анализа. 1