Среднее арифметическое может быть недостоверным показателем в разнородных данных по нескольким причинам:
- Искажение из-за выбросов (экстремальных значений во входных данных). 1 Например, если один директор получает 1 млн рублей, а остальные сотрудники — 40–60 тыс. рублей, среднее значение не будет отражать реальную зарплату большинства. 1
- Искажение из-за отсутствия контекста. 1 Например, если в отчёте о потреблении электроэнергии говорится, что среднее потребление на дом составляет 500 кВт в месяц, за этим может скрываться, что в одних домах потребление достигает 1500 кВт, а в других — всего 100 кВт. 1 Это создаёт ложное представление о среднем уровне потребления. 1
- Искажение из-за фрагментарных данных. 1 Например, если исследование показывает, что средний уровень удовлетворённости клиентов в ресторане составляет 4,5 из 5, но большинство оценок — это 3 и 4, то такое среднее значение не отражает реального мнения большинства клиентов. 1
- Искажение из-за временных аномалий. 1 Например, если в отчёте по продажам указано, что средний доход в месяц составляет 1 млн рублей, то за этим может скрываться, что в некоторые месяцы продажи резко увеличивались, а в другие значительно падали. 1 Это вводит в заблуждение относительно стабильности дохода. 1
- Искажение из-за неполной выборки. 1 Например, если в опросе о здоровье сообщается, что средний уровень холестерина составляет 5,0 ммоль/л, однако данные собраны только у людей с хроническими заболеваниями. 1 Это может создать ложное впечатление о здоровье населения. 1
Для расчёта разнородных массивов данных рекомендуется использовать среднее арифметическое взвешенное, когда каждое значение получает свой весовой коэффициент. 5