Некоторые методы определения центральной тенденции в больших массивах данных:
- Среднее арифметическое. habr.com Это среднее значение всех элементов в наборе данных. habr.com Рассчитывается как сумма всех значений, делённая на общее количество значений. habr.com Подходит для описания данных, которые имеют нормальное распределение. habr.com
- Медиана. habr.com Это среднее значение, которое отделяет верхнюю половину набора данных от нижней. en.wikipedia.org Используется, когда набор данных асимметричен или содержит выбросы. habr.com Если общее количество значений в наборе данных чётное, в центральной позиции будет два значения. habr.com В этом случае медиана представляет собой среднее значение этих двух значений. habr.com
- Мода. habr.com Это значение, которое чаще всего встречается в наборе данных. habr.com Моду можно использовать для анализа часто встречающихся значений как числовых, так и категориальных данных. habr.com Если в наборе данных нет повторяющихся значений, то и моды у него тоже нет. habr.com
Помимо основных мер центральной тенденции, существуют и другие, менее распространённые: среднее геометрическое, среднее гармоническое, среднее взвешенное и т. д.. sky.pro Их применение обусловлено спецификой конкретных задач и типом анализируемых данных. sky.pro