Некоторые основные метрики, которые используются для измерения объёма данных:
- Метрики центральной тенденции. 1 Помогают определить «среднее» значение в наборе данных. 1 Основные из них:
- Среднее арифметическое. 1 Сумма всех значений, делённая на их количество. 1
- Медиана. 1 Среднее значение в упорядоченном наборе данных. 1 Медиана особенно полезна, когда данные содержат выбросы, так как она не подвержена их влиянию. 1
- Мода. 1 Наиболее часто встречающееся значение в наборе данных. 1
- Метрики разброса. 1 Показывают, насколько значения в наборе данных отклоняются от среднего. 1 Основные из них:
- Дисперсия. 1 Среднее квадратичное отклонение значений от среднего. 1
- Стандартное отклонение. 1 Квадратный корень из дисперсии. 1 Стандартное отклонение часто используется вместе со средним арифметическим для определения диапазона значений. 1
- Размах. 1 Разница между максимальным и минимальным значениями. 1 Размах даёт быстрое представление о диапазоне значений в наборе данных. 1
Также для измерения объёма данных в хранилищах можно использовать метрики, которые показывают, какое место данные занимают в схемах. 2