Для определения экстремальных значений в упорядоченном ряду данных можно использовать следующие методы:
- Визуализация. 1 Позволяет сразу разглядеть отклонения, незаметные на больших наборах данных. 1 Один из популярных способов визуализации — гистограмма. 1
- Метод стандартного отклонения. 1 В этом случае выбросами считаются все значения, превышающие 3-сигма, а экстремальными значениями — те, что превышают 5-сигм. 1
- Метод интерквартильных расстояний. 1 В этом случае выбросами считаются все значения, превышающие 1,5 интерквартильного расстояния, а экстремальными значениями — те, что превышают значение 3 ∗ IQR. 1
Также в Microsoft Excel для исключения из анализа выбросов можно использовать функцию УРЕЗСРЕДНЕЕ. 2 Она вычисляет среднее, отбрасывая заданный процент данных с экстремальными значениями. 2
Универсального метода или алгоритма поиска экстремальных значений нет, выбор метода зависит от конкретных условий задачи.