Некоторые статистические методы, которые применяются для обнаружения аномальных данных:
- Параметрические методы. 2 Предполагают, что нормальные данные генерируются параметрическим распределением. 2 Эти методы часто основываются на Гауссовой или регрессионной модели, а также их комбинации. 2
- Непараметрические методы. 2 Предполагают, что структура модели не определена априорно, вместо этого она определяется из предоставленных данных. 2 К таким методам относятся методы на основе гистограмм или функций ядра. 2
- Статистические тесты. 5 Как правило, их применяют для отдельных признаков и используют для обнаружения экстремальных значений. 5 Например, для этого используют Z-value или Kurtosis measure. 5
- Метрические методы. 5 В них постулируется существование некоторой метрики в пространстве объектов, которая помогает найти аномалии. 5 Например, хорошей мерой аномальности может служить «расстояние до k-го соседа». 5
- Спектральные методы. 2 Находят аппроксимацию данных, используя комбинацию атрибутов, которые передают большую часть вариативности в данных. 2 Эта методика основана на предположении: данные могут быть вложены в подпространство меньшей размерности, в котором нормальное состояние и аномалии проявляются иначе. 2