Понятие отступа в метрических алгоритмах классификации определяется как расстояние от объекта до поверхности, отделяющей свой класс от всех остальных. 2
Отступ показывает степень типичности объекта: чем больше отступ, тем «глубже» объект в своём классе. 1
В зависимости от значения отступа обучающие объекты условно делятся на типы: 4
- Эталонные объекты имеют большой положительный отступ, плотно окружены объектами своего класса и являются наиболее типичными его представителями. 4
- Неинформативные объекты также имеют положительный отступ. 4 Изъятие этих объектов из выборки (при условии, что эталонные объекты остаются) не влияет на качество классификации. 4
- Пограничные объекты имеют отступ близкий к нулю. 4 Классификация таких объектов неустойчива: малые изменения метрики или состава обучающей выборки могут изменять их классификацию. 4
- Ошибочные объекты имеют отрицательные отступы и классифицируются неверно. 4
- Шумовые объекты или выбросы — объекты с большими отрицательными отступами. 4 Они плотно окружены объектами чужих классов и классифицируются неверно. 4
Распределение отступов позволяет выделить четыре категории объектов: шумовые, пограничные, неинформативные и эталонные. 2