Основная идея алгоритма СТОЛП заключается в том, что не все объекты обучающей выборки равноценны. 2 Среди них есть наиболее типичные представители классов (эталоны), неинформативные объекты, при удалении которых из обучающей выборки качество классификации не изменится, и выбросы, или шумовые объекты, только ухудшающие качество классификации. 2 Поэтому необходимо уменьшить объём обучающей выборки, оставив в ней только эталонные объекты для каждого класса. 2
Для использования алгоритма СТОЛП необходимо: 1
- Выбрать выборку, допустимую долю ошибок, порог отсечения выбросов, алгоритм классификации и формулу для вычисления величины риска (степень риска для объекта быть классифицированным не в тот класс). 12
- Отбросить выбросы. 2
- Сформировать начальное приближение — из объектов выборки выбрать по одному объекту каждого класса, обладающему среди объектов данного класса максимальной величиной риска либо минимальной величиной риска. 2
- Наращивать множество эталонов (пока число объектов выборки, распознаваемых неправильно, не станет меньше допустимой доли ошибок). 2
- Классифицировать объекты, используя в качестве обучающей выборки начальное приближение. 12
- Пересчитать величины риска для всех объектов с учётом изменения обучающей выборки. 2
- Среди объектов каждого класса, распознанных неправильно, выбрать объекты с максимальной величиной риска и добавить их к начальному приближению. 12
Результат работы алгоритма — разбиение всего множества объектов на эталонные, шумовые (выбросы) и неинформативные объекты. 2