Метод изолирующего леса (Isolation Forest) используется для обнаружения аномалий в данных следующим образом: 3
- Строят дерево, где каждый узел случайно выбирает один признак и случайное значение разбиения. 3
- Рекурсивно делят данные, пока каждая точка не окажется в своём отдельном листе. 3
- Считают аномальность точки по тому, насколько быстро она была изолирована (чем короче путь, тем аномальнее). 3 Если объект отделяется всего за пару шагов — это значит, что он сильно выбивается из общей картины. 3
Логика алгоритма в том, что при случайном способе построения деревьев выбросы будут попадать в листья на ранних этапах (на небольшой глубине дерева), то есть их проще «изолировать». 4