Метод изолирующего леса (Isolation Forest) используется для обнаружения аномалий в данных следующим образом: habr.com
- Строят дерево, где каждый узел случайно выбирает один признак и случайное значение разбиения. habr.com
- Рекурсивно делят данные, пока каждая точка не окажется в своём отдельном листе. habr.com
- Считают аномальность точки по тому, насколько быстро она была изолирована (чем короче путь, тем аномальнее). habr.com Если объект отделяется всего за пару шагов — это значит, что он сильно выбивается из общей картины. habr.com
Логика алгоритма в том, что при случайном способе построения деревьев выбросы будут попадать в листья на ранних этапах (на небольшой глубине дерева), то есть их проще «изолировать». alexanderdyakonov.wordpress.com