Деревья решений учитывают пропущенные данные при построении моделей с помощью нескольких подходов: www.geeksforgeeks.org
- Разделение атрибутов. www.geeksforgeeks.org Алгоритм выбирает наиболее подходящий признак для разделения данных. www.geeksforgeeks.org Если в выбранном объекте есть пропущенное значение, дерево использует доступные данные, чтобы решить, в какую ветвь отправить объект. www.geeksforgeeks.org
- Расчёт взвешенных примесей. www.geeksforgeeks.org При построении дерева алгоритм выбирает объект, который предлагает наилучшее разделение в каждом узле. www.geeksforgeeks.org Когда рассматривается объект с пропущенными значениями, алгоритм вычисляет нечёткость обеих ветвей: одна включает экземпляры с пропущенными значениями, а другая без них. www.geeksforgeeks.org
- Суррогатные разбиения. www.geeksforgeeks.org Это резервные правила или ветви, которые можно использовать, когда первичное разбиение содержит пропущенные значения. www.geeksforgeeks.org Деревья решений вычисляют суррогатные разделения во время обучения, учитывая наилучшие варианты разделения, когда у основного признака отсутствуют значения. www.geeksforgeeks.org
По умолчанию при прогнозировании образцы с пропущенными значениями классифицируются с классом, использованным в разбиении, найденном во время обучения. scikit-learn.ru Если оценка критерия одинакова для обоих узлов, то ничья по отсутствующему значению в момент предсказания разрушается путём перехода к правому узлу. scikit-learn.ru