Target Encoding полезен при работе с категориальными признаками, так как позволяет включить их в модели машинного обучения, которые обычно требуют числового ввода. www.hackersrealm.net
Некоторые преимущества метода:
- Компактность. deepmachinelearning.ru Target Encoding не приводит к разрастанию признакового пространства, в отличие от других методов кодирования, например One-hot Encoding, которые при большом числе категорий увеличивают число признаков. deepmachinelearning.ru
- Информативность. deepmachinelearning.ru Такой способ кодирования максимально информативен для решения задачи предсказания отклика, поскольку кодировка в явном виде агрегирует информацию об отклике. deepmachinelearning.ru
- Возможность работы с большим количеством категорий. brendanhasz.github.io Target Encoding хорошо подходит для категориальных данных, которые содержат много категорий. brendanhasz.github.io
Однако метод следует использовать с осторожностью, так как он может привести к переобучению модели из-за использования информации о целевой переменной при создании признаков. olegtalks.ru
Также при работе с несбалансированными категориями, где у некоторых категорий значительно больше примеров, чем у других, Target Encoding может быть смещён в сторону класса с большинством. www.hackersrealm.net