Разница между Target Encoding и One-Hot Encoding заключается в подходе к кодированию категориальных данных. 12
One-Hot Encoding используется для кодирования номинальных категорий. 1 Каждая уникальная категория преобразуется в отдельный бинарный столбец (или массив). 1 Для каждого объекта в новом столбце ставится 1, если он принадлежит к соответствующей категории, и 0 во всех остальных столбцах. 1 Количество новых столбцов равно количеству уникальных значений в исходном категориальном признаке. 1
Target Encoding — это метод преобразования категориального признака на основе среднего значения целевой переменной для каждой категории. 1 Для каждой категории вычисляется среднее значение целевой переменной, и это среднее значение используется для замены исходной категории. 1
Таким образом, One-Hot Encoding фокусируется на создании бинарных признаков, показывающих принадлежность к уникальному значению, в то время как Target Encoding ориентирован на использование целевой метки для кодирования категориальных признаков. 3
Выбор конкретного метода зависит от типа категориальных данных, количества уникальных категорий, особенностей используемой модели машинного обучения и целей анализа. 1