Некоторые основные методы Feature Engineering, которые применяются для повышения точности моделей машинного обучения:
- Извлечение признаков (feature extraction). 4 Превращение данных, специфических для предметной области, в понятные для модели числовые векторы. 4 В частности, здесь выполняется токенизация и лемматизация текстов, обработка изображений и геоданных. 4
- Преобразование признаков (feature transformation). 4 Изменение данных для повышения точности алгоритма, например, нормализация или изменение вероятностного распределения. 4
- Отбор признаков (feature selection). 45 Отсечение ненужных признаков с помощью алгоритмов машинного обучения, которые позволяют оценить важность предиктора, например, жадный алгоритм, логистическая регрессия, случайный лес, градиентный бустинг. 4
- Генерация новых признаков. 1 Например, путём вычисления разниц, произведений или логарифмов. 1 Это помогает выделить важные зависимости. 1
- Методы уменьшения размерности. 1 Например, PCA и LDA, которые выделяют главные компоненты или линейные комбинации признаков, помогая снизить размерность данных. 1