Трансформация данных на этапе предварительной обработки информации заключается в их преобразовании и масштабировании для улучшения качества анализа и облегчения работы с данными. 4
Некоторые методы трансформации:
- Кодирование категориальных переменных. 4 Например, пол, страна или профессия кодируются, чтобы быть использованными в алгоритмах машинного обучения. 4
- Масштабрование числовых переменных. 4 Позволяет привести их к одному диапазону значений, что улучшает сходимость алгоритмов машинного обучения. 4
- Изменение типа данных. 2 Непрерывные значения преобразуются в категориальные путём агрегирования и бинаризации, а изображения преобразуются в табличные данные. 2
Этот этап направлен на то, чтобы данные были применимы для машинного обучения. 2