Для обучения существующих моделей машинного обучения новым задачам рекомендуется следовать таким шагам: 4
- Понимание бизнес-проблемы. 4 Нужно определить, какую задачу нужно решить. 4
- Формализация задачи. 4 Следует уточнить, какими входными признаками можно располагать для решения задачи и какая функция потерь будет реалистично оценивать фактические потери от ошибок прогнозирования. 4
- Сбор данных. 4 Разнородные данные из разных источников нужно свести в единую базу данных. 4
- Предобработка данных. 4 Необходимо решить, как заполнять пропущенные значения, какие объекты считать аномальными и исключать из анализа. 4
- Генерация признаков. 4 Модель может неэффективно работать на исходных признаках. 4 Поэтому целесообразно сгенерировать нелинейные трансформации исходных признаков. 4
- Отбор информативных признаков. 4 На этапе сбора, предобработки и генерации признаков, скорее всего, получится избыточный набор признаков. 4 Избыточная информация ухудшает оценку модели, поэтому нужно отобрать информативные признаки. 4
- Настройка модели. 4 Выбираются несколько моделей машинного обучения, по которым настраиваются их параметры. 4
- Оценка качества модели. 4 Для этого используют тестовую выборку, которая должна быть представительной для всего набора данных, но не должна пересекаться с обучающей выборкой. 3
- Внедрение модели. 4 Модель интегрируют в существующую инфраструктуру, перенаправляют на неё потоки данных и учитывают прогнозы модели. 4
- Поддержка модели. 4 Данные со временем изменяются, а закономерности в них устаревают. 4 Поэтому важно в динамическом режиме работы отслеживать качество работы модели, чтобы донастраивать её параметры и учитывать новые источники данных. 4
Для обучения моделей машинного обучения новым задачам можно использовать платформы машинного обучения, которые позволяют создавать, обучать и контролировать модели в единой рабочей среде. 1