Методология CRISP-DM применима для проектов с разными целями и задачами, потому что она не жёсткая и допускает вариацию в зависимости от конкретного проекта. habr.com
Согласно CRISP-DM, аналитический проект состоит из шести основных этапов, выполняемых последовательно: habr.com
- Бизнес-анализ. habr.com courses.sberuniversity.ru Нужно сформулировать, какую задачу бизнеса решают, какие для этого есть ресурсы, какие модели машинного обучения будут использоваться. courses.sberuniversity.ru Также на этом этапе устанавливают метрики для принятия решения о внедрении модели. courses.sberuniversity.ru
- Анализ данных. courses.sberuniversity.ru На этом шаге проверяют, какие есть источники информации. courses.sberuniversity.ru Затем изучают и описывают структуру данных, проверяют их качество, считают статистики вроде средних величин. courses.sberuniversity.ru
- Подготовка данных. courses.sberuniversity.ru wiki.loginom.ru Исправляют огрехи, которые обнаружили на предыдущем этапе, дополняют недостающими данными, приводят к единому формату. courses.sberuniversity.ru
- Моделирование. courses.sberuniversity.ru wiki.loginom.ru Определяют один или несколько алгоритмов машинного обучения, которые будут использоваться. courses.sberuniversity.ru Выбор зависит от задачи, которую решают, требований по сложности, а ещё от количества и качества данных, которые нашли и подготовили. courses.sberuniversity.ru
- Оценка. courses.sberuniversity.ru wiki.loginom.ru На этом этапе делают оценку того, соответствуют ли результаты проекта критериям успеха бизнеса. wiki.loginom.ru
- Внедрение. courses.sberuniversity.ru wiki.loginom.ru Это процесс использования новых идей и знаний для повышения эффективности компании. wiki.loginom.ru
Преимущество методологии CRISP-DM в том, что она нейтральна в отношении предметных областей, инструментов и приложений. wiki.loginom.ru