Scikit-learn используется в реальных проектах и соревнованиях Kaggle для реализации базовых алгоритмов машинного обучения, таких как классификация, регрессия и кластеризация. 13
Например, в соревновании Kaggle Higgs Challenge с помощью Scikit-learn можно классифицировать события, связанные с Higgs Boson, и оптимизировать определённую метрику. 4 Для этого используются данные, которые состоят из файлов с обучающими и тестовыми выборками, каждая из которых имеет столбец с номерами идентификаторов и 30 столбцов с величинами признаков. 4
Также Scikit-learn применяется в проекте по классификации текстов отзывов о фильмах. 6 Поскольку отзывы представляют собой текстовые файлы, их необходимо предварительно обработать, чтобы подготовить для передачи модели машинного обучения. 6 Для этого в Scikit-learn есть встроенные функции для преобразования текстовых данных в числовые. 6
Ещё один пример использования Scikit-learn в реальном проекте — создание модели для прогнозирования энергопотребления зданий в Нью-Йорке. 8 Для этого используется информация об энергопотреблении зданий, и цель проекта — предсказать, какой балл Energy Star Score получит то или иное здание. 8