Некоторые источники и платформы для поиска готовых датасетов:
Kaggle. 12 Социальная сеть для специалистов в области данных, а также платформа для проведения конкурсов по исследованию данных. 1 На сайте можно найти датасеты для различных задач, от анализа текста до компьютерного зрения. 2
Awesome Public Datasets. 12 Репозиторий на платформе GitHub, созданный и обновляемый пользователями. 1 Содержит большую коллекцию бесплатных датасетов для хостинга проектов. 1
Hugging Face. 1 Экосистема, которая позволяет пользователям обмениваться реализованными проектами, AI-моделями и инструментами для их создания, а также выкладывать готовые датасеты. 1
data.world. 1 Платформа для поиска, распространения и хранения датасетов. 1 Пользователи сервиса могут совместно разрабатывать проекты, создавать собственные наборы и делиться ими с другими. 1
Datahub. 1 Большая бесплатная коллекция данных по разным темам: изменения климата, демографические данные, информация о системе образования в США и многое другое. 1
UCI Machine Learning Repository. 12 Репозиторий машинного обучения Калифорнийского университета. 1 Коллекция насчитывает 670 датасетов. 1
Azure Open Datasets. 1 Бесплатные общедоступные наборы разнообразных данных от Microsoft Azure для повышения точности моделей машинного обучения. 1
Registry of Open Data. 1 Платформа Amazon Web Services (AWS), где хранятся общедоступные наборы данных. 1 Для каждого набора в реестре доступны сопутствующие документы, описывающие структуру данных, их источник, формат и возможности использования. 1
Ответ сформирован YandexGPT на основе текстов выбранных сайтов. В нём могут быть неточности.
Примеры полезных ответов Нейро на вопросы из разных сфер. Вопросы сгенерированы нейросетью YandexGPT для актуальных тем, которые определяются на базе обобщённых запросов к Нейро.