Несколько ресурсов, где можно найти готовые датасеты для обучения искусственного интеллекта:
- Kaggle Datasets. 1 Огромная коллекция датасетов для задач машинного обучения, анализа данных и визуализации. 1 Здесь можно найти как классические наборы данных (например, Titanic или MNIST), так и необычные, такие как данные по сериалу «Игра престолов» или статистика футбольных матчей. 1
- Awesome Public Datasets. 1 GitHub-репозиторий с огромным списком бесплатных датасетов. 1 Здесь можно найти данные по здравоохранению, финансам, географии, а также редкие специализированные наборы для узких исследований. 1
- UCI Machine Learning Repository. 12 Классический источник датасетов для исследований и экспериментов. 1 Этот репозиторий содержит сотни датасетов для задач классификации, регрессии и кластеризации. 1
- Google Dataset Search. 1 Поисковик от Google, который помогает находить открытые датасеты по любым темам: от научных исследований до социальных и экономических данных. 1
- Hugging Face Datasets. 1 Библиотека от платформы Hugging Face, где собраны датасеты для задач обработки естественного языка (NLP), компьютерного зрения и машинного обучения. 1
- Azure Open Datasets. 1 Коллекция открытых датасетов от Microsoft Azure. 1 Здесь можно найти данные для задач в области здравоохранения, финансов, демографии, транспорта и многого другого. 1
- Registry of Open Data on AWS. 1 Реестр открытых данных на платформе Amazon Web Services (AWS). 1 Включает датасеты для анализа изображений, работы с текстами, биоинформатики, данных о климате и многого другого. 1