Несколько ресурсов, где можно найти открытые датасеты для обучения моделей машинного обучения:
Kaggle Datasets. pikabu.ru Коллекция датасетов для задач машинного обучения, анализа данных и визуализации. pikabu.ru Здесь есть как классические наборы данных (например, Titanic или MNIST), так и необычные (данные по сериалу «Игра престолов» или статистика футбольных матчей). pikabu.ru
Awesome Public Datasets. pikabu.ru GitHub-репозиторий с огромным списком бесплатных датасетов на все случаи жизни. pikabu.ru Здесь есть данные по здравоохранению, финансам, географии, а также редкие специализированные наборы для узких исследований. pikabu.ru
UCI Machine Learning Repository. pikabu.ru Классический источник датасетов для исследований и экспериментов. pikabu.ru Содержит сотни датасетов для задач классификации, регрессии и кластеризации. pikabu.ru
Google Dataset Search. pikabu.ru proglib.io Поисковик от Google, который помогает находить открытые датасеты по любым темам: от научных исследований до социальных и экономических данных. pikabu.ru
Hugging Face Datasets. pikabu.ru Библиотека от платформы Hugging Face, где собраны датасеты для задач обработки естественного языка (NLP), компьютерного зрения и машинного обучения. pikabu.ru
Azure Open Datasets. pikabu.ru Коллекция открытых датасетов от Microsoft Azure. pikabu.ru Здесь есть данные для задач в области здравоохранения, финансов, демографии, транспорта и многого другого. pikabu.ru
Registry of Open Data on AWS. pikabu.ru Реестр открытых данных на платформе Amazon Web Services (AWS). pikabu.ru Включает датасеты для анализа изображений, работы с текстами, биоинформатики, данных о климате и многого другого. pikabu.ru
Примеры полезных ответов Поиска с Алисой на вопросы из разных сфер. Вопросы сгенерированы нейросетью YandexGPT для актуальных тем, которые определяются на базе обобщённых запросов к Поиску с Алисой.