Несколько советов, с чего начать изучение науки о данных (Data Science):
- Основы математики и статистики. yandex.ru Рекомендуется изучить основные понятия линейной алгебры, дифференциального и интегрального исчисления, теории вероятностей и математической статистики. yandex.ru
- Изучение программирования. yandex.ru Важно овладеть как минимум одним языком программирования, используемым в Data Science. yandex.ru Рекомендуется изучить Python, который является наиболее распространённым языком в этой области. yandex.ru
- Работа с инструментарием. yandex.ru Стоит изучить инструменты и библиотеки, используемые в Data Science, такие как NumPy, Pandas, Scikit-learn, Matplotlib и другие. yandex.ru
- Знакомство с машинным обучением. yandex.ru Нужно узнать про модели, датасеты, создание машин, которые могут обучаться и предсказывать или классифицировать значения по признакам. yandex.ru
- Работа с базами данных. yandex.ru Пригодится знание SQL, язык запросов используется при выборке и анализе данных. yandex.ru
- Практика и проекты. yandex.ru Для лучшего понимания Data Science необходимо постоянно практиковаться и создавать свои проекты. yandex.ru Это поможет закрепить знания и получить опыт работы с реальными данными. yandex.ru
Некоторые учебные пособия и курсы для изучения Data Science:
- «Data Science. Наука о данных с нуля» от Джоэла Граса. dzen.ru vc.ru Учебник для начинающих, в котором собраны элементы линейной алгебры, математической статистики, теории вероятностей, методов сбора, очистки, нормализации и обработки собранных сведений, а также интенсивный курс языка Python. dzen.ru
- «Python и анализ данных» от Уэса Маккинни. vc.ru Описывает возможности Python и его библиотек, которые пригодятся в аналитике данных. vc.ru
- «Практическая статистика для специалистов Data Science» от Питера Брюса и Эндрю Брюса. dzen.ru В книге описаны такие аспекты математической статистики, как разведочный анализ данных, статистические эксперименты и проверка значимости. dzen.ru
- «Машинное обучение. Наука и искусство построения алгоритмов, которые извлекают знания из данных» П. Флах — книга о методах построения моделей и алгоритмах машинного обучения. tproger.ru
Для практического опыта подойдёт Kaggle — веб-сайт, где постоянно проводятся соревнования по анализу данных, в которых принимают участие все желающие. tproger.ru Также есть много открытых наборов данных — можно анализировать их и публиковать свои результаты. tproger.ru
Выбор учебных пособий, курсов и статей зависит от личных предпочтений и интересов.