Несколько советов, с чего начать изучение науки о данных (Data Science):
- Основы математики и статистики. 2 Рекомендуется изучить основные понятия линейной алгебры, дифференциального и интегрального исчисления, теории вероятностей и математической статистики. 2
- Изучение программирования. 2 Важно овладеть как минимум одним языком программирования, используемым в Data Science. 2 Рекомендуется изучить Python, который является наиболее распространённым языком в этой области. 2
- Работа с инструментарием. 2 Стоит изучить инструменты и библиотеки, используемые в Data Science, такие как NumPy, Pandas, Scikit-learn, Matplotlib и другие. 2
- Знакомство с машинным обучением. 2 Нужно узнать про модели, датасеты, создание машин, которые могут обучаться и предсказывать или классифицировать значения по признакам. 2
- Работа с базами данных. 2 Пригодится знание SQL, язык запросов используется при выборке и анализе данных. 2
- Практика и проекты. 2 Для лучшего понимания Data Science необходимо постоянно практиковаться и создавать свои проекты. 2 Это поможет закрепить знания и получить опыт работы с реальными данными. 2
Некоторые учебные пособия и курсы для изучения Data Science:
- «Data Science. Наука о данных с нуля» от Джоэла Граса. 14 Учебник для начинающих, в котором собраны элементы линейной алгебры, математической статистики, теории вероятностей, методов сбора, очистки, нормализации и обработки собранных сведений, а также интенсивный курс языка Python. 1
- «Python и анализ данных» от Уэса Маккинни. 4 Описывает возможности Python и его библиотек, которые пригодятся в аналитике данных. 4
- «Практическая статистика для специалистов Data Science» от Питера Брюса и Эндрю Брюса. 1 В книге описаны такие аспекты математической статистики, как разведочный анализ данных, статистические эксперименты и проверка значимости. 1
- «Машинное обучение. Наука и искусство построения алгоритмов, которые извлекают знания из данных» П. Флах — книга о методах построения моделей и алгоритмах машинного обучения. 5
Для практического опыта подойдёт Kaggle — веб-сайт, где постоянно проводятся соревнования по анализу данных, в которых принимают участие все желающие. 5 Также есть много открытых наборов данных — можно анализировать их и публиковать свои результаты. 5
Выбор учебных пособий, курсов и статей зависит от личных предпочтений и интересов.