Некоторые навыки, которые необходимы начинающему дата-инженеру для успешного старта в карьере:
- Структуры данных и математические алгоритмы. 2 Понимание алгоритмов позволит общаться со специалистами по Data Science на одном языке и предоставлять им данные в удобном виде. 2
- Языки программирования. 24 Самое главное — знать Python, потому что именно на нём пишут алгоритмы для обработки данных. 2 Пригодятся Java и Scala — на них написаны сами инструменты для обработки данных. 2
- SQL и классические базы данных. 2 Часто данные нужно будет извлекать из классических БД с помощью SQL-запросов, поэтому инженер данных обязательно должен это уметь. 2
- Инструменты для работы с большими данными. 25 Таких инструментов много: различные колоночные БД, экосистема Hadoop для создания озёр данных, Spark и Kafka. 2 Важно освоить хотя бы некоторые инструменты, чтобы понимать принципы их работы. 2
- Облачные технологии. 2 Сейчас практически все компании работают с большими данными в облаках, организуют там хранение и аналитику. 2 Важно уметь строить инфраструктуру на базе облачной. 2
- Docker. 45 Это сервис для упаковки данных на локальном компьютере, чтобы их можно было передать коллегам или в кластер. 4
- Инструменты визуализации данных. 5 Например, Tableau или ElasticSearch. 5
Также важны такие личные качества, как коммуникабельность, аналитическое мышление, умение решать проблемы и внимание к деталям. 3
Чтобы повысить квалификацию и увеличить шансы на получение работы, некоторые специалисты советуют получить сертификаты в области big data и data engineering. 4