Big Data — это серия подходов, инструментов и методов, используемых для обработки структурированных и неструктурированных данных огромных объёмов и значительного разнообразия. 1 Ключевые свойства больших данных: объём, скорость и разнообразие. 1
Hadoop — это программная среда с открытым исходным кодом, которая предназначена для хранения и обработки больших данных. 23 Она позволяет хранить и обрабатывать структурированные, полуструктурированные и неструктурированные данные. 2
Основные компоненты Hadoop: