Big Data (в переводе с английского — «Большие данные») — это крупные массивы разнообразной информации, которые невозможно эффективно обработать с использованием традиционных методов. 5 То есть с ними не справится ни обычный человек, ни простой пользовательский компьютер. 5
К большим данным можно отнести поток сообщений из соцсетей, системы подсчёта посетителей интернет-магазинов и других сайтов, спутниковые снимки, стриминговые аудио- и видеопотоки, банковские транзакции, содержимое веб-страниц и мобильных приложений, телеметрию — дистанционную автоматизированную систему сбора показаний с автомобилей и мобильных устройств, данные финансового рынка. 2
Основные характеристики Big Data определяют как шесть «V»: 1
- Volume (объём) — от 150 Гб в сутки. 1
- Velocity (скорость) — объём и содержимое Big Data ежесекундно меняются, поэтому собирать и обрабатывать их нужно на больших вычислительных мощностях. 1
- Variety (разнообразие) — массив больших данных может включать фото, видео и тексты, файлы разных объёмов и форматов, данные из множества разных источников. 1
- Veracity (достоверность) — большие данные собирают только из источников, которым можно доверять, а для анализа используют точные и объективные методы. 1
- Variability (изменчивость) — большие данные обновляются в режиме онлайн, поэтому их поток нестабилен. 1 На него влияют скорость передачи, изменение источников, действия пользователей и даже смена сезонов. 1
- Value (ценность) — сами по себе данные ничего не значат, но на их основе можно сделать глубокие выводы и принимать взвешенные решения. 1