Большие данные (Big Data) — это структурированные или неструктурированные массивы данных большого объёма. trends.rbc.ru Также под этим термином понимают обработку, хранение и анализ огромных объёмов данных, когда обычные методы работы с ними становятся неэффективными. selectel.ru
Основные характеристики больших данных:
- Volume (объём) — чаще всего измеряется терабайтами, петабайтами и даже эксабайтами. selectel.ru Нет точного понимания, с какого объёма данные становятся «большими». selectel.ru
- Velocity (скорость прироста и обработки данных). selectel.ru Объём и содержимое Big Data ежесекундно меняются, поэтому собирать и обрабатывать их нужно на больших вычислительных мощностях. practicum.yandex.ru
- Variety (разнообразие данных). practicum.yandex.ru selectel.ru Массив больших данных может включать фото, видео и тексты, файлы разных объёмов и форматов, данные из множества разных источников. practicum.yandex.ru
Примеры больших данных:
- информация о лайках, комментариях, активности пользователей в социальных сетях за месяц; selectel.ru
- массив данных о населении в городской системе распознавания лиц; selectel.ru
- логи серверов, где каждый день генерируются миллиарды записей; selectel.ru
- медицинские записи и образы, включая результаты анализов за десятилетия в Единой медицинской информационно-аналитической системе; selectel.ru
- аналитика поисковых систем, собирающая запросы от миллиардов пользователей. selectel.ru