Несколько причин, по которым возникает избыточное количество данных в современной интернет-архитектуре:
- Возрастание числа генераторов данных. 3 К ним относятся системы Web 2.0, социальные сети разных видов, данные электронной почты, Twitter, Wiki-проекты. 3 Также огромные объёмы данных могут генерироваться датчиками различных типов: Call Data Records сотовых операторов, телеметрические данные, информация с камер видеонаблюдения и т. п.. 3
- Уменьшение стоимости хранения. 3 Многие компании могут позволить себе следовать парадигме «данные слишком ценны, чтобы их уничтожать». 3
- Импульсивное приобретение дополнительных данных. 4 Изменчивая рыночная ситуация может заставить компанию покупать дополнительные данные вместо того, чтобы полнее использовать собственные. 4
- Неоптимальные правила покупки данных. 4 Например, ведомства часто покупают данные отдельно друг от друга вместо того, чтобы сформировать коалицию и использовать рычаги совместных покупок для получения скидок. 4
Избыточные данные могут привести к информационным перегрузкам, когда менеджер не может найти важную информацию в море не относящихся к делу данных, которые разлились по корпоративным сетям. 4