Понимание распределения данных важно при анализе больших объёмов информации, потому что это позволяет:
- Снизить время обработки. 1 Для каждого выделенного подмножества данных можно использовать наиболее подходящие механизмы и правила обработки. 1
- Повысить качество анализа. 1 Для конкретного типа данных будет использована максимально подходящая модель обработки, что положительно скажется на итоговых результатах. 1
- Обеспечить бесперебойную обработку. 1 В случае выхода из строя одного из узлов обрабатываемое подмножество данных передаётся на другой узел, что позволяет не прерывать процесс обработки информации. 1
- Избежать высоких затрат на передачу данных. 4 Если местоположение данных — один сервер, а их обработка происходит на другом сервере, то затраты на передачу информации могут превышать затраты на сам процесс обработки. 4 Чтобы этого избежать, данные нужно концентрировать на той же аппаратуре, на которой происходит обработка. 4