Плохое качество данных считается основным источником сбоев в информационных системах, потому что оно приводит к неточностям, несогласованности и неполноте набора данных. 1 Это, в свою очередь, вызывает неправильный анализ и ошибочное принятие решений. 1
Некоторые причины плохого качества данных:
- Человеческие ошибки. 2 Даже при наличии автоматизации данные всё равно вводятся через различные веб-интерфейсы, поэтому высока вероятность опечаток. 2
- Дублирование данных. 2 Из-за множества вариаций одной и той же записи в результатах аналитики возникают перекосы и неверные прогнозы. 2
- Несогласованность данных. 2 Несоответствия в одинаковой информации среди разных источников данных могут возникнуть, например, из-за различий в единицах измерения и языках. 2
- Неточные и отсутствующие данные. 2 Их сложно выявлять, поскольку формат, единицы и язык корректны, однако неточными данные делают опечатка или отсутствующие данные. 2
Таким образом, низкокачественные данные препятствуют принятию эффективных бизнес-решений, проведению точных аналитических исследований, прогнозированию будущих процессов в бизнесе. 4