Обработанные данные отличаются от сырых информационных сообщений тем, что обработанные данные структурированы и представлены в удобном для анализа формате, а сырые — это исходная, необработанная информация. 14
Некоторые характеристики, по которым отличаются эти виды данных:
- Структура. 4 Сырые данные — неструктурированные, обработанные — структурированные. 4
- Формат. 4 Сырые данные представлены в исходном формате, например, в виде текстовых файлов или неструктурированных баз данных. 4 Обработанные данные обычно унифицированы и удобны для анализа, представлены в виде таблиц, графиков или сводных отчётов. 4
- Объём. 4 У сырых данных обычно слишком большой объём, так как они включают всю собранную информацию. 4 В процессе обработки данные фильтруются, и их объём может значительно уменьшаться. 4
- Скорость взаимодействия. 4 У сырых данных низкая скорость взаимодействия, у обработанных — выше. 4
Примеры сырых данных: логи веб-сервера, результаты анкетирования в сыром виде, данные из сенсоров устройств. 4 Обработанные данные: очищенные и обобщённые отчёты по продажам со средними значениями и трендами, исторические данные, подготовленные для моделирования или анализа. 4