Обработанные данные отличаются от сырых информационных сообщений тем, что обработанные данные структурированы и представлены в удобном для анализа формате, а сырые — это исходная, необработанная информация. garpun.com habr.com
Некоторые характеристики, по которым отличаются эти виды данных:
- Структура. habr.com Сырые данные — неструктурированные, обработанные — структурированные. habr.com
- Формат. habr.com Сырые данные представлены в исходном формате, например, в виде текстовых файлов или неструктурированных баз данных. habr.com Обработанные данные обычно унифицированы и удобны для анализа, представлены в виде таблиц, графиков или сводных отчётов. habr.com
- Объём. habr.com У сырых данных обычно слишком большой объём, так как они включают всю собранную информацию. habr.com В процессе обработки данные фильтруются, и их объём может значительно уменьшаться. habr.com
- Скорость взаимодействия. habr.com У сырых данных низкая скорость взаимодействия, у обработанных — выше. habr.com
Примеры сырых данных: логи веб-сервера, результаты анкетирования в сыром виде, данные из сенсоров устройств. habr.com Обработанные данные: очищенные и обобщённые отчёты по продажам со средними значениями и трендами, исторические данные, подготовленные для моделирования или анализа. habr.com