ETL-процесс (Extract, Transform, Load) — это процесс извлечения данных из источника, их преобразования и загрузки в целевое хранилище. docs.getdbt.tech
Процесс состоит из трёх этапов: www.decosystems.ru
- Извлечение (Extract). www.decosystems.ru npc.ba Данные извлекаются из множества источников, таких как базы данных, файлы, CRM- и ERP-системы, API веб-приложений, IoT-датчики и другие платформы. npc.ba Основная цель этого этапа — собрать данные в их исходном формате, сохранив их целостность и избежав потерь или повреждений. npc.ba
- Преобразование (Transform). www.decosystems.ru npc.ba Данные очищаются, нормализуются и адаптируются под требования аналитики. npc.ba Здесь удаляются дубликаты, исправляются ошибки, заполняются пропуски, а также данные приводятся к стандартным единицам измерения. npc.ba Сложные структуры, такие как иерархические JSON-файлы, разбираются и структурируются, таблицы объединяются через связи, а из отдельных полей извлекается нужная информация. npc.ba
- Загрузка (Load). www.decosystems.ru blog.skillfactory.ru Подготовленные данные загружаются в новое хранилище и размещаются на своих местах. blog.skillfactory.ru Кроме самой информации, ETL-система может передавать метаданные — данные о данных, например сведения об их структуре. blog.skillfactory.ru
ETL-процессы используются, когда нужно перенести много разнородных данных: собрать их, привести к единому виду, загрузить в новую систему и сохранить всю информацию по пути. blog.skillfactory.ru