Оперативная интеграция данных в информационных системах — это процесс, в ходе которого разнородные информационные наборы из различных источников приводятся к единому формату, структуре и логике. 1
Типовой сценарий интеграции данных включает несколько этапов: 1
- Сбор (извлечение) информации. 1 Компания определяет, из каких источников потребуются данные: CRM, ERP, сайты, мобильные приложения, складские системы, модули бухгалтерской отчётности и прочие. 1 Для каждой системы выбирают метод извлечения: прямое подключение к базе данных, выгрузки через API или использование промежуточного репозитория. 1
- Преобразование и унификация. 1 Извлечённые данные конвертируются под единый формат. 1 Часто используется метод ETL (Extract, Transform, Load), когда сначала идёт извлечение (Extract), затем преобразование (Transform) — удаление дубликатов, конверсия типов, выравнивание структуры, — и только после этого происходит загрузка (Load) в целевое хранилище или BI-платформу. 1
- Загрузка в хранилище. 1 Наиболее распространённый подход — это создание корпоративного хранилища (Data Warehouse) или же распределённых Data Marts, куда поступают преобразованные данные. 1 После загрузки все информационные потоки собираются в одном или нескольких «узлах», откуда ими легко управлять. 1
- Анализ, представление и использование. 1 Когда информация сконцентрирована в одном месте, пользователи (аналитики, менеджеры и прочие заинтересованные специалисты) используют инструменты визуализации и отчётности для формирования нужных срезов. 1
Существуют различные типы интеграции данных, которые зависят от источника и вида данных. 3 Некоторые из них:
- Потоковая передача данных. 5 Это непрерывный процесс перемещения информации в центральную систему в режиме реального времени по мере её создания или изменения в различных связанных приложениях. 5
- Виртуализация данных. 35 Это единое представление всех данных в базе данных, использующее виртуальный уровень абстракции, обеспечивающее доступ к данным в реальном времени независимо от местоположения, исходной системы или типа. 3
- Перемещение данных, ориентированное на сообщения. 3 Блоки данных группируются в сообщения, которые считываются приложениями, с обменом данными в реальном времени. 3