Система хранения данных в крупных ИТ-компаниях часто основана на концепции Data Warehouse (DWH). reg.cloud Это централизованное корпоративное хранилище, в котором собирается, обрабатывается и хранится информация из разных источников. reg.cloud
Некоторые элементы структуры DWH:
- Хранилище данных (Core Data Warehouse). reg.cloud Здесь аккумулируются обработанные данные, как правило, структурированные и разбитые по тематическим областям. reg.cloud
- Слой витрин данных (Data Marts). reg.cloud Это специализированные части DWH, которые подрезаются под потребности конкретных отделов: маркетинга, продаж, логистики. reg.cloud
- Метаданные и мастер-данные (Metadata & Master Data). reg.cloud Неотъемлемая часть современной структуры DWH. reg.cloud
Существует несколько подходов к созданию корпоративного хранилища данных: reg.cloud
- Подход Инмона. reg.cloud Сначала создаётся централизованное хранилище, организованное по нормализованной схеме, а уже потом на его основе строятся витрины данных для конкретных подразделений. reg.cloud
- Подход Кимбалла. reg.cloud В его основе лежит методология построения DWH по принципу «снизу вверх»: сначала создаются тематические Data Marts, адаптированные под конкретные бизнес-процессы, которые затем объединяются в единую систему. reg.cloud
Кроме DWH, для хранения больших данных могут использоваться и другие подходы, например Data Lake — «озеро данных», которое хранит информацию в сыром, необработанном виде. yandex.cloud