Lakehouse-архитектура решает проблему двухуровневой архитектуры хранения данных, объединяя преимущества систем для хранения (озера) и аналитики (хранилища). 15
Некоторые способы, как это происходит:
- Поддержка транзакций. 2 Конвейеры данных способны одновременно считывать и записывать информацию. 2 Поддержка ACID-транзакций обеспечивает согласованность, поскольку несколько сторон одновременно считывают или записывают данные. 2
- Совместимость с BI. 24 Lakehouse позволяет использовать инструменты бизнес-аналитики непосредственно в исходных данных, повышая их актуальность, а также уменьшая задержку и затраты, связанные с необходимостью выполнения операций над двумя копиями данных как в озере данных, так и в хранилище. 2
- Изоляция хранения от вычислений. 24 Ресурсы хранения и вычислений управляются отдельно, что позволяет использовать их более гибко и эффективно в зависимости от требований системы к работе с данными. 4
- Открытость стандартизованных форматов хранения данных. 24 Это позволяет использовать разные технологии и инструменты для работы с данными. 4 Пользователи имеют право выбирать самые подходящие из них в зависимости от своих потребностей и предпочтений. 4
- Многообразие различных типов данных. 24 Lakehouse можно использовать для хранения, уточнения, анализа и доступа к разным типам данных, включая изображения, видео, аудио, JSON-структуры и текст. 2
- Поддержка разнообразных рабочих нагрузок. 24 Lakehouse поддерживает разнообразные рабочие нагрузки, в том числе аналитику, машинное обучение, хранение данных, а также их обработку в реальном времени. 4