Microsoft Fabric 决策指南:在 Warehouse 和 Lakehouse 之间进行选择
Microsoft Fabric 为数据存储提供两种企业级开放标准格式工作负载:仓库 和 Lakehouse。 本文比较了两个平台和每个平台的决策点。
标准
无代码或专业代码解决方案:想如何进行开发?
- 火花
- 使用湖屋
- T-SQL
- 使用仓库
仓库需求:是否需要多表事务?
- 是的
- 使用仓库
- 不
- 使用湖屋
数据复杂性:要分析哪种类型的数据?
- 不知道
- 使用湖屋
- 非结构化和结构化数据
- 使用湖屋
- 仅限结构化数据
- 使用仓库
选择候选服务
对服务执行详细的评估,以确认它是否满足你的需求。
Fabric 数据仓库中的 仓库 项是一个具有开放标准格式的企业规模数据仓库。
- 无需旋钮性能,只需最少的设置和部署,无需配置计算或存储。
- 初学者和经验丰富的数据专业人员都能享受简单直观的(无代码/专业代码)数据仓库体验。
- 以 OneLake 为中心的数据仓库采用开放的 Delta 格式存储数据,并且便于数据恢复和管理。
- 与所有 Fabric 工作负载完全集成。
- 利用 SQL 引擎进行大规模数据加载和转换,并提供完整的多表事务性保证。
- 具有跨数据库查询和完全集成的语义层的虚拟仓库。
- 具有端到端性能和使用情况可见性的企业就绪平台,具有内置的治理和安全性。
- 可以灵活地构建数据仓库或数据网,具体取决于组织需求,并选择无代码、低代码或 T-SQL 进行数据转换。
Fabric 数据工程中的 Lakehouse 项是一个数据体系结构平台,用于在单个位置存储、管理和分析结构化和非结构化数据。
- 在单个位置存储、管理和分析结构化和非结构化数据,以更快、高效地获取见解并做出决策。
- 灵活且可缩放的解决方案,使组织能够处理所有类型的和规模的大量数据。
- 轻松引入来自许多不同来源的数据,这些数据被转换为统一的 Delta 格式
- 自动表发现和注册,为数据工程师和数据科学家提供将文件完全托管到表的体验。
- 自动 SQL 分析终结点和默认数据集,允许 T-SQL 查询湖中的增量表
两者都包含在 Power BI Premium 或 Fabric 容量中。
比较不同的仓库功能
下表将 Warehouse 与 Lakehouse 的 SQL 分析终结点进行比较。
Microsoft Fabric 产品/服务
仓库
湖屋的 SQL 分析终结点
主要功能
与 ACID 兼容的完整数据仓库,具有 T-SQL 中的事务支持。
湖屋的由系统生成的只读 SQL 分析终结点,用于 T-SQL 查询和服务。 支持分析湖屋 Delta 表和通过快捷方式引用的 Delta Lake 文件夹。
开发人员个人资料
SQL 开发人员或公民开发人员
数据工程师或 SQL 开发人员
数据加载
SQL、管道、数据流
Spark、管道、数据流、快捷方式
Delta 表支持
读取和写入 Delta 表
读取 Delta 表
存储层
开放数据格式 - Delta
开放数据格式 - Delta
建议的用例
- 用于企业使用的数据仓库
- 支持部门、业务单位或自助服务使用的数据仓库
- T-SQL 中的结构化数据分析,其中包含表、视图、过程和函数以及针对 BI 的高级 SQL 支持
- 从湖屋浏览和查询 delta 表
- 用于分析的暂存数据和存档区域
- 带有区域的奖牌湖屋体系结构,用于“青铜”、“白银”和“黄金”分析
- 与仓库配对,用于企业分析用例
开发经验
- 仓库编辑器完全支持 T-SQL 数据引入、建模、开发和查询 UI 体验,用于数据引入、建模和查询
- 对第一方和第三方工具的读/写支持
- 湖屋 SQL 分析终结点,提供对视图、表值函数和 SQL 查询的有限 T-SQL 支持
- 用于建模和查询的 UI 体验
- 对第一方和第三方工具的有限 T-SQL 支持
T-SQL 功能
完整的 DQL、DML 和 DDL T-SQL 支持、完整的事务支持
完整 DQL,无 DML,有限的 DDL T-SQL 支持,例如 SQL 视图和 TVF