Microsoft Fabric 决策指南:在仓库和湖屋之间选择
Microsoft Fabric 为数据存储提供两种企业级的开放标准格式工作负载:仓库和湖屋。 本文比较了两个平台和每个平台的决策点。
条件
无代码或专业代码解决方案:你希望如何进行开发?
- Spark
- 使用湖屋
- T-SQL
- 使用仓库
仓库需求:是否需要多表事务?
- 是
- 使用仓库
- 无
- 使用湖屋
数据复杂性:正在分析哪种类型的数据?
- 不知道
- 使用湖屋
- 非结构化和结构化数据
- 使用湖屋
- 仅限结构化数据
- 使用仓库
选择候选服务
对服务执行详细的评估,以确认其是否满足需求。
Fabric 数据仓库中的“仓库”项是一个具有开放标准格式的企业级数据仓库。
- 没有具有最少设置和部署的旋钮性能,无需配置计算或存储。
- 初学者和经验丰富的数据专业人员(无代码/专业代码)的简单直观的仓库体验。
- 以湖为中心的仓库以开放增量格式以开放增量格式将数据存储在 OneLake 中,并轻松进行数据恢复和管理。
- 与所有的 Fabric 工作负载完全集成。
- 大规模加载和转换数据,以及 SQL 引擎提供的完整多表事务保证。
- 具有跨数据库查询和完全集成的语义层的虚拟仓库。
- 具有端到端性能和使用情况可见性的企业就绪平台,具有内置的治理和安全性。
- 可以根据组织需求和选择无代码、低代码或 T-SQL 进行转换,以灵活地构建数据仓库或数据网格。
Fabric 数据工程中的“湖屋”项是一个数据体系结构平台,用于在单个位置存储、管理和分析结构化数据和非结构化数据。
- 在单个位置存储、管理和分析结构化和非结构化数据,以更快、高效地获取见解并做出决策。
- 灵活且可缩放的解决方案,使组织能够处理各种类型和规模的大量数据。
- 轻松引入来自许多不同的源的数据,这些数据将转换为统一的增量格式
- 自动表发现和注册,为数据工程师和数据科学家提供将文件完全托管到表的体验。
- 自动 SQL 分析端点和默认数据集,允许 T-SQL 查询湖中的增量表
两者都包含在 Power BI Premium 或 Fabric 容量中。
比较不同的仓库功能
此表比较 Lakehouse 的仓库和 SQL 分析端点。
Microsoft Fabric 产品/服务
仓库
Lakehouse 的 SQL 分析端点
主要功能
与 ACID 兼容的完整数据仓库,具有 T-SQL 中的事务支持。
系统为 Lakehouse 生成的只读 SQL 分析端点,用于 T-SQL 查询和服务。 支持分析湖屋 Delta 表和通过快捷方式引用的 Delta Lake 文件夹。
开发人员个人资料
SQL 开发人员或平民开发者
数据工程师或 SQL 开发人员
数据加载
SQL、管道、数据流
Spark、管道、数据流、快捷方式
Delta 表支持
读取和写入 Delta 表
读取 Delta 表
存储层
开放数据格式 - Delta
开放数据格式 - Delta
推荐用例
- 供企业使用的数据仓库
- 支持部门、业务单位或自助服务使用的数据仓库
- T-SQL 中的结构化数据分析,包含表、视图、过程和函数,以及针对 BI 的高级 SQL 支持
- 从湖屋浏览和查询 delta 表
- 用于分析的暂存数据和存档区域
- 带有区域的奖牌湖屋体系结构,用于“青铜”、“白银”和“黄金”分析
- 与仓库配对,用于企业分析用例
开发体验
- 仓库编辑器,完全支持 T-SQL 数据引入、建模、开发和查询 UI 体验,用于数据引入、建模和查询
- 对第一方和第三方工具的读/写支持
- Lakehouse SQL 分析端点对视图、表值函数和 SQL 查询提供有限的 T-SQL 支持
- 针对建模和查询的 UI 体验
- 对第一方和第三方工具的有限 T-SQL 支持
T-SQL 功能
完整 DQL、DML 和 DDL T-SQL 支持,完全事务支持
完整 DQL,无 DML,有限的 DDL T-SQL 支持,例如 SQL 视图和 TVF