Microsoft Fabric 决策指南:在仓库和湖屋之间选择

Microsoft Fabric 为数据存储提供两种企业级的开放标准格式工作负载:仓库湖屋。 本文比较了两个平台和每个平台的决策点。

条件

关系图包含 Microsoft Fabric 中湖屋和仓库的决策树。

无代码或专业代码解决方案:你希望如何进行开发?

  • Spark
    • 使用湖屋
  • T-SQL
    • 使用仓库

仓库需求:是否需要多表事务?

    • 使用仓库
    • 使用湖屋

数据复杂性:正在分析哪种类型的数据?

  • 不知道
    • 使用湖屋
  • 非结构化和结构化数据
    • 使用湖屋
  • 仅限结构化数据
    • 使用仓库

选择候选服务

对服务执行详细的评估,以确认其是否满足需求。

Fabric 数据仓库中的“仓库”项是一个具有开放标准格式的企业级数据仓库

  • 没有具有最少设置和部署的旋钮性能,无需配置计算或存储。 ​
  • 初学者和经验丰富的数据专业人员(无代码/专业代码)的简单直观的仓库体验。
  • 以湖为中心的仓库以开放增量格式以开放增量格式将数据存储在 OneLake 中,并轻松进行数据恢复和管理。
  • 与所有的 Fabric 工作负载完全集成。
  • 大规模加载和转换数据,以及 SQL 引擎提供的完整多表事务保证。
  • 具有跨数据库查询和完全集成的语义层的虚拟仓库。
  • 具有端到端性能和使用情况可见性的企业就绪平台,具有内置的治理和安全性。
  • 可以根据组织需求和选择无代码、低代码或 T-SQL 进行转换,以灵活地构建数据仓库或数据网格。

Fabric 数据工程中的“湖屋”项是一个数据体系结构平台,用于在单个位置存储、管理和分析结构化数据和非结构化数据

  • 在单个位置存储、管理和分析结构化和非结构化数据,以更快、高效地获取见解并做出决策。
  • 灵活且可缩放的解决方案,使组织能够处理各种类型和规模的大量数据。
  • 轻松引入来自许多不同的源的数据,这些数据将转换为统一的增量格式
  • 自动表发现和注册,为数据工程师和数据科学家提供将文件完全托管到表的体验。 ​
  • 自动 SQL 分析端点和默认数据集,允许 T-SQL 查询湖中的增量表

两者都包含在 Power BI Premium 或 Fabric 容量中。

比较不同的仓库功能

此表比较 Lakehouse 的仓库和 SQL 分析端点。

Microsoft Fabric 产品/服务

仓库

Lakehouse 的 SQL 分析端点


主要功能

与 ACID 兼容的完整数据仓库,具有 T-SQL 中的事务支持。

系统为 Lakehouse 生成的只读 SQL 分析端点,用于 T-SQL 查询和服务。 支持分析湖屋 Delta 表和通过快捷方式引用的 Delta Lake 文件夹。


开发人员个人资料

SQL 开发人员或平民开发者

数据工程师或 SQL 开发人员


数据加载

SQL、管道、数据流

Spark、管道、数据流、快捷方式


Delta 表支持

读取和写入 Delta 表

读取 Delta 表


存储层

开放数据格式 - Delta

开放数据格式 - Delta


推荐用例

  • 供企业使用的数据仓库
  • 支持部门、业务单位或自助服务使用的数据仓库
  • T-SQL 中的结构化数据分析,包含表、视图、过程和函数,以及针对 BI 的高级 SQL 支持
  • 从湖屋浏览和查询 delta 表
  • 用于分析的暂存数据和存档区域
  • 带有区域的奖牌湖屋体系结构,用于“青铜”、“白银”和“黄金”分析
  • 与仓库配对,用于企业分析用例

开发体验

  • 仓库编辑器,完全支持 T-SQL 数据引入、建模、开发和查询 UI 体验,用于数据引入、建模和查询
  • 对第一方和第三方工具的读/写支持
  • Lakehouse SQL 分析端点对视图、表值函数和 SQL 查询提供有限的 T-SQL 支持
  • 针对建模和查询的 UI 体验
  • 对第一方和第三方工具的有限 T-SQL 支持

T-SQL 功能

完整 DQL、DML 和 DDL T-SQL 支持,完全事务支持

完整 DQL,无 DML,有限的 DDL T-SQL 支持,例如 SQL 视图和 TVF