什么是 Microsoft Fabric?

Microsoft Fabric 是一个端到端分析和数据平台,专为需要统一解决方案的企业设计。 它包含数据移动、处理、引入、转换、实时事件路由以及报表生成。 它提供了一套全面的服务,包括数据工程、数据工厂、数据科学、实时分析、数据仓库和数据库。

使用 Fabric 时,无需组装来自多个供应商的不同服务。 相反,它提供了一个无缝集成的用户友好平台,可简化分析要求。 Fabric 在服务型软件 (SaaS) 模型上运行,为解决方案带来了简单性和集成。

Microsoft Fabric 将单独的组件集成到一个内聚堆栈中。 可以使用 OneLake 集中数据存储,而不是依赖不同的数据库或数据仓库。 AI 功能无缝嵌入 Fabric,无需手动集成。 借助 Fabric,可以轻松地将原始数据转换为商务用户的可操作见解。

Fabric 的功能

Microsoft Fabric 提供了各种功能,旨在提高工作效率、数据管理和 AI 集成。 下面是部分关键功能:

  • 特定于角色的工作负载:为组织中的各种角色自定义解决方案,并为每个用户提供必要的工具。
  • OneLake:一个统一的数据湖,可简化数据管理和访问。
  • Copilot 支持:AI 驱动的功能,通过提供智能建议和自动执行任务来为用户提供帮助。
  • 与 Microsoft 365 的集成:与 Microsoft 365 工具无缝集成,从而提高整个组织的协作和工作效率。
  • Azure AI Studio:利用 Azure AI Studio 提供高级 AI 和机器学习功能,使用户能够高效地生成和部署 AI 模型。
  • 统一的数据管理:集中式数据发现,可简化治理、共享和访问。

与 SaaS 基础的统一

Microsoft Fabric 是基于服务型软件 (SaaS) 构建的。 它将 Power BI、Azure Synapse Analytics、Azure 数据工厂等中的新组件和现有组件统一到为自定义用户体验量身定制的一个环境中。

Fabric 不同体验下的服务型软件基础示意图。

Fabric 将数据工程、数据工厂、数据科学、数据仓库、实时智能、行业解决方案、数据库和 Power BI 等工作负载集成到一个共享的 SaaS 基础中。 每一种体验都是针对不同的用户角色(如数据工程师、科学家或仓库专业人员)量身定制的,它们服务于特定任务。 AI 集成的 Fabric 堆栈可加速数据旅程,并提供以下优势:

  • 广泛的集成分析
  • 熟悉且易于学习的共享体验
  • 轻松访问和重用所有资产
  • 统一的 Data Lake Storage,用于将数据保留在其原始位置
  • 集中式管理和治理

Fabric 无缝集成了数据和服务,实现统一的管理、治理和发现。 它确保了项、数据和行级访问的安全性。 可以集中配置核心企业功能。 权限会自动应用于所有基础服务。 此外,数据敏感度标签自动跨套件中的项继承。 治理由 Fabric 中内置的 Purview 提供支持。

Fabric 使创建者能够专注于制作最佳作品,他们无需集成、管理甚至了解底层基础结构。

Microsoft Fabric 的组件

Fabric 提供了一套全面的分析体验,旨在无缝协同工作。 该平台针对特定角色和特定任务量身定制每种体验:

  • Power BI - 使用 Power BI,可以轻松连接到数据源,可视化并发现重要内容,并根据需要与任何人共享。 这种集成体验使企业主能够快速直观地访问 Fabric 中的所有数据,并利用数据做出更好的决策。 有关详细信息,请参阅什么是 Power BI?

  • 数据库 - Microsoft Fabric 中的数据库(例如 Azure SQL 数据库)是开发人员友好的事务数据库,可用于在 Fabric 中轻松创建操作数据库。 使用镜像功能,可以将来自各种系统的数据整合到 OneLake 中。 可以将现有数据资产直接连续复制到 Fabric 的 OneLake 中,其中包括来自 Azure SQL 数据库、Azure Cosmos DB、Azure Databricks、Snowflake 和 Fabric SQL 数据库的数据。 有关详细信息,请参阅 Microsoft Fabric SQL 数据库什么是 Fabric 中的镜像?

  • 数据工厂 - 数据工厂提供新式数据集成体验,用于从丰富的数据源引入、准备和转换数据。 它融合了 Power Query 的简单性,可以使用 200 多个本机连接器连接到本地和云中的数据源。 有关详细信息,请参阅 什么是 Microsoft Fabric 中的数据工厂?

  • 行业解决方案 - Fabric 提供特定于行业的数据解决方案,可应对独特的行业需求和挑战,包括数据管理、分析和决策。 有关详细信息,请参阅 Microsoft Fabric 中的行业解决方案

  • 实时智能 - 实时智能是用于事件驱动应用场景、流式处理数据和数据日志的端到端解决方案。 其通过处理数据摄取、转换、存储、分析、可视化、跟踪、AI 和实时操作,支持对动态数据进行见解、可视化和操作。 实时智能中的实时中心提供各种各样的无代码连接器,并融合到跨 Fabric 进行保护、治理和集成的组织数据目录。 有关更多信息,请参阅什么是 Fabric 中的实时智能?

  • 数据工程 - Fabric 数据工程提供了一个具有出色创作体验的 Spark 平台。 它使你能够创建、管理和优化用于收集、存储、处理和分析大量数据的基础架构。 通过 Fabric Spark 与数据工厂的集成,可以计划和编排笔记本和 Spark 作业。 有关详细信息,请参阅 什么是 Microsoft Fabric 中的数据工程?

  • Fabric 数据科学 - Fabric 数据科学使你能够从 Fabric 生成、部署和操作机器学习模型。 它与 Azure 机器学习集成,提供内置的试验跟踪和模型注册表。 数据科学家可以通过预测丰富组织数据,业务分析师可以将这些预测集成到其 BI 报表中,从而实现从描述性见解到预测性见解的转变。 有关详细信息,请参阅 什么是 Microsoft Fabric 中的数据科学?

  • Fabric 数据仓库 - Fabric 数据仓库提供行业领先的 SQL 性能和规模。 它将计算与存储分开,实现了两个组件的独立缩放。 此外,它原生地以开放 Delta Lake 格式存储数据。 有关详细信息,请参阅 什么是 Microsoft Fabric 中的数据仓库?

Microsoft Fabric 使组织和个人能够将大型复杂的数据存储库转变为可操作的工作负载和分析,是数据网格体系结构的一种实现方式。 有关详细信息,请参阅什么是数据网格?

OneLake:湖屋的统一

Microsoft Fabric 平台统一了整个企业的 OneLake 和湖屋体系结构。

OneLake

数据湖是构建所有 Fabric 工作负载的基础。 Microsoft Fabric Lake 也称为 OneLake。 OneLake 内置于 Fabric 平台中,提供一个统一的位置来存储运行工作负载的所有组织数据。

OneLake 基于 ADLS (Azure Data Lake Storage) Gen2 构建。 它为面向专业和平民开发者的数据提供单一 SaaS 体验和租户范围的存储。 OneLake 简化了 Fabric 体验,你无需了解基础结构概念,例如资源组、RBAC(基于角色的访问控制)、Azure 资源管理器、冗余或区域等。 无需 Azure 帐户即可使用 Fabric。

OneLake 消除了数据孤岛,即单个开发人员在预配和配置自己的独立存储帐户时通常创建的数据孤岛。 相反,OneLake 为所有开发人员提供一个统一存储系统。 它确保轻松地发现、共享数据,并统一强制实施策略和安全设置。 有关详细信息,请参阅什么是 OneLake?

OneLake 和 Lakehouse 数据层次结构

OneLake 本质上是分层的,用于简化整个组织的管理。 Microsoft Fabric 包括 OneLake,无需进行任何预先预配。 每个租户只有一个 OneLake,它提供跨用户、区域和云的单一虚拟管理平台文件系统命名空间。 OneLake 将数据组织到可管理的容器中,以便于处理。 租户会映射到 OneLake 的根目录,且位于层次结构的顶层。 可以在租户中创建任意数量的工作区,可将这些工作区视为文件夹。

下图显示了 Fabric 如何将数据存储在 OneLake 内的各种项中。 如图所示,可以在租户内创建多个工作区,并在每个工作区中创建多个湖屋。 湖屋是文件、文件夹、和表的集合,充当数据湖的数据库。 若要了解详细信息,请参阅什么是湖屋?

租户工作区内湖屋和语义模型等项的层次结构关系图。

租户中的每个开发人员和业务单位都可以轻松在 OneLake 中创建自己的工作区。 他们可以将数据引入自己的湖屋,开始处理、分析和协作处理数据,就像 Microsoft Office 中的 OneDrive 一样。

Fabric 计算引擎

所有 Microsoft Fabric 计算体验都预连接到 OneLake,就像 Office 应用程序预连接以使用组织 OneDrive 一样。 数据工程、数据仓库、数据工厂、Power BI 和实时智能等体验使用 OneLake 作为本机存储。 它们不需要任何额外的配置。

不同 Fabric 体验都访问同一个 OneLake 数据存储的关系图。

OneLake 允许使用快捷方式功能将现有平台即服务 (PaaS) 存储帐户即时装载到 OneLake 中。 不需要迁移或移动任何现有数据。 使用快捷方式可以访问存储在 Azure Data Lake Storage 中的数据。

此外,快捷方式使你能够轻松地在用户和应用程序之间共享数据,而无需移动或复制信息。 可以创建指向其他存储系统的快捷方式,让你能够通过透明智能缓存跨云编写和分析数据,从而降低流出量成本,使数据更接近计算。

实时中心:数据流的统一

实时中心是动态数据的基础位置。

实时中心为所有动态数据提供统一的 SaaS 体验和租户范围的逻辑位置。 实时中心列出了客户可以发现、引入、管理、使用和响应的所有源的所有动态数据,并包含KQL 数据库表。 流包括数据流、Microsoft 源(例如 Azure 事件中心Azure IoT 中心Azure SQL DB 变更数据捕获 (CDC)Azure Cosmos DB CDCPostgreSQL DB CDC)和 Fabric 事件(从 Azure、Microsoft 365 或其他云引入的 Fabric 系统事件和外部系统事件)

实时中心使用户能够轻松发现、引入、管理和使用来自各种来源的动态数据,以便他们可以在一个位置进行协作和开发流式处理应用程序。 有关详细信息,请参阅什么是实时中心?

ISV 的 Fabric 解决方案

如果你是独立软件供应商 (ISV),希望将解决方案与 Microsoft Fabric 集成,则可以根据所需的集成级别使用以下路径之一:

  • 互操作 - 将你的解决方案与 OneLake Foundation 集成,并与 Fabric 建立基本连接和互操作性。
  • 在 Fabric 上进行开发 - 在 Fabric 平台的基础上构建解决方案,或在现有应用程序中无缝嵌入 Fabric 的功能。 可以通过此选项轻松使用 Fabric 功能。
  • 生成 Fabric 工作负载 - 在 Fabric 中创建自定义工作负载和体验,定制产品/服务以最大限度地提高其在 Fabric 生态系统中的影响力。

有关详细信息,请参阅 Fabric ISV 合作伙伴生态系统