什么是 Microsoft Fabric?
Microsoft Fabric 是一个适合企业使用的端到端分析平台。 它统一数据移动、数据处理、引入、转换、实时事件路由和报表生成。 它支持这些功能,包括数据工程、数据工厂、数据科学、Real-Time 分析、数据仓库和数据库等集成服务。
Fabric 提供无缝、用户友好的 SaaS 体验。 它将单独的组件集成到一个紧密的堆栈中。 它使用 OneLake 集中数据存储并嵌入 AI 功能,无需手动集成。 使用 Fabric,可以有效地将原始数据转换为可作的见解。
注释
你是使用 Fabric 的新开发人员吗? 你是否有兴趣分享入门体验并帮助我们改进? 我们想与你交谈! 如果感兴趣,请在此处注册。
Fabric 的功能
Microsoft Fabric 可提高工作效率、数据管理和 AI 集成。 以下是其一些关键功能:
- 特定于角色的工作负载:为组织中的各种角色 自定义解决方案,为每个用户提供必要的工具。
- OneLake: 简化数据管理和访问的统一数据湖。
- Copilot 支持:AI 驱动的功能,通过提供智能建议和自动执行任务来为用户提供帮助。
- 与 Microsoft 365 集成: 与 Microsoft 365 工具无缝集成,从而提高整个组织的协作和工作效率。
- Azure AI Foundry: 利用 Azure AI Foundry 实现高级 AI 和机器学习功能,使用户能够高效地生成和部署 AI 模型。
- 统一数据管理: 集中式数据发现,简化了治理、共享和访问。
与 SaaS 基础统一
Microsoft Fabric 构建在软件即服务(SaaS)平台上。 它将 Power BI、Azure Synapse Analytics、Azure 数据工厂等中的新组件和现有组件统一到单个环境中。
Fabric 将数据工程、数据工厂、数据科学、数据仓库、Real-Time 智能、行业解决方案、数据库和 Power BI 等工作负载集成到 SaaS 平台中。 其中每个工作负载都是针对不同的用户角色(如数据工程师、科学家或仓库专业人员)定制的,它们为特定任务提供服务。 Fabric的优势包括:
- 端到端集成分析
- 一致的用户友好体验
- 轻松访问和重用所有资产
- 统一的 Data Lake Storage,用于将数据保留在其原始位置
- AI增强型堆栈以加速数据流程
- 集中式管理和治理
Fabric 通过自动在套件中的所有项应用权限和继承数据敏感度标签,实现数据发现、管理和治理的集中化。 治理由 Purview 提供支持,它内置于 Fabric 中。 这种无缝集成使创建者能够专注于生成最佳工作,而无需管理底层基础结构。
Microsoft Fabric 的组件
Fabric 提供以下工作负载,每个工作负载都针对特定角色和任务进行自定义:
Power BI - Power BI 使你能够轻松连接到数据源、可视化和发现重要内容,并与所需的任何人或所有人共享。 这种集成体验允许业务所有者快速直观地访问 Fabric 中的所有数据,并使用数据做出更好的决策。 有关详细信息,请参阅 什么是 Power BI?
数据库 - Microsoft Fabric 中的数据库是开发人员友好的事务数据库,例如 Azure SQL 数据库,可用于在 Fabric 中轻松创建作数据库。 使用镜像功能,可以将各种系统中的数据汇集到 OneLake 中。 可以直接将现有数据资产复制到 Fabric 的 OneLake 中,包括来自 Azure SQL 数据库、Azure Cosmos DB、Azure Databricks、Snowflake 和 Fabric SQL 数据库的数据。 有关详细信息,请参阅 Microsoft Fabric 中的 SQL 数据库,Fabric 中的镜像是什么?
数据工厂 - 数据工厂提供新式数据集成体验,用于从丰富的数据源引入、准备和转换数据。 它结合了 Power Query 的简单性,可以使用 200 多个本机连接器连接到本地和云中的数据源。 有关详细信息,请参阅 什么是 Microsoft Fabric 中的数据工厂?
行业解决方案 - Fabric 提供行业特定的数据解决方案,可满足独特的行业需求和挑战,包括数据管理、分析和决策。 有关详细信息,请参阅 Microsoft Fabric 中的行业解决方案。
Real-Time Intelligence - 实时智能是事件驱动方案、流数据和数据日志的端到端解决方案。 它通过处理数据引入、转换、存储、分析、可视化、跟踪、AI 和实时操作,实现提取针对动态数据的见解、可视化效果和操作。 Real-Time Intelligence 中的 Real-Time 枢纽 提供了各种各样的无代码连接器,并将其汇集成一个组织数据目录,这些数据在 Fabric 中受到保护、治理和集成。 有关详细信息,请参阅 Fabric 中的实时智能是什么?。
数据工程 - Fabric 数据工程为 Spark 平台提供了出色的创作体验。 它使你能够创建、管理和优化基础结构,以便收集、存储、处理和分析大量数据。 Fabric Spark 与数据工厂的集成使你可以计划和协调笔记本和 Spark 作业。 有关详细信息,请参阅 Microsoft Fabric 中的数据工程是什么?
Fabric Data Science - Fabric Data Science 使你能够从 Fabric 生成、部署和作机器学习模型。 它与 Azure 机器学习集成以提供内置的试验跟踪和模型注册表。 数据科学家可以使用预测来丰富组织数据,业务分析师可以将这些预测集成到其 BI 报表中,从而从描述性见解向预测见解转变。 有关详细信息,请参阅 什么是 Microsoft Fabric 中的数据科学?
Fabric 数据仓库 - Fabric 数据仓库提供行业领先的 SQL 性能和规模。 它将计算与存储分开,从而实现这两个组件的独立扩展。 此外,它还以 Delta Lake 开放格式原生存储数据。 有关详细信息,请参阅 什么是 Microsoft Fabric 中的数据仓库?
Microsoft Fabric 使组织和个人能够将大型复杂数据存储库转换为可作的工作负载和分析,并且是数据网格体系结构的实现。 有关详细信息,请参阅 什么是数据网格?
OneLake:湖屋的统一
Microsoft Fabric 平台跨企业统一 OneLake 和 Lakehouse 体系结构。
OneLake
Data Lake 是所有 Fabric 工作负载的基础。 在 Microsoft Fabric 中,此湖称为OneLake。 它内置于平台中,充当所有组织数据的单个存储。
OneLake 基于 ADLS(Azure Data Lake Storage) Gen2 构建。 它提供单一的 SaaS 体验和一个面向整个租户的数据存储,为专业开发人员和普通开发者服务。 它简化了用户体验,无需了解复杂的基础结构详细信息,例如资源组、RBAC、Azure 资源管理器、冗余或区域。 无需 Azure 帐户即可使用 Fabric。
OneLake 通过提供一个统一的存储系统来防止数据孤岛,使数据发现、共享和一致的策略强制实施变得容易。 有关详细信息,请参阅 什么是 OneLake?
OneLake 和 Lakehouse 数据层次结构
OneLake 的分层设计简化了组织范围的管理。 默认情况下,Fabric 包括 OneLake,因此不需要预先预配。 每个租户获取一个统一的 OneLake,其中包含跨用户、区域和云的单个文件系统命名空间。 OneLake 将数据组织到容器中,以便轻松处理。 租户会映射到 OneLake 的根目录,且位于层次结构的顶层。 可以在租户中创建多个工作区(类似于文件夹)。
下图显示了 Fabric 如何在 OneLake 中存储数据。 每个租户可以有多个工作区,每个工作区中可以有多个湖屋。 湖屋是文件、文件夹、和表的集合,充当数据湖的数据库。 若要了解详细信息,请参阅 什么是湖屋?。
租户中的每个开发人员和业务部门都可以在 OneLake 中创建自己的工作区。 他们可以将数据引入 lakehouses 并开始处理、分析和协作处理这些数据,这类似于在 Microsoft Office 中使用 OneDrive。
Fabric 计算引擎
所有Microsoft Fabric 计算体验都预配置了 OneLake,就像 Office 应用自动使用组织 OneDrive 一样。 数据工程、数据仓库、数据工厂、Power BI 和 Real-Time 智能等体验。 使用 OneLake 作为其本机存储,无需进行额外的设置。
OneLake 允许使用 快捷方式 功能立即装载现有的 PaaS 存储帐户。 无需迁移现有数据。 快捷方式提供对 Azure Data Lake Storage 中的数据的直接访问。 它们还可以在用户和应用程序之间轻松共享数据,而无需复制文件。 此外,您还可以为其他存储系统创建快捷方式,借助智能缓存分析跨云数据,以降低流出成本,并使数据更靠近计算资源。
Real-Time 中心:数据流的统一
实时中心是动态数据的基础位置。 它为流式处理数据提供统一的 SaaS 体验和租户范围的逻辑环境。 它列出来自每个源的数据,允许用户发现、引入、管理和响应数据。 它包含流和 KQL 数据库表。 流包括 数据流、Microsoft 来源(例如,Azure 事件中心、Azure IoT 中心、Azure SQL DB 更改数据捕获(CDC)、Azure Cosmos DB CDC和 PostgreSQL DB CDC),以及 Fabric 事件(包括 Azure、Microsoft 365 或其他云中的 Fabric 事件和外部事件)。
借助 Real-Time 中心,可以轻松地从各种源发现、引入、管理和使用动态数据,从而在一个位置协作和开发流式处理应用程序。 有关详细信息,请参阅 什么是 Real-Time 中心?
ISV 的 Fabric 解决方案
如果你是一家独立软件供应商(ISV),希望将解决方案与 Microsoft Fabric 集成,则可以根据所需的集成级别使用以下路径之一:
- 互操作 - 将解决方案与 OneLake Foundation 集成,并与 Fabric 建立基本连接和互操作性。
- 在 Fabric 上进行开发 - 在 Fabric 平台的基础上构建解决方案,或无缝地将 Fabric 的功能嵌入到现有应用程序中。 可以使用此选项轻松使用 Fabric 功能。
- 生成 Fabric 工作负载 - 在 Fabric 中创建自定义工作负载和体验,定制产品/服务以最大程度地提高其在 Fabric 生态系统中的影响。
有关详细信息,请参阅 Fabric ISV 合作伙伴生态系统。