探索使用 Microsoft Fabric 进行的端到端分析

已完成

可缩放的分析可能很复杂、分散且成本高昂。 使用 Microsoft Fabric,你不必将所有时间都花在组合来自不同的供应商的各种服务上。 相反,你可以使用易于理解、设置、创建和管理的单个产品。 Fabric 在集成用户界面中提供角色优化体验和工具。

除了简单的共享用户体验外,Fabric 还是统一的服务型软件 (SaaS) 产品/服务,所有数据采用单一开放格式存储在 OneLake 中。 OneLake 可由平台中的所有分析引擎访问。 Fabric 通过 Internet 连接提供可伸缩性、成本效益、随时随地的可访问性,还具有 Microsoft 提供的持续更新和维护。

探索 OneLake

OneLake 是 Fabric 以数据湖为中心的体系结构,它为数据专业人员和企业提供了一个单一的集成环境来协作处理数据项目。 Fabric 的 OneLake 体系结构可促进数据团队成员之间的协作,使得无需在不同系统和团队之间移动和复制数据,从而节省时间。 OneCopy 是 OneLake 的关键组件,可用于从单个副本读取数据,而无需移动或复制数据。

将它看作是用于数据的 OneDrivea;OneLake 将不同区域和云中的存储位置组合到单个逻辑湖中,无需移动或复制数据。 与预先连接 Office 应用程序来使用组织 OneDrive 的方式类似,Fabric 中的所有计算工作负载都预配置为与 OneLake 配合使用。 Fabric 的数据仓库、数据工程(湖屋和笔记本)、数据集成(管道和数据流)、实时智能和 Power BI 都使用 OneLake 作为其本机存储,无需任何额外配置。

基于 OneLake 构建的 Fabric 体系结构的屏幕截图。

OneLake 基于 Azure Data Lake Storage (ADLS) 构建,可以 Delta、Parquet、CSV 和 JSON 等任何格式存储数据。

这意味着 Fabric 中的所有计算引擎都自动将其数据存储在 OneLake 中。 然后,所有计算引擎都可以直接访问存储在 OneLake 中的数据,而无需移动或复制。 对于表格数据,Fabric 中的分析引擎将以 delta-parquet 格式写入数据,并且所有引擎都会与格式无缝交互。

OneLake 的一个重要功能是能够创建快捷方式,这些快捷方式是 OneLake 中指向其他文件或存储位置的嵌入引用。 通过快捷方式,无需复制现有云数据就能快速获取它,而且 Fabric 体验能够从同一个来源派生数据并始终保持同步。

OneLake 体系结构的屏幕截图,显示 Delta-Parquet 存储格式是无服务器计算的基础。

探索 Fabric 体验

Fabric 提供了一组分析体验,它们旨在完成特定任务并无缝协作。 Fabric 体验包括:

  • Synapse 数据工程:使用 Spark 平台进行大规模数据转换的数据工程。
  • Synapse 数据仓库:具有行业领先的 SQL 性能和缩放来支持数据使用的数据仓库。
  • Synapse 数据科学:使用 Azure 机器学习和 Spark 在可缩放的环境中进行模型训练和执行跟踪的数据科学。
  • Synapse 实时智能:用于实时查询和分析大量数据的实时智能。
  • 数据工厂:将 Power Query 与 Azure 数据工厂的规模相结合来移动和转换数据的数据集成。
  • Power BI:用于通过交互式报表将数据转换为决策的商业智能。

Fabric 通过在单个平台上统一所有这些体验,提供全面的数据分析解决方案。

探索工作区

Fabric 使用工作区来包含跨不同体验创建的不同项。 每个组织都可以自定义如何分隔和控制对项的访问。 一些可能性包括一个用于湖屋开发的专用工作区和一个生产湖屋的单独工作区。

在 Microsoft Fabric 中,工作区充当逻辑容器,可帮助组织和管理数据、报表和其他资产。 它们提供明确的资源分离,以便更轻松地控制访问和维护安全性。 每个工作区可以有自己的权限集,确保只有经过授权的用户才能查看或修改内容。 此结构支持团队内部协作,同时保持严格的访问控制,这对业务和 IT 用户都至关重要。

Microsoft Fabric 中的工作区还提供用于管理计算资源并与 Git 集成以进行版本控制的设置。 可以配置计算设置以优化性能和成本,确保有效使用资源。 通过 Git 集成,可以跟踪更改、协作处理代码并维护工作历史记录,这对于开发和数据管理至关重要。 此外,工作区还支持数据世系和影响分析等功能,提供数据流和依赖项的综合视图,从而提高透明度和决策能力。

探索安全性和治理

Fabric 的 OneLake 是集中治理的,并对协作开放。 数据在一个位置受到保护和管理,这让用户能够轻松查找和访问所需的数据。 在管理中心集中管理 Fabric。

在管理中心,你可管理组和权限、配置数据源和网关,还可监视使用情况和性能。 此外,你可以在管理中心访问 Fabric 管理 API 和 SDK,它们用于自动执行常见任务并将 Fabric 与其他系统集成。

注意

有关 Fabric 管理的详细信息,请参阅什么是 Microsoft Fabric 管理

Fabric 租户与 Microsoft Purview 信息保护进行本机集成。 从引入到导出过程,Fabric 使用 Microsoft Purview 信息保护的敏感度标签来帮助组织对敏感数据进行分类和保护。