导航 Fabric Lakehouse 资源管理器

Lakehouse 资源管理器页充当 Lakehouse 环境中所有交互的中心枢纽。 该资源管理器内置于 Fabric 门户中。 若要打开湖屋资源管理器,请使用工作负载切换器切换到“数据工程”。 查找并导航到湖屋项,此时将打开资源管理器,可在其中与湖屋数据进行交互。 资源管理器是用于将数据无缝加载到湖屋、浏览数据、预览内容以及执行各种数据相关任务的网关。 此页面分为三个主要部分:Lakehouse 资源管理器、主视图和功能区。

Gif 说明湖屋资源管理器中的控件。

Lakehouse 资源管理器

Lakehouse 资源管理器为整个湖屋提供统一图形表示,为用户提供直观的数据导航、访问和管理界面。

  • 表部分是湖屋中托管区域的用户友好表示形式。 此区域的组织和管理方式通常有助于实现高效的数据处理和分析。 在此处,可以找到所有表,无论它们是自动生成的,还是在元存储中显式创建和注册的。 你可以选择要预览的表、检查表架构、访问基础文件,以及执行与数据相关的其他各种操作。

  • 未识别的区域是湖屋托管区域中的一个独特空间。 它显示托管区域中存在的、但在 SyMS 中缺少关联表的所有文件夹或文件。 例如,如果用户将图像或音频文件等不受支持的文件上传到托管区域,则系统不会自动检测并将它们链接到表。 取而代之的是,它们将显示在这个未识别的区域。 此部分的主要目的是提示用户从托管区域中删除这些文件,或将其传输到“文件部分”以做进一步处理。

  • 文件部分表示湖屋的非托管区域,可将其视为从各种源引入的原始数据的“登陆区域”。 在将这些数据用于分析之前,通常需要进行额外的处理。 在此部分,可以浏览目录、选择要预览的目录、将文件夹加载到表中,以及执行其他各种操作。 值得注意的是,文件部分仅显示文件夹级对象。 若要查看文件级对象,需要使用“主视图”区域。

主视图区域

湖屋页面的主视图区域是发生大部分数据交互的空间。 视图会根据所选内容而更改。 由于对象资源管理器仅显示湖的文件夹级层次结构,因此主视图区域可用于浏览文件、预览文件和表,以及执行其他各种任务。

表预览

我们的表预览数据网格配备了一套强大的功能,可以提升数据交互体验,使数据处理变得更加无缝。 下面是一些关键功能:

  • 只需单击一下即可按升序或降序对列进行排序。 在使用大型语义模型或需要快速识别趋势时,此功能使你可以完全控制数据的组织方式。

  • 按子字符串筛选数据,或者通过从表中的可用值列表进行选择来筛选数据。

  • 调整列大小,以根据自己的偏好定制数据视图。 此功能可帮助你确定重要数据的优先级,或扩大视场以包含更广泛的信息。

文件预览

在湖屋中预览数据文件可以获得各种好处,包括增强数据质量、理解能力和整体数据管理效率。 它使数据专业人员能够做出明智的决策,优化资源分配,并确保他们的分析基于可靠且有价值的数据。

预览版适用于以下文件类型:bmp、css、csv、gif、html、jpeg、jpg、js、json、md、mjs、png、ps1、py、svg、tsx、txt、xml、yaml

功能区

湖屋功能区是快速访问操作栏,其中提供了在湖屋中执行基本任务的便捷方式。 从这里,可以刷新湖屋、更新设置、加载数据、创建或打开笔记本、创建新的自定义语义模型,进而轻松管理 OneLake 数据访问。

将数据加载湖屋的不同方法

可通过多种方式将数据从资源管理器页加载到湖屋中:

  • 本地文件/文件夹上传:轻松将数据从本地计算机直接上传到湖屋的文件部分。 在此处了解更多信息。

  • 笔记本代码:利用可用的 Spark 库连接到数据源,并将数据加载到数据帧中,然后将其保存在湖屋中。 在“此处”查找更多信息。

  • 管道中的复制工具:连接到各种数据源,以原始格式加载数据,或将其转换为 Delta 表。 在此处了解更多信息。

  • Dataflows Gen 2:创建数据流以导入数据、转换数据并将其发布到湖屋。 单击此处了解详情。

  • 快捷方式:创建快捷方式,将现有数据连接到湖屋,而无需进行复制。 在“此处”查找更多信息。

  • 示例:快速引入示例数据,以直接开始探索语义模型和表。

查看不同的用例,以了解在 Lakehouse 中加载数据的最佳方式。

访问湖屋的 SQL 分析终结点

可以使用功能区右上角的下拉菜单,直接从湖屋访问“SQL 分析终结点”。 使用这种快速访问方法可以立即进入 T-SQL 模式,这样就可以直接在湖中 Delta 表的顶层进行操作,以帮助你为报告做好准备。

我们希望本指南能帮助你充分利用 Lakehouse 资源管理器及其多样化功能。 请随意探索和体验,并试着提高数据管理任务的效率。