Microsoft Fabric 数据工厂中的 Excel 格式

本文概述了如何在 Microsoft Fabric 数据工厂的数据管道中配置 Excel 格式。

支持的功能

以下活动和连接器支持 Excel 格式作为源。

类别 连接器/活动
支持的连接器 Amazon S3
Amazon S3 兼容
Azure Blob 存储
Azure Data Lake Storage Gen1
Azure Data Lake Storage Gen2
Azure 文件
文件系统
FTP
Google Cloud Storage
HTTP
Lakehouse 文件
Oracle 云存储
SFTP
支持的活动 复制活动 (source/-)
Lookup 活动
GetMetadata 活动
Delete 活动

复制活动中的 Excel 格式

若要配置 Excel 格式,请在数据管道复制活动的源中选择连接,然后在“文件格式”下拉列表中选择“Excel”。 选择“设置”以进一步配置此格式。

屏幕截图显示文件格式设置。

Excel 作为源

选择 Excel 格式后,将显示以下属性。

  • 工作表模式:选择要用于读取 Excel 数据的工作表模式。 选择“名称”或“索引”。

    • 名称:选择“名称”时,在“工作表名称”部分中,选择 Excel 工作表名称以读取数据,或选择“编辑”以手动指定工作表名称。 如果指向一个或多个文件夹,请确保所有这些文件中都存在此特定工作表。

      屏幕截图显示在工作表模式下选择“名称”。

    • 索引:选择“索引”时,在“工作表索引”部分中,选择 Excel 工作表索引以读取数据,或选择“编辑”以手动指定工作表名称。 数据读取从 0 开始。 如果在 Excel 文件中添加或删除了工作表,则现有工作表的索引将自动更改。

      屏幕截图显示在工作表模式下选择“索引”。

在“文件格式”部分中选择“设置”后,弹出的“文件格式设置”对话框中会显示以下属性。

屏幕截图显示选择文件格式。

  • 压缩类型:用于读取 Excel 文件的压缩编解码器。 可以从下拉列表中选择“”、“bzip2”、“gzip”、“deflate”、“ZipDeflate”、“TarGzip”或“tar”类型。

  • 压缩级别:选择压缩类型时指定压缩比。 可以从“最佳”或“最快”中进行选择。

    • 最快:尽快完成压缩操作,不过,无法以最佳方式压缩生成的文件。
    • 最佳:以最佳方式完成压缩操作,不过,需要耗费更长的时间。 有关详细信息,请参阅压缩级别主题
  • 范围:给定工作表中用于定位选择性数据的单元格区域,例如:

    • 未指定:以表的形式从第一个非空行和列读取整个工作表。
    • A3:读取从给定单元格开始的表,动态检测下面的所有行和右侧的所有列
    • A3:H5:以表的形式读取此固定范围。
    • A3:A3:读取此单个单元格。
  • Null 值:指定 null 值的字符串表示形式。 默认值为空字符串。

  • 将第一行用作标题:指定是否要将给定工作表/范围内的第一行视为带有列名的标题行。 默认情况下未选择。

表摘要

Excel 作为源

使用 Excel 格式时,复制活动“”部分支持以下属性。

名称 说明 必选 JSON 脚本属性
 文件格式 要使用的文件格式。 Excel 类型(datasetSettings 下):
Excel
工作表模式  要用于读取 Excel 数据的工作表模式。  - 名称
- Index
 - sheetName
- sheetIndex
压缩类型 用来读取 Excel 文件的压缩编解码器。 从下列项中进行选择:

bzip2
gzip
deflate
ZipDeflate
TarGzip
tar
类型(compression 下):

bzip2
gzip
deflate
ZipDeflate
TarGzip
tar
压缩级别  压缩率。 允许的值为 Optimal 或 Fastest。 最佳最快 级别(compression 下):
最快
最佳
范围 给定工作表中用于定位选择性数据的单元格区域。 <你的单元格区域> range
Null 值 null 值的字符串表示形式。 <你的 null 值>
空字符串(默认)
nullValue
将第一行用作标头 指定是否要将给定工作表/范围内的第一行视为带有列名的标题行。 已选择或未选择 firstRowAsHeader:
true 或 false(默认)