Microsoft Fabric 中数据工厂的二进制格式
本文概述了如何在数据工厂中配置二进制格式。
支持的功能
以下活动和连接器支持使用二进制格式作为源和目标。
复制活动中的二进制格式
若要配置二进制格式,请在数据管道复制活动的源或目标中选择连接,然后在“文件格式”下拉列表中选择“二进制”。 选择“设置”以进一步配置此格式。
注意
在复制活动中使用二进制格式时,源和目标应都使用二进制格式。
二进制文件作为源
在“源”选项卡下的“文件格式”部分选择“设置”后,弹出的“文件格式设置”对话框中将显示以下属性。
压缩类型:用于读取二进制文件的压缩编解码器。 可以从下拉列表中选择“无”、“bzip2”、“gzip”、“deflate”、“ZipDeflate”、“TarGzip”或“tar”类型。
如果选择“ZipDeflate”作为压缩类型,则“将 zip 文件名保留为文件夹”将显示在“源”选项卡的“高级”设置”下。
- 将 zip 文件名保留为文件夹:指示是否在复制过程中以文件夹结构形式保留源 zip 文件名。
- 如果选中此框(默认),则服务会将解压缩的文件写入
<specified file path>/<folder named as source zip file>/
。 - 如果未选中此框,则服务会将解压缩的文件直接写入
<specified file path>
。 请确保不同的源 zip 文件中没有重复的文件名,以避免产生冲突或出现意外行为。
- 如果选中此框(默认),则服务会将解压缩的文件写入
如果选择“TarGzip/tar”作为压缩类型,则“将压缩文件名保留为文件夹”将显示在“源”选项卡的“高级”设置”下。
- 将压缩文件名保留为文件夹:指示是否在复制过程中以文件夹结构形式保留源压缩文件名。
- 如果选中此框(默认),则服务会将解压缩的文件写入
<specified file path>/<folder named as source compressed file>/
。 - 如果未选中此框,则服务会将解压缩的文件直接写入
<specified file path>
。 请确保不同的源 zip 文件中没有重复的文件名,以避免产生冲突或出现意外行为。
- 如果选中此框(默认),则服务会将解压缩的文件写入
- 将 zip 文件名保留为文件夹:指示是否在复制过程中以文件夹结构形式保留源 zip 文件名。
压缩级别:压缩比。 可以从“最佳”或“最快”中进行选择。
- 最快:尽快完成压缩操作,不过,无法以最佳方式压缩生成的文件。
- 最佳:以最佳方式完成压缩操作,不过,需要耗费更长的时间。 有关详细信息,请转到压缩级别文章。
在“源”选项卡中的“高级设置”下,将显示与二进制格式相关的其他属性。
- 完成后删除文件:指示是否会在二进制文件成功移到目标存储后将其从源存储中删除。 文件删除以每文件为单位。 因此,当复制活动失败时,一些文件已经复制到目标并从源中删除,而另一些文件仍保留在源存储中。
二进制作为目标
在“目标”选项卡下的“文件格式”部分选择“设置”后,弹出的“文件格式设置”对话框中将显示以下属性。
压缩类型:用于写入二进制文件的压缩编解码器。 可以从下拉列表中选择“无”、“bzip2”、“gzip”、“deflate”、“ZipDeflate”、“TarGzip”或“tar”类型。
压缩级别:压缩比。 可以从“最佳”或“最快”中进行选择。
- 最快:尽快完成压缩操作,不过,无法以最佳方式压缩生成的文件。
- 最佳:以最佳方式完成压缩操作,不过,需要耗费更长的时间。 有关详细信息,请转到压缩级别文章。
表摘要
二进制文件作为源
使用二进制格式时,复制活动“源”部分支持以下属性。
名称 | 描述 | 值 | 必选 | JSON 脚本属性 |
---|---|---|---|---|
文件格式 | 要使用的文件格式。 | 二进制 | 是 | 类型(在 datasetSettings 下):二进制 |
压缩类型 | 用于读取二进制文件的压缩编解码器。 | 从下列项中进行选择: 无 bzip2 gzip deflate ZipDeflate TarGzip tar |
否 | 类型(在 compression 下):bzip2 gzip deflate ZipDeflate TarGzip tar |
压缩级别 | 压缩率。 允许的值为 Optimal 或 Fastest。 | 最佳或最快 | 否 | 级别(在 compression 下):最快 最佳 |
将 zip 文件名保留为文件夹 | 指示是否在复制过程中以文件夹结构形式保留源 zip 文件名。 | 已选择或取消选择 | 否 | preserveZipFileNameAsFolder (在 compressionProperties ->type 下为 ZipDeflateReadSettings ) |
将压缩文件名保留为文件夹 | 指示是否在复制过程中以文件夹结构形式保留源压缩文件名。 | 已选择或取消选择 | 否 | preserveCompressionFileNameAsFolder (在 compressionProperties ->type 下为 TarGZipReadSettings 或 TarReadSettings ) |
完成后删除文件 | 指示是否会在二进制文件成功移到目标存储后将其从源存储中删除。 | 已选择或取消选择 | 否 | deleteFilesAfterCompletion: true 或 false |
二进制作为目标
使用二进制格式时,复制活动“目标”部分支持以下属性。
名称 | 描述 | 值 | 必选 | JSON 脚本属性 |
---|---|---|---|---|
文件格式 | 要使用的文件格式。 | 二进制 | 是 | 类型(在 datasetSettings 下):二进制 |
压缩类型 | 用于写入二进制文件的压缩编解码器。 | 从下列项中进行选择: 无 bzip2 gzip deflate ZipDeflate TarGzip tar |
否 | 类型(在 compression 下):bzip2 gzip deflate ZipDeflate TarGzip tar |
压缩级别 | 压缩率。 允许的值为 Optimal 或 Fastest。 | 最佳或最快 | 否 | 级别(在 compression 下):最快 最佳 |