Data Factory in Microsoft Fabric 中的二進位格式
本文概述如何在 Data Factory 中設定二進位格式。
支援的功能
下列活動和連接器支援二進位格式作為來源和目的地。
類別 | 連接器/活動 |
---|---|
支援的連接器 | Amazon S3 |
Amazon S3 相容 | |
Azure Blob 儲存體 | |
Azure Data Lake Storage Gen1 | |
Azure Data Lake Storage Gen2 \(部分機器翻譯\) | |
Azure 檔案 | |
檔案系統 | |
FTP | |
Google Cloud Storage | |
HTTP | |
Lakehouse 檔案 | |
Oracle 雲端儲存空間 | |
SFTP | |
支援的活動 | 複製活動(來源/目的地) |
GetMetadata 活動 | |
刪除活動 |
複製活動中的二進位格式
若要設定二進位格式,請在資料管線複製活動的來源或目的地中選擇您的連線,然後在 [檔案格式] 下拉式清單中選取 [二進位]。 選取 [設定 ] 以進一步設定此格式。
注意
在複製活動中使用二進位格式時,來源和目的地都應該使用二進位格式。
將二進位作為來源
當您在 [來源] 索引標籤下的 [檔案格式] 區段中選取 [設定] 之後,下列屬性會顯示在快顯 [檔案格式設定] 對話框中。
壓縮類型:用來讀取二進位檔案的壓縮編解碼器。 您可以在下拉式清單中選擇 None、bzip2、gzip、deflate、ZipDeflate、TarGzip 或、tar 類型。
如果您選取 ZipDeflate 作為壓縮類型,則系統會在來源索引標籤中的進階設定下顯示保留 zip 檔案名稱作為資料夾。
- 將 ZIP 檔案名稱保留為資料夾:指出是否要在複製期間保留來源 ZIP 檔案名稱做為資料夾結構。
- 如果核取此方塊(預設值),服務會將解壓縮的檔案寫入至
<specified file path>/<folder named as source zip file>/
。 - 如果未核取此方塊,服務會將解壓縮的檔案直接寫入 。
<specified file path>
請確定不同的來源 ZIP 檔案中沒有重複的檔案名稱,以避免發生競爭或非預期的行為。
- 如果核取此方塊(預設值),服務會將解壓縮的檔案寫入至
如果您選取 TarGzip/tar 作為壓縮類型,則系統會在來源索引標籤中的進階設定下顯示保留壓縮檔案名稱作為資料夾。
- 將壓縮檔名稱保留為資料夾:指出是否要在複製期間保留來源壓縮檔案名稱做為資料夾結構。
- 如果核取此方塊(預設值),服務會將解壓縮的檔案寫入至
<specified file path>/<folder named as source compressed file>/
。 - 如果未核取此方塊,服務會將解壓縮的檔案直接寫入 。
<specified file path>
請確定不同的來源 ZIP 檔案中沒有重複的檔案名稱,以避免發生競爭或非預期的行為。
- 如果核取此方塊(預設值),服務會將解壓縮的檔案寫入至
- 將 ZIP 檔案名稱保留為資料夾:指出是否要在複製期間保留來源 ZIP 檔案名稱做為資料夾結構。
壓縮層級:壓縮比例。 您可以選擇最佳或最快。
- 最快:即使產生的檔案不以最佳方式壓縮,也應盡快完成壓縮作業。
- Optimal:即使作業需要較長時間完成,壓縮作業也應以最佳方式壓縮。 如需更多資訊,請前往壓縮等級文章。
在 [來源] 索引標籤的 [進階設定] 底下,會顯示進一步的二進位格式相關屬性。
- 完成後刪除檔案:指出成功移至目的地存放區之後,是否要從來源存放區中刪除二進位檔案。 根據檔案進行檔案刪除。 因此,複製活動失敗時,某些檔案已複製至目的地且已從來源刪除,而其他檔案仍然保留在來源存放區上。
二進位做為目的地
在 [目的地] 索引標籤下的 [檔案格式] 區段中選取 [設定] 之後,快顯 [檔案格式設定] 對話框中會顯示下列屬性。
壓縮類型:用來寫入二進位檔案的壓縮編解碼器。 您可以在下拉式清單中選擇 None、bzip2、gzip、deflate、ZipDeflate、TarGzip 或 tar 類型。
壓縮層級:壓縮比例。 您可以選擇最佳或最快。
- 最快:即使產生的檔案不以最佳方式壓縮,也應盡快完成壓縮作業。
- Optimal:即使作業需要較長時間完成,壓縮作業也應以最佳方式壓縮。 如需詳細資訊,請移至 壓縮層級 一文。
資料表摘要
將二進位作為來源
使用二進位格式時,複製活動的來源區段支援下列屬性。
名稱 | 描述 | 值 | 必要 | JSON 腳本屬性 |
---|---|---|---|---|
檔案格式 | 選取要使用的檔案格式。 | 二進位 | Yes | type (在 datasetSettings 下):Binary |
壓縮類型 | 用來讀取二進位檔案的壓縮編解碼器。 | 從下列項目中選擇: None bzip2 gzip deflate ZipDeflate TarGzip tar |
No | type (在 compression 下):bzip2 gzip deflate ZipDeflate TarGzip tar |
壓縮層級 | 壓縮比。 允許的值為 Optimal 或 Fastest。 | 最佳 或 最快 | No | 層級 (下 compression ):最快 最佳 |
將 zip 檔名保留為資料夾 | 指出是否要在複製期間保留來源 ZIP 檔案名稱做為資料夾結構。 | 已選取或取消選取 | No | preserveZipFileNameAsFolder ( compressionProperties ->type 下為 ZipDeflateReadSettings ) |
將壓縮檔名保留為資料夾 | 指出是否要在複製期間保留來源壓縮檔案名稱做為資料夾結構。 | 已選取或取消選取 | No | preserveCompressionFileNameAsFolder ( compressionProperties ->type 下為 TarGZipReadSettings 或 TarReadSettings ) |
完成之後刪除檔案 | 指出成功移至目的地存放區之後,是否要從來源存放區中刪除二進位檔案。 | 已選取或取消選取 | No | deleteFilesAfterCompletion: [True] 或 [False] |
二進位做為目的地
使用二進位格式時,複製活動 目的地 區段支援下列屬性。
名稱 | 描述 | 值 | 必要 | JSON 腳本屬性 |
---|---|---|---|---|
檔案格式 | 選取要使用的檔案格式。 | 二進位 | Yes | type (在 datasetSettings 下):Binary |
壓縮類型 | 用來寫入二進位檔案的壓縮轉碼器。 | 從下列項目中選擇: None bzip2 gzip deflate ZipDeflate TarGzip tar |
No | type (在 compression 下):bzip2 gzip deflate ZipDeflate TarGzip tar |
壓縮層級 | 壓縮比。 允許的值為 Optimal 或 Fastest。 | 最佳 或 最快 | No | 層級 (下 compression ):最快 最佳 |