在複製活動中設定 Azure Cosmos DB for NoSQL
本文概述如何在資料管線中使用複製活動,從 Azure Cosmos DB for NoSQL 複製資料或複製資料過去。
支援的設定
如需複製活動下每個索引標籤的組態,請分別參閱下列各節。
一般
請參閱<[一般] 設定>指導,來設定 [一般] 設定索引標籤。
來源
在複製活動的 [來源] 索引標籤下,Azure Cosmos DB for NoSQL 支援下列屬性。
以下是三個必要的屬性:
- 資料存放區類型:選取 [外部]。
- 連線:從連線清單選取 [Azure Cosmos DB for NoSQL 連線]。 如果不存在連線,請選取 [新增],以建立新的 Azure Cosmos DB for NoSQL 連線。
- 容器:選取您要使用的容器。 選取 [編輯],以手動輸入容器名稱。
在 [進階] 下,可以指定下列欄位:
使用查詢:您可以選擇 [資料表] 或 [查詢] 做為您的使用查詢。 下列清單描述每個設定的組態。
資料表:從您在 [資料表] 中的資料表讀取資料。
查詢:指定 Azure Cosmos DB 查詢來讀取資料。
頁面大小:查詢結果的每頁文件數目。 預設值為 "-1",表示可使用的服務端動態頁面大小上限為 1000。
偵測日期時間:是否要從文件中的字串值偵測日期時間。 允許的值為:true (預設值)、false。
慣用區域:從 Azure Cosmos DB 擷取資料時所要連線的慣用區域清單。 選取 [新增] 之後,請從下拉式清單中選取慣用的區域。
其他資料行:新增其他資料行來儲存來源檔案的相對路徑或靜態值。 後者支援運算式。 如需詳細資訊,請參閱<在複製期間新增其他資料行>。
Destination
在複製活動的 [目的地] 索引標籤下,Azure Cosmos DB for NoSQL 支援下列屬性。
以下是三個必要的屬性:
- 資料存放區類型:選取 [外部]。
- 連線:從連線清單選取 [Azure Cosmos DB for NoSQL 連線]。
- 容器:選取 [瀏覽] 來選擇要複製的檔案,或手動填入路徑。
在 [進階] 下,可以指定下列欄位:
寫入行為:目的地是來自檔案型資料存放區的檔案時,會定義寫入行為。 您可以從下拉式清單中選擇 [新增動態內容]、[插入] 或 [Upsert]。
新增動態內容:開啟 [新增動態內容] 窗格。 這會開啟運算式產生器,在這裡您可以從支援的系統變數、活動輸出、函數和使用者指定的變數或參數建立運算式。 如需運算式語言的相關資訊,請參閱<運算式和函數>。
插入:如果您的來源資料有插入,請選擇此選項。
Upsert:如果存在具有相同識別碼的文件,upsert 的行為會用來取代文件;否則會插入文字。
寫入寫入批次逾時:在逾時前等待批次插入作業完成的時間。允許的值為
Timespan
。 範例是 00:30:00 (30 分鐘)。寫入批次大小:指定每個批次要插入 SQL 資料表的資料列數目。 允許的值為整數 (資料列數目)。 根據預設,服務會依據資料列大小動態決定適當的批次大小。
並行連線數上限:在活動執行期間,與資料存放區建立的並行連線數上限。 僅在想要限制並行連線時,才需要指定值。
停用效能計量分析:此設定可控制如 DTU、DWU、RU 等計量集合,以進行複製效能最佳化和建議。 如果對此行為有疑慮,請關閉此功能。
對應
如需 [對應] 索引標籤組態,請參閱<在 [對應] 索引標籤下設定對應>。
設定
對於 [設定] 索引標籤組態,請參閱<在 [設定] 索引標籤下進行其他設定>。
資料表摘要
下列資料表包含有關 Azure Cosmos DB for NoSQL 中複製活動的詳細資訊。
來源資料表
名稱 | 描述 | 值 | 必要 | JSON 指令碼屬性 |
---|---|---|---|---|
資料存放區類型 | 資料存放區類型。 | 外部 | 必要 | / |
[連接] | 與來源資料存放區的連線。 | <您的連線> | 必要 | connection |
容器 | 您的來源資料的容器。 | <您的來源的容器> | 必要 | container fileName |
使用查詢 | 您可以選擇 [資料表] 或 [查詢] 做為您的使用查詢。 | • 資料表 • 查詢 |
不必要 | type |
頁面大小 | 查詢結果的每頁文件數目。 預設值為 "-1",表示可使用的服務端動態頁面大小上限為 1000。 | <您的頁面大小> | 不必要 | pageSize |
刪除日期時間 | 移至目的地存放區之後,將立即刪除來源資料存放區中的檔案。 檔案刪除會針對每個檔案執行,因此,當複製活動失敗時,您會注意到已將某些檔案複製到目的地,而且已從來源刪除,而其他檔案仍在來源存放區上。 | 已選取或取消選取 | 不必要 | detectDatetime |
慣用區域 | 從 Azure Cosmos DB 擷取資料時所要連線的慣用區域清單。 選取 [新增] 之後,請從下拉式清單中選取慣用的區域。 | <您的慣用區域> | 不必要 | preferredRegions |
其他資料行 | 新增其他資料行來儲存來源檔案的相對路徑或靜態值。 後者支援運算式。 如需詳細資訊,請參閱<在複製期間新增其他資料行>。 | <並行連線數上限> | 不必要 | additionalColumns: |
目的地資料表
名稱 | 描述 | 值 | 必要 | JSON 指令碼屬性 |
---|---|---|---|---|
資料存放區類型 | 資料存放區類型。 | 外部 | 必要 | / |
[連接] | 與目的地資料存放區的連線。 | <您的連線> | 必要 | connection |
容器 | 您的目的地資料的容器。 | <來源的容器> | 必要 | container fileName |
寫入行為 | 描述如何將資料寫入至 Azure Cosmos DB。 允許的值:insert 和 upsert。 如果存在具有相同識別碼的文件,upsert 的行為會用來取代文件;否則會插入文字。 | • 新增動態內容 • Insert • Upsert |
不必要 | writeBehavior |
寫入批次逾時 | 在逾時前等待批次插入作業完成的時間。允許的值為:時間範圍字串。 範例是 00:30:00 (30 分鐘)。 | 時間範圍 | 不必要 | writeBatchTimeout |
寫入批次大小 | 每個批次要插入 SQL 資料表中的資料列數。 允許的值為整數 (資料列數目)。 根據預設,服務會依據資料列大小動態決定適當的批次大小。 | <資料列數目> (整數) |
不必要 | writeBatchSize |
並行連線數上限 | 在活動執行期間建立至資料存放區的同時連線上限。 僅在想要限制並行連線時,才需要指定值。 | <並行連線數上限> | 不必要 | maxConcurrentConnections |
停用效能計量分析 | 此設定可控制如 DTU、DWU、RU 等計量集合,以進行複製效能最佳化和建議。 如果對此行為有疑慮,請關閉此功能。 | 已選取或取消選取 | 不必要 | disableMetricsCollection |