共用方式為


在複製活動中設定 Azure Cosmos DB for NoSQL

本文概述如何在資料管線中使用複製活動,從 Azure Cosmos DB for NoSQL 複製資料或複製資料過去。

支援的設定

如需複製活動下每個索引標籤的組態,請分別參閱下列各節。

一般

請參閱<[一般] 設定>指導,來設定 [一般] 設定索引標籤。

來源

在複製活動的 [來源] 索引標籤下,Azure Cosmos DB for NoSQL 支援下列屬性。

螢幕擷取畫面,其中顯示 [來源] 索引標籤。

以下是三個必要的屬性:

  • 資料存放區類型:選取 [外部]。
  • 連線:從連線清單選取 [Azure Cosmos DB for NoSQL 連線]。 如果不存在連線,請選取 [新增],以建立新的 Azure Cosmos DB for NoSQL 連線。
  • 容器:選取您要使用的容器。 選取 [編輯],以手動輸入容器名稱。

在 [進階] 下,可以指定下列欄位:

  • 使用查詢:您可以選擇 [資料表] 或 [查詢] 做為您的使用查詢。 下列清單描述每個設定的組態。

    • 資料表:從您在 [資料表] 中的資料表讀取資料。

    • 查詢:指定 Azure Cosmos DB 查詢來讀取資料。

      螢幕擷取畫面,其中顯示查詢。

  • 頁面大小:查詢結果的每頁文件數目。 預設值為 "-1",表示可使用的服務端動態頁面大小上限為 1000。

  • 偵測日期時間:是否要從文件中的字串值偵測日期時間。 允許的值為:true (預設值)、false。

  • 慣用區域:從 Azure Cosmos DB 擷取資料時所要連線的慣用區域清單。 選取 [新增] 之後,請從下拉式清單中選取慣用的區域。

    螢幕擷取畫面,其中顯示慣用區域。

  • 其他資料行:新增其他資料行來儲存來源檔案的相對路徑或靜態值。 後者支援運算式。 如需詳細資訊,請參閱<在複製期間新增其他資料行>。

    螢幕擷取畫面,其中顯示其他資料行。

Destination

在複製活動的 [目的地] 索引標籤下,Azure Cosmos DB for NoSQL 支援下列屬性。

螢幕擷取畫面,其中顯示 [目的地] 索引標籤。

以下是三個必要的屬性:

  • 資料存放區類型:選取 [外部]。
  • 連線:從連線清單選取 [Azure Cosmos DB for NoSQL 連線]。
  • 容器:選取 [瀏覽] 來選擇要複製的檔案,或手動填入路徑。

在 [進階] 下,可以指定下列欄位:

  • 寫入行為:目的地是來自檔案型資料存放區的檔案時,會定義寫入行為。 您可以從下拉式清單中選擇 [新增動態內容]、[插入] 或 [Upsert]

    • 新增動態內容:開啟 [新增動態內容] 窗格。 這會開啟運算式產生器,在這裡您可以從支援的系統變數、活動輸出、函數和使用者指定的變數或參數建立運算式。 如需運算式語言的相關資訊,請參閱<運算式和函數>。

    • 插入:如果您的來源資料有插入,請選擇此選項。

    • Upsert:如果存在具有相同識別碼的文件,upsert 的行為會用來取代文件;否則會插入文字。

      螢幕擷取畫面,其中顯示寫入行為。

  • 寫入寫入批次逾時:在逾時前等待批次插入作業完成的時間。允許的值為 Timespan。 範例是 00:30:00 (30 分鐘)。

  • 寫入批次大小:指定每個批次要插入 SQL 資料表的資料列數目。 允許的值為整數 (資料列數目)。 根據預設,服務會依據資料列大小動態決定適當的批次大小。

  • 並行連線數上限:在活動執行期間,與資料存放區建立的並行連線數上限。 僅在想要限制並行連線時,才需要指定值。

  • 停用效能計量分析:此設定可控制如 DTU、DWU、RU 等計量集合,以進行複製效能最佳化和建議。 如果對此行為有疑慮,請關閉此功能。

對應

如需 [對應] 索引標籤組態,請參閱<在 [對應] 索引標籤下設定對應>。

設定

對於 [設定] 索引標籤組態,請參閱<在 [設定] 索引標籤下進行其他設定>。

資料表摘要

下列資料表包含有關 Azure Cosmos DB for NoSQL 中複製活動的詳細資訊。

來源資料表

名稱 描述 必要 JSON 指令碼屬性
資料存放區類型 資料存放區類型。 外部 必要 /
[連接] 與來源資料存放區的連線。 <您的連線> 必要 connection
容器 您的來源資料的容器。 <您的來源的容器> 必要 container
fileName
使用查詢 您可以選擇 [資料表] 或 [查詢] 做為您的使用查詢。 資料表
查詢
不必要 type
頁面大小 查詢結果的每頁文件數目。 預設值為 "-1",表示可使用的服務端動態頁面大小上限為 1000。 <您的頁面大小> 不必要 pageSize
刪除日期時間 移至目的地存放區之後,將立即刪除來源資料存放區中的檔案。 檔案刪除會針對每個檔案執行,因此,當複製活動失敗時,您會注意到已將某些檔案複製到目的地,而且已從來源刪除,而其他檔案仍在來源存放區上。 已選取或取消選取 不必要 detectDatetime
慣用區域 從 Azure Cosmos DB 擷取資料時所要連線的慣用區域清單。 選取 [新增] 之後,請從下拉式清單中選取慣用的區域。 <您的慣用區域> 不必要 preferredRegions
其他資料行 新增其他資料行來儲存來源檔案的相對路徑或靜態值。 後者支援運算式。 如需詳細資訊,請參閱<在複製期間新增其他資料行>。 <並行連線數上限> 不必要 additionalColumns:

目的地資料表

名稱 描述 必要 JSON 指令碼屬性
資料存放區類型 資料存放區類型。 外部 必要 /
[連接] 與目的地資料存放區的連線。 <您的連線> 必要 connection
容器 您的目的地資料的容器。 <來源的容器> 必要 container
fileName
寫入行為 描述如何將資料寫入至 Azure Cosmos DB。 允許的值:insert 和 upsert。 如果存在具有相同識別碼的文件,upsert 的行為會用來取代文件;否則會插入文字。 新增動態內容
Insert
Upsert
不必要 writeBehavior
寫入批次逾時 在逾時前等待批次插入作業完成的時間。允許的值為:時間範圍字串。 範例是 00:30:00 (30 分鐘)。 時間範圍 不必要 writeBatchTimeout
寫入批次大小 每個批次要插入 SQL 資料表中的資料列數。 允許的值為整數 (資料列數目)。 根據預設,服務會依據資料列大小動態決定適當的批次大小。 <資料列數目>
(整數)
不必要 writeBatchSize
並行連線數上限 在活動執行期間建立至資料存放區的同時連線上限。 僅在想要限制並行連線時,才需要指定值。 <並行連線數上限> 不必要 maxConcurrentConnections
停用效能計量分析 此設定可控制如 DTU、DWU、RU 等計量集合,以進行複製效能最佳化和建議。 如果對此行為有疑慮,請關閉此功能。 已選取或取消選取 不必要 disableMetricsCollection