最佳化 Azure Cosmos DB for MongoDB 中的寫入效能

適用於： MongoDB

最佳化寫入效能有助於充分利用 Azure Cosmos DB for MongoDB 的無限規模調整。不同於其他受控 MongoDB 服務，適用於 MongoDB 的 API 會自動以透明的方式將集合分區 (使用分區集合的情況下)，藉此無限擴充。

進行此操作時必須留意寫入資料的方式，在分區間平行處理和散佈資料，以充分利用您的資料庫與集合。本文說明將寫入效能最佳化的最佳做法。

將負載分散到分區間

將資料寫入 MongoDB 集合的分區 API 時，會將資料分割 (分區) 成小型配量，並根據分區索引鍵欄位的值寫入每個分區。您可以將每個配量視為虛擬機器的一小部分，裡頭只儲存包含一個唯一分區索引鍵值的文件。

如果您的應用程式會將大量資料寫入至單一分區，這個做法的效率就不高，因為應用程式只會將一個分區的輸送量提到最高，而不會將負載分散到所有的分區上。將多個具有唯一分區索引鍵值的文件平行寫入，寫入負載就能平均分散在集合中。

這個做法的其中一個範例，是在目錄欄位上分區的產品目錄應用程式。與其一次寫入至一個類別 (分區)，同時寫入所有類別更能達到最大寫入輸送量。

編製索引是一項絕佳功能，可大幅減少查詢資料所需的時間。為實現最具彈性的查詢體驗，適用於 MongoDB 的 API 預設會對資料啟用萬用字元索引，以迅速查詢所有欄位。不過在寫入資料時，包含萬用字元索引的所有索引都會產生額外的負載，因為寫入會變更集合和索引。

將索引數量減少至只剩支援查詢所需的索引量，將可讓寫入速度更快且更費用更低。一般來說，我們建議您執行下列動作：

根據預設，MongoDB 驅動程式會在寫入資料時，會將排序選項設定為 "true"，這樣系統會依序逐一寫入每份文件。此選項會降低寫入效能，因為每個寫入要求都必須等待前一個寫入要求完成才能進行。寫入資料時，請將此選項設為 false 以改善效能。

db.collection.insertMany(
   [ <doc1> , <doc2>, ... ],
   {
      ordered: false
   }
)

跨多個執行緒/程序的寫入作業平行處理是調整寫入的關鍵。適用於 MongoDB 的 API 可接受為每個程序/執行緒最多寫入 1000 份文件。

如果您一次會在每個程序/執行緒寫入超過 1000 份文件，則應將用戶端函數 (例如 insertMany()) 限制為約 1000 份文件。否則，用戶端會先等待每個批次完成認可，才會繼續進行下個批次。某些情況下，以少於或稍微超過 1000 份文件來分割批次，速度會更快。

深入了解在適用於 MongoDB 的 API 中編制索引。
深入了解 Azure Cosmos DB 的分區/資料分割。
深入了解疑難排解常見問題。
正在嘗試為遷移至 Azure Cosmos DB 進行容量規劃嗎？您可以使用現有資料庫叢集的相關資訊進行容量規劃。
- 如果您知道現有資料庫叢集中的虛擬核心和伺服器數目，請參閱使用虛擬核心或 vCPU 來估計要求單位
- 如果您知道目前資料庫工作負載的一般要求率，請參閱使用 Azure Cosmos DB 容量規劃工具來估計要求單位