共用方式為


Microsoft Purview 資料對應 定價

本指南涵蓋 Microsoft Purview 治理入口網站中數據對應的定價指導方針。

如需 Microsoft Purview (先前稱為 Azure Purview) 的完整定價指導方針詳細數據,請參閱 定價指導方針概觀。

如需特定價格詳細數據, 請參閱 Microsoft Purview (先前的 Azure Purview) 定價頁面。 本文將引導您了解會影響 Microsoft Purview 資料對應 定價的功能和因素。

影響 Microsoft Purview 資料對應 定價的直接成本取決於下列三個維度:

彈性資料對應

  • 數據對應是 Microsoft Purview 治理入口網站架構的基礎,因此在任何指定時間點,數據資產中的資產資訊都必須是最新狀態

  • 數據對應會根據容量 單位 (CU) 來收費。 如果目錄最多儲存 10 GB 的元數據記憶體,且最多提供 25 個數據對應作業/秒,則數據對應會布建在一個 CU

  • 第一次建立帳戶時,一律會在一個 CU 布建數據對應

  • 不過,數據對應會自動在該彈性視窗的最小和最大限制之間調整,以因應數據對應中有關兩個主要因素的變更: 作業輸送量元數據記憶體

作業輸送量

  • 根據在數據對應上執行的建立、讀取、更新、刪除作業的事件驅動因素
  • 資料對應作業的一些範例如下:
    • 在數據對應中建立資產
    • 將關聯性新增至資產,例如擁有者、管理人、父系、譜系
    • 編輯資產以新增商務元數據,例如描述、詞彙
    • 將結果傳回搜尋結果頁面的關鍵詞搜尋
    • 使用 API 匯入或匯出資訊
  • 如果在數據對應上執行多個查詢,I/O 作業數目也會增加,進而相應增加數據對應
  • 並行用戶數目也會形成控管數據對應容量單位的因素
  • 其他要考慮的因素包括搜尋查詢類型、API 互動、工作流程、核准等等
  • 數據高載層級
    • 當需要更多作業/秒輸送量時,數據對應可以在彈性視窗內自動調整,以因應變更的負載
    • 這會構成需要預估和規劃的高載特性
    • 高載特性包含高載層級高載存在的高載持續時間
      • 高載層級是在穩定狀態下預期一致彈性的多重索引
      • 高載持續時間是這類高載在彈性 (預期的月份百分比,) 是因為數據對應上的元數據增加或作業數目增加

元數據記憶體

  • 如果數據資產中的資產數目減少,然後透過後續的增量掃描在數據對應中移除,則記憶體元件會自動減少,因此數據對應會相應減少

自動化掃描、分類和擷取

有兩個主要的自動化程式可觸發將元數據擷取至 Microsoft Purview 資料對應:

  • 使用原生 連接器自動掃描。 此程式包含三個主要步驟:

    • 元數據掃描
    • 自動分類
    • 將元數據擷取到 Microsoft Purview 資料對應
  • 使用 Azure Data Factory 和/或 Azure Synapse 管線自動擷取。 此程序包括:

    • 如果帳戶已連線到任何 Azure Data Factory 或 Azure Synapse 管線,則將元數據和歷程擷取至 Microsoft Purview 資料對應。

使用原生連接器自動掃描

  • 完整掃描會處理數據源所選範圍內的所有資產,而累加式掃描則會偵測並處理自從上一次成功掃描之後已建立、修改或刪除的資產

  • 所有掃描 (完整或增量掃描) 會挑選 更新、修改或刪除的 資產

  • 當多個屬於不同部門的人員或群組設定相同數據源的掃描,以產生更多重複掃描的價格時,請務必考慮並避免這種情況

  • 排程與數據資產變更一致之初始完整掃描后的 頻繁增量掃描 。 這可確保數據對應一律保持在最新狀態,而且相較於完整掃描,累加式掃描耗用較少的 V 核心時數

  • 數據源的 [檢視詳細數據] 連結可讓使用者執行完整掃描。 不過,請考慮在完整掃描后執行增量掃描,以進行優化掃描,但掃描規則集變更時除外, (分類/檔案類型)

  • 在父集合註冊數據源 ,並在具有不同訪問控制的 子集合上進行範圍掃描 ,以確保不需要重複的掃描成本

  • 利用集合授權,利用更細緻的訪問控制數據源系統管理員角色,來註冊數據源以進行掃描的使用者。 這可確保只允許註冊有效的數據源,並控制掃描 V 核心時數,進而降低掃描成本

  • 請考慮 數據源的類型 和正在掃描 的資產數目 會影響掃描持續時間

  • 建立自訂掃描規則集 ,只包含數據資產中可用 的檔類型 子集,以及與您的商務需求相關的 分類 ,以確保掃描器的最佳使用方式

  • 為數據源建立新的掃描時,請遵循建議 的準備順序 ,再實際執行掃描。 這包括收集記憶體帳戶 (商務特定分類文件類型 的需求,) 啟用適當的掃描規則集來定義以避免多次掃描,並透過遺漏的需求控制多重掃描的不必要成本

  • 將掃描排程與 Self-Hosted Integration Runtime (SHIR) VM (虛擬機器) 大小對齊,以避免與虛擬機連結的額外成本

使用 Azure Data Factory 和/或 Azure Synapse 管線自動擷取

  • 每次管線在來源系統中執行時,都會從 Azure Data Factory 或 Azure Synapse 管線擷取元數據和譜系。

進階資源集

  • Microsoft Purview 資料對應 使用資源集來解決將大量數據資產對應至單一邏輯資源的挑戰,方法是提供掃描數據湖中所有檔案的能力,並尋找 GUID、當地語系化模式等 (模式,) 將它們分組為數據對應中的單一資產

  • 進階資源集 是選擇性功能,可讓客戶取得如總大小、分割區計數等計算的擴充資源集資訊,並可透過模式規則自定義資源集群組。 如果未啟用進階資源集功能,整合式目錄 仍會包含資源集資產,但沒有匯總的屬性。 在此情況下,不會向客戶收取任何「資源集」計量費用。

  • 在切換 Microsoft Purview 資料對應 中的進階資源集之前,請先使用基本資源集功能來確認是否符合需求

  • 如果下列狀況,請考慮開啟進階資源集:

    • 您的數據湖架構不斷變更,而您想要尋找超越基本資源集功能的更多價值,讓 Microsoft Purview 資料對應 以計算參數,例如 #partitions、數據資產的大小等服務
    • 需要自訂資源集資產的分組方式。
  • 請務必注意,進階資源集的計費是以離線層用來匯總資源集資訊的計算為基礎,而且取決於目錄中的資源集大小/數目

後續步驟