共用方式為


Snowflake 數據的數據品質

掃描 Snowflake 數據源時,Microsoft Purview 支援:

擷取技術元數據,包括:

  • 伺服器、資料庫、架構和數據表,包括數據行、檢視表,包括數據行、外鍵和唯一條件約束
  • 預存程式,包括參數數據集和結果集
  • 包含參數數據集的函式
  • 管道、階段和數據流,包括數據行
  • 工作和順序

在 Purview 中設定數據對應掃描目錄 Snowflake 數據Microsoft

註冊 Snowflake 來源

若要在 整合式目錄 中註冊新的 Snowflake 來源,請遵循下列步驟:

  • 在 Microsoft Purview 治理入口網站中,流覽至您的 Microsoft Purview 帳戶。
  • 選取左側導覽上的 [數據對應]。
  • 選取 [註冊]
  • 在 [註冊來源] 上,選取 [Snowflake]。

設定數據對應掃描

  • 選取已註冊的 Snowflake 來源。
  • 選取 [+ 新增掃描]。
  • 提供下列詳細資料:
    • 名稱:掃描的名稱
    • 透過整合運行時間連線:根據您的案例選取 Azure 自動解析整合運行時間、受控 VNet IR 或 SHIR。
    • 線上的主機:選擇在掃描期間用來建立 Snowflake 連線的端點。 您可以從伺服器 URL 或您在資料源中設定的其他主機中進行選擇。
    • 認證:選取要連線到數據源的認證。 請務必:
      • 建立認證時選取 [基本身份驗證]。
      • 在 [用戶名稱] 輸入字段中提供用來連線到 Snowflake 的使用者名稱。
      • 將用來連線到 Snowflake 的使用者密碼儲存在秘密密鑰中。
    • 倉儲:指定用來在大寫案例中強化掃描的倉儲實例名稱。 指派給認證中指定之用戶的預設角色必須具有此倉儲的USAGE許可權。
    • 資料庫:指定一或多個資料庫實例名稱,以大寫大小寫匯入。 使用分號 (;) 分隔清單中的名稱。 例如,DB1;DB2。 指派給認證中指定之用戶的預設角色,必須具有資料庫對象的適當許可權。
    • 架構:列出要匯入的架構子集,以分號分隔清單表示。
  • 取 [測試連線] 以驗證使用 Azure Integration Runtime) 時 (可用的設定。
  • 選取 [繼續]。
  • 選取用於分類的掃描規則集。 您可以選擇系統預設值、現有的自訂規則集,或建立內嵌的新規則集。
  • 檢閱您的掃描,然後選取 [ 儲存並執行]

掃描之後,Snowflake 中的數據資產將可在 整合式目錄 搜尋中使用。 如需如何在 purview 中聯機和管理 Snowflake Microsoft詳細 資訊,請遵循本檔。

重要事項

從數據源刪除物件時,後續掃描目前不會自動移除 purview Microsoft對應的資產。

設定與 Snowflake 數據源的連線以進行數據質量掃描

此時,我們已備妥掃描的資產,以進行編目和治理。 將掃描的資產關聯至治理網域 Sele 中的數據產品。 在 [數據品質] 索引標籤上,新增 Azure SQL 資料庫連線:手動輸入資料庫名稱。

  1. 選取 [數據品質 > 控管網域 > 管理] 索引標籤以建立連線。

    顯示連線頁面導覽的螢幕快照。

  2. 在線上頁面中設定連線。

    • 新增連線名稱和描述
    • 選取來源類型 Snowflake
    • 新增伺服器名稱、倉儲名稱、資料庫名稱、架構名稱和數據表名稱
    • 選取驗證方法 - 基本身份驗證
    • 新增用戶名稱
    • 新增認證
      • 新增 Azure 訂用帳戶
      • 金鑰保存庫連線
      • 秘密名稱
      • 秘密版本
  3. 測試連線以確定已成功建立已設定的連線。

    顯示如何設定雪花式連線的螢幕快照。

    顯示如何設定雪花式連線令牌的螢幕快照。

重要事項

  • 數據質量負責人需要 Snowflake 的只讀 存取權,才能設定數據質量連線。
  • Snowflake 數據源尚不支援 vNet。
  • Snowflake 連接器不接受 https://。 當您新增伺服器名稱以設定資料源連線時,請移除 https://

Snowflake 中數據的分析和數據質量掃描

成功完成連線設定之後,您可以在 Snowflake 中分析、建立和套用規則,以及執行數據的 DQ 掃描。 請遵循下列檔中所述的逐步指導方針:

參考檔