共用方式為


Snowflake 數據的數據品質

掃描 Snowflake 數據源時,Microsoft Purview 支援擷取技術元數據,包括:

  • 伺服器、資料庫、架構和數據表,包括數據行;包含數據行、外鍵和唯一條件約束的檢視。
  • 預存程式,包括參數數據集和結果集。
  • 函式,包括參數數據集。
  • 管道、階段和數據流,包括數據行。
  • 工作和順序。

在 Purview 中設定數據對應掃描目錄 Snowflake 數據Microsoft

註冊 Snowflake 來源

若要在 整合式目錄 中註冊新的 Snowflake 來源,請遵循下列步驟:

  • 登入 Microsoft 入口網站
  • 選取 [數據對應 ] 解決方案卡片。 如果未顯示數據對應解決方案卡片,請選取 [檢視所有解決方案],然後從 [核心] 區段選取 [數據對應]。
  • 選取 [登錄]
  • [註冊來源] 上,選取 [Snowflake]

設定數據對應掃描

  • 選取已註冊的 Snowflake 來源。
  • 選取 [+ 新增掃描]。
  • 提供下列詳細資料:
    • 名稱:掃描的名稱
    • 透過整合運行時間連線:根據您的案例選取 Azure 自動解析整合運行時間、受控 VNet IR 或 SHIR。
    • 線上的主機:選擇在掃描期間用來建立 Snowflake 連線的端點。 您可以從伺服器 URL 或您在資料源中設定的其他主機中進行選擇。
    • 認證:選取要連線到數據源的認證。 請務必:
      • 建立認證時選取 [基本身份驗證]。
      • 在 [用戶名稱] 輸入字段中提供用來連線到 Snowflake 的使用者名稱。
      • 將用來連線到 Snowflake 的使用者密碼儲存在秘密密鑰中。
    • 倉儲:指定用來在大寫案例中強化掃描的倉儲實例名稱。 指派給認證中指定之用戶的預設角色必須具有此倉儲的USAGE許可權。
    • 資料庫:指定一或多個資料庫實例名稱,以大寫大小寫匯入。 使用分號 (;) 分隔清單中的名稱。 例如,DB1;DB2。 指派給認證中指定之用戶的預設角色,必須具有資料庫對象的適當許可權。
    • 架構:列出要匯入的架構子集,以分號分隔清單表示。
  • 取 [測試連線] 以驗證使用 Azure Integration Runtime) 時可用 (設定。
  • 選取 [繼續]。
  • 選取用於分類的掃描規則集。 您可以選擇系統預設值、現有的自訂規則集,或建立內嵌的新規則集。
  • 檢閱您的掃描,然後選取 [ 儲存並執行]

掃描之後,Snowflake 中的數據資產將可在 整合式目錄 搜尋中使用。 如需如何在 purview 中聯機和管理 Snowflake Microsoft詳細 資訊,請遵循本檔。

重要事項

從數據源刪除物件時,後續掃描不會自動移除 Purview Microsoft對應的資產。

設定與 Snowflake 數據源的連線以進行數據質量掃描

此時,掃描的資產已準備好進行編目和治理。 將掃描的資產與治理網域 Sele 中的數據產品產生關聯。 在 [數據品質] 索引標籤上,新增 Azure SQL 資料庫連線:手動輸入資料庫名稱。

  1. 選取 [數據品質 > 控管網域 > 管理] 索引標籤以建立連線。

    顯示連線頁面導覽的螢幕快照。

  2. 在線上頁面中設定連線。

    • 新增連線名稱和描述
    • 選取來源類型 Snowflake
    • 新增伺服器名稱、倉儲名稱、資料庫名稱、架構名稱和數據表名稱
    • 選取驗證方法 - 基本身份驗證
    • 新增用戶名稱
    • 新增認證
      • 新增 Azure 訂用帳戶
      • 金鑰保存庫連線
      • 秘密名稱
      • 秘密版本
  3. 測試連線以確定已成功建立已設定的連線。

    顯示如何設定雪花式連線的螢幕快照。

    顯示如何設定雪花式連線令牌的螢幕快照。

重要事項

  • 數據質量負責人需要 Snowflake 的只讀 存取權,才能設定數據質量連線。
  • Snowflake 數據源尚不支援 vNet。
  • Snowflake 連接器不接受 https://。 當您新增伺服器名稱以設定資料源連線時,請移除 https://

Snowflake 中數據的分析和數據質量掃描

成功完成連線設定之後,您可以在 Snowflake 中分析、建立和套用規則,以及執行數據的 DQ 掃描。 請遵循下列檔中所述的逐步指導方針:

參考檔