Snowflake 數據的數據品質
掃描 Snowflake 數據源時,Microsoft Purview 支援:
擷取技術元數據,包括:
- 伺服器、資料庫、架構和數據表,包括數據行、檢視表,包括數據行、外鍵和唯一條件約束
- 預存程式,包括參數數據集和結果集
- 包含參數數據集的函式
- 管道、階段和數據流,包括數據行
- 工作和順序
在 Purview 中設定數據對應掃描目錄 Snowflake 數據Microsoft
註冊 Snowflake 來源
若要在 整合式目錄 中註冊新的 Snowflake 來源,請遵循下列步驟:
- 在 Microsoft Purview 治理入口網站中,流覽至您的 Microsoft Purview 帳戶。
- 選取左側導覽上的 [數據對應]。
- 選取 [註冊]
- 在 [註冊來源] 上,選取 [Snowflake]。
設定數據對應掃描
- 選取已註冊的 Snowflake 來源。
- 選取 [+ 新增掃描]。
- 提供下列詳細資料:
- 名稱:掃描的名稱
- 透過整合運行時間連線:根據您的案例選取 Azure 自動解析整合運行時間、受控 VNet IR 或 SHIR。
- 線上的主機:選擇在掃描期間用來建立 Snowflake 連線的端點。 您可以從伺服器 URL 或您在資料源中設定的其他主機中進行選擇。
- 認證:選取要連線到數據源的認證。 請務必:
- 建立認證時選取 [基本身份驗證]。
- 在 [用戶名稱] 輸入字段中提供用來連線到 Snowflake 的使用者名稱。
- 將用來連線到 Snowflake 的使用者密碼儲存在秘密密鑰中。
- 倉儲:指定用來在大寫案例中強化掃描的倉儲實例名稱。 指派給認證中指定之用戶的預設角色必須具有此倉儲的USAGE許可權。
- 資料庫:指定一或多個資料庫實例名稱,以大寫大小寫匯入。 使用分號 (;) 分隔清單中的名稱。 例如,DB1;DB2。 指派給認證中指定之用戶的預設角色,必須具有資料庫對象的適當許可權。
- 架構:列出要匯入的架構子集,以分號分隔清單表示。
- 選取 [測試連線] 以驗證使用 Azure Integration Runtime) 時 (可用的設定。
- 選取 [繼續]。
- 選取用於分類的掃描規則集。 您可以選擇系統預設值、現有的自訂規則集,或建立內嵌的新規則集。
- 檢閱您的掃描,然後選取 [ 儲存並執行]。
掃描之後,Snowflake 中的數據資產將可在 整合式目錄 搜尋中使用。 如需如何在 purview 中聯機和管理 Snowflake Microsoft詳細 資訊,請遵循本檔。
重要事項
從數據源刪除物件時,後續掃描目前不會自動移除 purview Microsoft對應的資產。
設定與 Snowflake 數據源的連線以進行數據質量掃描
此時,我們已備妥掃描的資產,以進行編目和治理。 將掃描的資產關聯至治理網域 Sele 中的數據產品。 在 [數據品質] 索引標籤上,新增 Azure SQL 資料庫連線:手動輸入資料庫名稱。
選取 [數據品質 > 控管網域 > 管理] 索引標籤以建立連線。
在線上頁面中設定連線。
- 新增連線名稱和描述
- 選取來源類型 Snowflake
- 新增伺服器名稱、倉儲名稱、資料庫名稱、架構名稱和數據表名稱
- 選取驗證方法 - 基本身份驗證
- 新增用戶名稱
- 新增認證
- 新增 Azure 訂用帳戶
- 金鑰保存庫連線
- 秘密名稱
- 秘密版本
測試連線以確定已成功建立已設定的連線。
重要事項
- 數據質量負責人需要 Snowflake 的只讀 存取權,才能設定數據質量連線。
- Snowflake 數據源尚不支援 vNet。
- Snowflake 連接器不接受 https://。 當您新增伺服器名稱以設定資料源連線時,請移除 https:// 。
Snowflake 中數據的分析和數據質量掃描
成功完成連線設定之後,您可以在 Snowflake 中分析、建立和套用規則,以及執行數據的 DQ 掃描。 請遵循下列檔中所述的逐步指導方針: