Gestione della qualità dei dati per gli elementi di dati critici (anteprima)
Gli elementi dati critici (CDE) sono un raggruppamento logico di colonne importanti tra tabelle nelle origini dati che consentono di concentrare in modo strategico le attività di governance in cui si avrà l'effetto più significativo.
Qualità dei dati di Microsoft Purview offre una soluzione integrata per misurare la qualità degli elementi di dati critici (CDE), consentendo alle organizzazioni di garantire che questi elementi di dati chiave soddisfino gli standard richiesti per accuratezza, completezza, coerenza e integrità.
Le organizzazioni possono stabilire soglie di qualità specifiche che le cde devono soddisfare per mantenere la qualità. Tali soglie vengono applicate a livello di CDE logico, ma si riduce a tutte le singole colonne che costituiscono l'ambiente cde. Queste regole possono includere vari aspetti della qualità dei dati, tra cui convalida, pulizia, standardizzazione e arricchimento. Ad esempio, le regole di qualità dei dati potrebbero specificare che gli indirizzi dei clienti devono essere standardizzati in un formato specifico o che gli ID dipendente devono rispettare un determinato modello.
Una volta applicate le regole di qualità dei dati alle cde, Qualità dei dati di Microsoft Purview valuta sistematicamente gli elementi di dati fisici sottostanti per valutarne la conformità con queste regole. Usando l'approccio integrato di Purview Data Quality, le organizzazioni possono monitorare e gestire in modo proattivo la qualità dei loro elementi di dati critici, assicurandosi che rimangano affidabili, accurati e adatti allo scopo. Ciò non solo migliora i processi decisionali, ma aiuta anche a mitigare i rischi associati a errori o incoerenze dei dati, determinando in definitiva risultati aziendali migliori.
Tipi di asset supportati
- Azure Data Lake Storage (ADLS Gen2)
- Tipi di file: Delta e Parquet
- database SQL di Azure
- Il data estate di Fabric in OneLake include il collegamento e il mirroring dei dati. L'analisi della qualità dei dati è supportata solo per le tabelle delta e i file Parquet di Lakehouse.
- Data estate di mirroring: CosmosDB, Snowflake, Azure SQL
- Data estate di collegamento: AWS S3, GCS, AdlsG2 e dataverse
- Azure Synapse serverless e data warehouse
- Catalogo Unity Azure Databricks
- Fiocco di neve
- Google Big Query (anteprima privata)
Regole di qualità dei dati disponibili per cde
Qualità dei dati di Microsoft Purview abilita la configurazione delle regole seguenti per le cde. Se si seleziona una regola, per altre informazioni verrà visualizzato l'articolo generale sulle regole di qualità dei dati .
Regola | Definizione |
---|---|
Valori univoci. | Conferma che i valori in una colonna sono univoci. |
Corrispondenza del tipo di dati | Conferma che i valori in una colonna corrispondono ai requisiti relativi al tipo di dati. |
Campi vuoti/vuoti | Cerca campi vuoti e vuoti in una colonna in cui devono essere presenti valori. |
Configurare la qualità dei dati per le cde
Se non è già stato fatto, creare un elemento dati critico (CDE) e aggiungere colonne.
Aprire l'ambiente cde tramite:
- Aprire Microsoft Purview Unified Catalog e selezionare l'elenco a discesa Gestione dati e il sottomenu Domini di governance.
- Selezionare un dominio di governance dall'elenco.
- Selezionare il riquadro Elementi di dati critici .
- Selezionare un elemento dati critico dall'elenco.
Selezionare la scheda Qualità dei dati nell'elemento dati critico.
Aggiungere una nuova regola all'elemento dati critico selezionando Nuova regola.
Selezionare il tipo di regola di qualità dei dati da usare e selezionare Avanti.
Specificare i dettagli necessari per il tipo di regola.
Scegliere se si vuole attivare o disattivare la regola.
Selezionare Crea.
Eseguire regole di qualità dei dati per cde
Quando viene eseguita un'analisi della qualità dei dati per un asset di dati disponibile con una colonna associata a un cde, le regole di qualità dei dati configurate per tale cde genereranno un punteggio.
Pianificare o eseguire un'analisi della qualità dei dati per gli asset di dati associati al cde.
Monitorare lo stato di avanzamento del processo di analisi della qualità dei dati durante l'esecuzione, assicurandosi che venga completato senza errori o interruzioni. Controllare che le regole di qualità dei dati applicate siano state eseguite correttamente dallo snapshot della cronologia.
Esaminare i risultati del processo di analisi per valutare la qualità dell'asset di dati cde in base alle regole applicate.
Analizzare i risultati del processo di analisi della qualità dei dati per identificare eventuali problemi, anomalie o aree di miglioramento correlati all'asset di dati cde. Ciò potrebbe comportare la pulizia, la standardizzazione o l'arricchimento dei dati per migliorarne la qualità.