Report sulla qualità dei dati in Microsoft Purview Unified Catalog
Il report Data Quality (DQ) è un documento completo che valuta e riepiloga la qualità dei dati all'interno di un'organizzazione o di un sistema. Include in genere valutazioni di varie dimensioni di qualità dei dati e metriche per aiutare gli stakeholder a comprendere l'accuratezza, la completezza, la coerenza, l'affidabilità e la sequenza temporale dei dati. Questo report sulla qualità dei dati consente al team di tenere traccia dello stato di avanzamento della gestione dell'integrità a colpo d'occhio e di identificare le aree che richiedono più lavoro per migliorare la qualità dei dati nel data estate.
Questo articolo illustra come è possibile accedere a questo report e il significato della misura di qualità dei dati fornita per la gestione dell'integrità.
Scopi del report
Monitoraggio e governance: per monitorare e gestire continuamente la qualità dei dati, assicurandosi che soddisfi gli standard e i requisiti normativi dell'organizzazione.
Supporto decisionale: fornire agli stakeholder dati affidabili per prendere decisioni aziendali informate.
Identificazione dei problemi: per rilevare e documentare i problemi di qualità dei dati, abilitando la correzione tempestiva.
Miglioramento della gestione dei dati: per migliorare le procedure di gestione dei dati identificando le cause principali dei problemi di qualità dei dati e implementando misure correttive.
Misurazione delle prestazioni: per misurare l'efficacia delle iniziative di qualità dei dati e tenere traccia dei miglioramenti nel tempo.
Comunicazione degli stakeholder: per comunicare lo stato e l'avanzamento della qualità dei dati agli stakeholder, tra cui la gestione, i proprietari dei prodotti dati, gli amministratori dei dati e i team IT. Fornendo una visione chiara e completa dello stato della qualità dei dati, questi report svolgono un ruolo fondamentale nel mantenere l'integrità e l'utilità dei dati all'interno di un'organizzazione.
Prerequisiti
Per poter visualizzare le informazioni sull'integrità di Data Estate, è necessario disporre delle autorizzazioni di lettura dell'integrità dei dati .
Visualizzare il report sull'integrità della governance dei dati
- Aprire il portale di Microsoft Purview e selezionare Unified Catalog.
- Selezionare l'elenco a discesa Gestione integrità .
- Selezionare report
- Selezionare il report integrità dati .
Creazione di report delle dimensioni di qualità dei dati
La pagina di panoramica del report illustra i punteggi delle dimensioni di qualità dei dati, la gerarchia delle regole di qualità dei dati, lo stato della qualità dei dati per dimensione e le dimensioni di qualità dei dati & tipi di regole usati per asset di dati diversi. I controlli principali consentono di comprendere a colpo d'occhio la gestione complessiva dell'integrità.
Usare i filtri per visualizzare informazioni per domini di governance specifici, prodotti dati o prodotti dati in un determinato stato (ad esempio, bozza).
Dimensione Data Quality | Descrizione |
---|---|
Precisione | I dati devono rappresentare in modo accurato entità reali. Il contesto è importante. Ad esempio, se si archiviano gli indirizzi dei clienti, assicurarsi che corrispondano alle posizioni effettive. |
Completezza | L'obiettivo di questa regola è identificare i dati vuoti, Null o mancanti. Questa regola convalida che tutti i valori siano presenti (anche se non necessariamente corretti). |
Conformità | Questa regola garantisce che i dati seguano gli standard di formattazione dei dati, ad esempio la rappresentazione di date, indirizzi e valori consentiti. |
Consistenza | Questa regola verifica che valori diversi dello stesso record siano conformi a una determinata regola e che non vi siano contraddizioni. La coerenza dei dati garantisce che le stesse informazioni siano rappresentate in modo uniforme tra record diversi. Ad esempio, se si dispone di un catalogo prodotti, i nomi e le descrizioni dei prodotti coerenti sono fondamentali. |
Tempestività | Questa regola mira a garantire che i dati siano accessibili nel minor tempo possibile. Garantisce che i dati siano aggiornati. |
Unicità | Questa regola verifica che i valori non siano duplicati, ad esempio, se si suppone che sia presente un solo record per cliente, non sono presenti più record per lo stesso cliente. Ogni cliente, prodotto o transazione deve avere un identificatore univoco. |
Il punteggio complessivo di qualità dei dati e i punteggi delle dimensioni consentono ai professionisti dei dati e ai proprietari di data estate di comprendere quanto siano completi, accurati, coerenti e affidabili i loro dati. Indica anche quali azioni di miglioramento devono essere intraprese per migliorare la qualità del patrimonio dati.
Consiglio
Se si usano i filtri, questi indicatori KPI rifletteranno i punteggi per i domini di governance o i prodotti dati selezionati.
Stato della qualità dei dati in base alle dimensioni
I punteggi delle dimensioni di qualità dei dati vengono calcolati per ogni dominio di governance. Dimensioni mappate con regole e il punteggio è stato sottoposto a rollback dalle colonne di asset di dati all'asset di dati e dall'asset di dati al prodotto dati e al livello di dominio governance per ogni dimensione standard del settore. È possibile filtrare il punteggio di livello delle dimensioni per ogni dominio di governance per esaminare altri dettagli.
Rapporto di superamento e esito negativo delle regole di qualità dei dati
Il rapporto di superamento e errore delle regole di qualità dei dati è stato misurato per ogni dimensione DQ per i prodotti dati. Questa misura consente ai proprietari dei dati e ai professionisti dei dati di comprendere quale percentuale di dati in un prodotto dati è imprecisa, incoerente, incompleta, duplicata o non abbastanza fresca come previsto. Questa misura consente inoltre di analizzare e comprendere se le regole applicate non sono corrette o se i dati non sono corretti.
Report dei dettagli sulla qualità dei dati
Questo report consente di comprendere quante regole vengono applicate a prodotti dati, asset di dati ed elementi di dati critici per misurare e monitorare la qualità dell'intero patrimonio dati dell'organizzazione. È possibile eseguire il drill-down per vedere quanti record di un asset di dati non sono riusciti per un tipo di regola, quale tipo di regola sta eseguendo meglio e quali prodotti dati e dominio di governance pubblicano e mantengono dati attendibili. È possibile filtrare le misure in base al dominio di governance e al prodotto dati per comprendere lo stato corrente e pianificare azioni di miglioramento.
Nota
- Il report sull'integrità della qualità dei dati ha dipendenze dai controlli di integrità dei dati e dal modello di analisi self-service dei metadati Purview. Se i clienti non usano i controlli di integrità dei dati e non sottoscrivono Purview Unified Catalog metadati, il report sull'integrità della qualità dei dati non verrà aggiornato. I clienti devono usare i controlli di integrità dei dati o sottoscrivere i metadati purview per l'analisi self-service per aggiornare il report sull'integrità della qualità dei dati.
- Se i clienti non usano la funzionalità Data Quality, il report di Data Quality Health verrà visualizzato vuoto perché il report Integrità qualità dati viene creato usando i dati generati dalla funzionalità di analisi della qualità dei dati.