Configurazione di esempio per la governance dei dati
La governance dei dati di Microsoft Purview, con Microsoft Purview Unified Catalog e Microsoft Purview Data Map, offre visibilità completa, attendibilità dei dati e innovazione responsabile per aiutare le organizzazioni a ottenere un valore aziendale maggiore nell'era dell'IA. Usando un esempio di gestione dei dati di integrità, seguire la procedura descritta in questo articolo per comprendere come configurare Unified Catalog e usare le relative funzionalità per creare una pratica di governance dei dati valida per l'organizzazione.
Passaggio 1: Configurare i domini di governance in Unified Catalog
I domini di governance sono la chiave per stabilire la responsabilità per i dati e consentono di federatare la governance di tali dati in tutta l'azienda. Quando si creano domini di governance, a partire dal proprietario appropriato si garantisce di essere in grado di identificare e collaborare in modo efficace con gli esperti per tutti i dati nel data estate. I domini di governance possono essere di molti tipi diversi da allineare al tipo di limite dei dati per il team che governerà tali dati. Ad esempio: domini funzionali (finanza, risorse umane, vendite) o domini dati (prodotto, cliente, integrità).
Prerequisiti
Concedere le autorizzazioni e compilare il primo dominio di governance
Aprire il portale di Microsoft Purview.
Accedere al portale di Microsoft Purview usando le credenziali per un account amministratore a cui è assegnato il ruolo di gestione dei ruoli, ad esempio un amministratore di Purview. Passare a Ruoli e ambiti delle impostazioni > per visualizzare e gestire.
Selezionare Gruppi di ruoli.
Nella pagina Gruppi di ruoli per le soluzioni Microsoft Purview selezionare il gruppo di ruoli Governance dei dati .
Nella pagina Modifica membro del gruppo di ruoli selezionare Scegli utenti o Scegli gruppi.
Selezionare la casella di controllo per tutti gli utenti o i gruppi da aggiungere al gruppo di ruoli.
Selezionare Seleziona.
In Unified Catalog selezionare Gestione catalogo e quindi Domini di governance.
Nella pagina Domini di governance è possibile configurare il resto del catalogo per consentire ad altri utenti di federatare la proprietà dei dati, consentire ai team di sviluppare le proprie conoscenze e stabilire il valore aziendale dei dati.
- Per iniziare, selezionare Nuovo dominio di governance.
- Puoi aggiornare il nome del tuo dominio di governance, ma per questo possiamo denominarlo "(Tutorial) Personal Health" e fornirgli una descrizione di "Dati sanitari personali si riferisce a qualsiasi informazione correlata alla salute fisica o mentale di un individuo che viene raccolta e usata all'interno del settore sanitario. Ciò può includere un'ampia gamma di tipi di dati, ad esempio cartelle cliniche, cronologie di trattamento, immagini diagnostiche e risultati dei test di laboratorio. È spesso protetto da varie leggi e normative per garantire la privacy e la riservatezza."
- Selezionare il tipo come "dominio dati".
- Lasciare vuoto l'elemento padre (se questo è il primo dominio di governance nel catalogo non avrà nulla da selezionare qui)
- Selezionare Crea.
- Creare ora altri due domini autonomamente. Questi saranno i punti chiave della federazione per la collaborazione e la governance nella propria organizzazione, quindi pensa a chi potrebbe essere il proprietario dei tuoi domini quando implementi Microsoft Purview Unified Catalog.
- È possibile seguire questi esempi:
- Un dominio funzionale aziendale rappresenta gli asset e i termini altamente controllati usati da un'intera società.
- Sales è un dominio funzionale che la maggior parte delle organizzazioni avrà che è un dominio figlio di Corporate.
- Per iniziare, selezionare Nuovo dominio di governance.
Selezionare il dominio di governance creato.
Selezionare la scheda Ruoli del dominio di governance.
Per impostazione predefinita, quando si crea il dominio di governance si viene aggiunti a tutti i ruoli nel dominio di governance. In qualità di proprietario del dominio di governance si aggiungono gli amministratori dei dati (esperti aziendali nel dominio) e i proprietari dei prodotti dati (che sanno quali asset di dati sono i migliori da usare per gli altri utenti).
Tornare alla scheda Dettagli .
Selezionare il pulsante Gestisci criteri per applicare criteri a livello di dominio. Questo criterio verrà applicato a tutti i prodotti dati nel dominio, consentendo l'applicazione automatica di un criterio garantisce che gli esperti di dati non siano esperti di criteri.
Nella scheda Gestisci criteri di accesso selezionare la casella di controllo accanto a Consenti copie dei dati. Selezionando questa opzione di criterio verrà applicata automaticamente un'attestazione che richiede a tutti gli utenti che richiedono l'accesso ai prodotti dati di attestare di comprendere i criteri di copia dei dati per i dati.
Selezionare Salva modifiche per verificare che i criteri siano impostati dal dominio di governance.
Selezionare Pubblica nel dominio di governance. Il pulsante Pubblica pubblica tutti gli altri concetti all'interno del dominio.
Creare termini del glossario
L'aggiunta di termini glossari al dominio di governance consente ad altri utenti di comprendere meglio il modo in cui l'azienda usa e comprende i dati. I termini del glossario garantiscono anche che le informazioni dettagliate usino termini comuni e, in genere, le conoscenze nel dominio di governance.
Nella pagina per il dominio di governance trovare la scheda Termini glossario e selezionare Visualizza tutto.
Nella pagina Termini glossario selezionare Nuovo termine.
Immettere i dettagli:
- Nome: 'Outbreak'
- Descrizione: Una malattia che ha colpito o ha il potenziale per colpire una grande parte della popolazione.
- È possibile lasciare vuoto il resto per il momento, ma ci sono campi da raccogliere: il termine proprietario responsabile della definizione del termine per la propria azienda, acronimi da condividere comuni noti anche come nomi del termine, infine è possibile fornire collegamenti alle risorse che avrebbero ancora più informazioni sul termine.
Selezionare Crea.
Selezionare il pulsante Gestisci criteri . Analogamente ai criteri a livello di dominio, è possibile creare criteri a livello di termine che verranno applicati ovunque il termine in uso.
Selezionare la casella accanto a Approvazione manager necessaria. In questo modo viene applicata un'approvazione secondaria da parte del gestore elencato degli utenti in Microsoft Entra ID quando viene richiesto l'accesso ai prodotti dati.
Selezionare Pubblica per il termine outbreak creato. I termini pubblicati saranno filtrabili in Unified Catalog e garantire che gli altri utenti che usano il termine per descrivere il prodotto dati possano visualizzare tale descrizione in Unified Catalog durante l'esplorazione del prodotto dati.
Creare ora altri due termini. Questa volta, selezionare il termine "Outbreak" come termine padre per i termini creati. Provare a creare relazioni tra questi termini figlio nella scheda correlata su entrambi i termini per contribuire a creare la rete di come questi termini interagiscono per spiegare l'intero argomento.
- Pandemia: un'epidemia globale di una malattia che colpisce un gran numero di persone in più paesi o continenti.
- Epidemia: un'epidemia a livello di paese o regionale di una malattia che è altamente contagiosa e colpisce gran parte della popolazione.
Provare a creare un paio di altri termini in qualsiasi altro dominio creato in precedenza. Se non si è certi di cosa aggiungere, provare il pulsante Get suggested terms (Ottieni termini suggeriti ) per fare in modo che GenAI ne proponga alcuni in base alla descrizione e al nome del dominio già fornito.
Aggiungere un OKR
Aggiungere ora un OKR (obiettivo e risultato chiave) per il dominio integrità personale per aiutare altri utenti a comprendere il valore aziendale dei dati. Verrà creata una connessione diretta tra i dati e il valore aziendale fornito.
Selezionare la casella OKR nella pagina del dominio di governance.
Selezionare Nuovo OKR.
Immettere prima i dettagli dell'obiettivo:
- Obiettivo: Ridurre il rischio di pandemia abilitando l'adozione efficace del vaccino per i pazienti.
- Proprietario: immettere il nome
- Data di destinazione: '2024-12-31'
Selezionare Crea.
L'aggiunta di risultati chiave all'obiettivo garantisce che gli obiettivi siano misurabili e che vengano monitorati i progressi verso l'obiettivo. Selezionare + Aggiungi risultato chiave.
Immettere i dettagli dei risultati della chiave:
- Risultato chiave: assicurarsi che l'80% delle fasce di età più anziane (>65 anni) che hanno maggiori probabilità di essere colpite dalla pandemia ricevano la vaccinazione completa entro la fine dell'anno civile 2024.
- Stato di avanzamento: in corso
- Importo avanzamento: 70
- Importo obiettivo: 80
- Importo massimo: 100
Selezionare Crea.
Scegliere Pubblica.
Creare elementi di dati critici
Infine, creare un elemento dati critico (CDE) in Integrità personale per garantire che le colonne di dati più importanti abbiano una definizione, una comprensione coerenti e che soddisfino sempre le aspettative aziendali per il formato e l'archiviazione dei dati.
- Nella pagina domini di governance con il dominio Integrità personale selezionato selezionare la casella Elementi di dati critici .
- Selezionare Nuovo elemento dati critico.
- Immettere i metadati cde di base:
- Nome: gruppi di età
- Descrizione: il raggruppamento comune di età delle persone usato per garantire i report analitici necessari segue un riferimento da cui altri possono dipendere e rimuovere le singole età per migliorare l'anonimato dei dati. La fascia di età è divisa in 8 gruppi; <2 anni, 2-4 anni, 5-11 anni, 12-17 anni, 18-24 anni, 25-49 anni, 50-64 anni, 65+ anni.
- Proprietario: immettere il proprio nome
- Tipo di dati previsto: testo
- Selezionare Crea.
La potenza reale dell'ambiente cde consiste nel fatto che esegue il mapping diretto alle colonne di dati fisiche in cui sono archiviati questi dati. Questa connessione garantisce una comprensione comune e consente la valutazione delle regole e dei criteri di Data Quality su larga scala.
Nell'ambiente cde appena creato selezionare + Aggiungi colonna.
Cercare l'asset di dati Covid 19 Vaccine and Case Trends dal contenitore gold del data lake
Selezionare la casella, non il nome, dell'asset Covid 19 Vaccine and Case Trends .
Consiglio
Se si seleziona il nome blu dell'asset, verrà aperta una nuova finestra in Microsoft Purview che mostra i dettagli dell'asset.
Selezionare il pulsante di opzione accanto alla colonna AgeGroupVacc.
Selezionare Aggiungi.
Selezionare la scheda Qualità dati nella parte superiore dell'ambiente cde appena creato per applicare le regole di qualità dei dati all'ambiente cde. È simile a come sono stati aggiunti criteri per i termini del glossario e i domini di governance.
Selezionare Nuova regola
Selezionare corrispondenza tipo di dati
Immettere Il nome della regola: Conferma formattazione gruppo di età
Selezionare Crea.
Selezionare Pubblica nell'ambiente cde
Questa cde applicherà ora automaticamente una regola di qualità dei dati a ogni prodotto dati che usa l'asset Covid 19 Vaccine and Case Trends, che verrà illustrato nella sezione successiva.
- Provare a creare un paio di altri CDE negli altri domini. Ecco alcune idee:
- Sales: Revenue and Seller Name
- Aziendale: ID prodotto
Passaggio 2: Configurare e registrare i dati in Mappa dati
Se non sono disponibili origini dati per l'analisi, è possibile seguire questa procedura per distribuire completamente un esempio di Azure Data Lake Storage (ADLS Gen2).
Consiglio
Se si dispone già di un'origine dati nello stesso tenant dell'account Microsoft Purview, passare alla parte successiva di questa sezione per analizzare gli asset.
In un'area dati reale sono disponibili molti sistemi diversi in uso per applicazioni dati diverse. Esistono ambienti di creazione di report come Fabric e Snowflake in cui i team usano copie dei dati per creare soluzioni analitiche e alimentare i report e i dashboard. Esistono sistemi dati operativi che alimentano i team o i clienti delle applicazioni per completare i processi aziendali che raccolgono o aggiungono dati in base alle decisioni prese durante il processo.
Per creare un patrimonio dati più realistico, è consigliabile mostrare molte origini di dati nel catalogo, che possono coprire l'ampiezza di dati diversi che qualsiasi azienda potrebbe avere. I tipi di dati necessari per alimentare un caso d'uso possono essere molto diversi con gli utenti aziendali che necessitano di report e dashboard, gli analisti hanno bisogno di dimensioni e fatti conformi per compilare report, i data scientist o i data engineer hanno bisogno di dati di origine non elaborati provenienti direttamente dal sistema che raccoglie i dati tutti questi e più consentono ai diversi utenti di vedere l'importanza della ricerca, e l'accesso ai dati nella stessa posizione.
Per altre esercitazioni sull'aggiunta di dati al patrimonio, è possibile seguire queste guide:
- Esercitazione su Fabric Lakehouse : fornisce la base di un ambiente di creazione di report
- database Azure SQL (esempio): fornisce un esempio ben strutturato di un archivio dati operativo
Prerequisiti
- Sottoscrizione in Azure: Creare oggi l'account gratuito di Azure
- Microsoft Entra ID per il tenant: Microsoft Entra ID Governance
- Un account Microsoft Purview
- Amministrazione l'accesso all'account Microsoft Purview (impostazione predefinita se è stato creato l'account Microsoft Purview). Autorizzazioni nella nuova anteprima del portale di Microsoft Purview | Microsoft Learn)
- Tutte le risorse; Microsoft Purview, l'origine dati e Microsoft Entra ID devono trovarsi nello stesso tenant cloud.
Configurare il patrimonio dati
R. Creare e popolare un account di archiviazione
- Seguire questa guida per creare un account di archiviazione: Creare un account di archiviazione per Azure Data Lake Storage Gen2
- Creare contenitori per il nuovo data lake:
- Passare alla pagina Panoramica dell'account di archiviazione.
- Selezionare la scheda Contenitori nella sezione Archiviazione dati.
- Selezionare il pulsante + Contenitore
- Assegnare il nome "bronze" e selezionare il pulsante Crea
- Ripetere questi passaggi per creare un contenitore "gold"
- Scaricare alcuni dati CSV di esempio da data.gov: covid-19 vaccinazione e tendenze dei casi per fascia di età, Stati Uniti
- Caricare il file CSV nel contenitore denominato 'bronze' nell'account di archiviazione creato.
- Selezionare il contenitore denominato 'bronze' e selezionare il pulsante Carica .
- Esplorare il percorso in cui è stato salvato il file CSV e selezionare il file Covid-19_Vaccination_Case _Trends .
- Scegliere Carica.
B. Creare un Azure Data Factory
Questo passaggio illustra il modo in cui i dati si spostano tra i livelli di un data lake di medallion e garantisce che i dati siano in un formato standardizzato che i consumer si aspetterebbero di usare. Si tratta di un passaggio prerequisito per l'esecuzione di Data Quality.
Seguire questa guida per creare un Azure Data Factory: Creare un Azure Data Factory
Copiare i dati dal file CSV nel contenitore 'bronze' nel contenitore 'gold' come tabella di formato Delta usando questa guida Azure Data Factory: Trasformare i dati usando un flusso di dati di mapping
Aprire l'esperienza Azure Data Factory (ADF) dal portale di Azure selezionando il pulsante Avvia studio nella scheda Panoramica della risorsa ADF creata.
Selezionare la scheda Autore in ADF Studio.
Selezionare il + pulsante e scegliere Flusso di dati dal menu a discesa.
Assegnare al flusso di dati il nome 'CSVtoDeltaC19VaxTrends'.
Selezionare Aggiungi origine nella casella vuota.
Impostare Le impostazioni di origine su:
- Nome flusso di output: 'C19csv'
- Descrizione: lasciare vuoto
- Tipo di origine: inline
- Tipo di set di dati inline: testo delimitato
- Servizio collegato: selezionare il data lake in cui è stato archiviato il csv
Impostare le opzioni di origine su:
- Modalità file: File
- Percorso file: /bronze/ Covid-19_Vaccination_Case _Trends
- Consenti nessun file trovato: lasciare deselezionato
- Change data capture( Modifica acquisizione dati): lasciare deselezionata
- Tipo di compressione: Nessuno
- Codifica: predefinita (UTF-8)
- Delimitatore di colonna: virgola (,)
- Delimitatore di riga: Predefinito(\r, \n o\r\n)
- Carattere virgolette: virgolette doppie (")
- Carattere di escape: barra rovesciata ()
- Prima riga come intestazione: CHECKED
- Lasciare il resto come impostazioni predefinite
Selezionare il piccolo + Accanto all'origine creata e selezionare Sink
Creare il sink in cui vengono archiviati il formato e la posizione dei dati da archiviare per spostare i dati da un csv in 'bronze' a una tabella delta in 'gold'.
- Impostare i valori sink (lasciare tutte le impostazioni come predefinite se non specificato)
- Tipo di sink: inline
- Tipo di set di dati inline: Delta
- Servizio collegato: lo stesso data lake usato nell'origine, perché verrà archiviato in un contenitore diverso.
Impostare i valori dell'impostazione (lasciare tutte le impostazioni predefinite, se non specificato)
- Percorso cartella: gold/Covid19 Vaccine and Case Trends
È necessario immettere il valore perché questo nome è il modo in cui si desidera archiviare i dati e non esiste da selezionare.
Selezionare Convalida, in questo modo viene controllato il flusso di dati e vengono fornite istruzioni per correggere eventuali errori.
Selezionare Pubblica tutto.
Selezionare il + pulsante e selezionare pipeline dal menu a discesa
Assegnare alla pipeline il nome "CSV to Delta C19 Vax Trends"
Selezionare il flusso di dati creato nei passaggi precedenti da CSV a Delta (C19VaxTrends) e trascinarlo nella scheda della pipeline aperta.
Selezionare Convalida
Selezionare Pubblica
Selezionare Debug (usa runtime attività) per eseguire la pipeline.
Consiglio
Se si verificano errori per spazi o caratteri inappropriati per il formato differenziale: aprire il file CSV scaricato e apportare correzioni. Quindi ricaricare e sovrascrivere il csv nella zona bronze. Eseguire quindi di nuovo la pipeline.
Passare al contenitore gold nel data lake e verrà ora visualizzata la nuova tabella Delta creata durante la pipeline.
Analizzare gli asset
Se non sono stati analizzati gli asset di dati nel Microsoft Purview Data Map, è possibile seguire questa procedura per popolare la mappa dati.
L'analisi delle origini nel patrimonio dati raccoglierà automaticamente i metadati degli asset di dati (tabelle, file, cartelle, report e così via) in tali origini. Registrando un'origine dati e creando l'analisi, si stabilisce la proprietà tecnica delle origini e degli asset visualizzati nel catalogo e si garantisce di avere il controllo su chi può accedere ai metadati in Microsoft Purview. Registrando e archiviando origini e asset a livello di dominio, verrà archiviato al livello più alto della gerarchia di accesso. In genere è consigliabile creare alcune raccolte in cui si analizzano i metadati degli asset e si stabilisce la gerarchia di accesso corretta per tali dati.
-
Fornire l'accesso lettore per l'identità gestita di Microsoft Purview (MSI) al data lake o a un altro archivio dati.
Consiglio
L'identità del servizio gestito è il nome dell'account dell'istanza di Microsoft Purview.
Se si è scelto di usare Microsoft Fabric o SQL, è possibile usare queste guide per fornire l'accesso:
Registrare il data lake e analizzare gli asset
In Microsoft Purview Data Map nella scheda domini selezionare le assegnazioni di ruolo per il dominio (sarà il nome dell'account Microsoft Purview):
- Aggiungere se stessi come amministratore dell'origine dati e come curatore dei dati al dominio.
- Selezionare l'icona della persona accanto al ruolo Amministratore origine dati.
- Cerca il tuo nome così com'è in Microsoft Entra ID (potrebbe essere necessario immettere il nome completo digitato esattamente come è in Microsoft Entra ID).
- Selezionare OK.
- Ripetere questi passaggi per il curatore dei dati.
- Aggiungere se stessi come amministratore dell'origine dati e come curatore dei dati al dominio.
Registrare il data lake:
- Selezionare la scheda Origini dati .
- Selezionare Registra.
- Selezionare il tipo di archiviazione Azure Data Lake Storage Gen2.
Specificare i dettagli per la connessione:
- Sottoscrizione (facoltativa)
- Nome origine dati (questo sarà il nome dell'origine ADLS Gen2)
- Raccolta in cui archiviare i metadati degli asset (facoltativo)
- Selezionare Registra
Al termine della registrazione dell'origine dati, è possibile configurare l'analisi. La registrazione indica che Microsoft Purview è connesso all'origine dati e lo ha inserito nella raccolta corretta per la proprietà. L'analisi leggerà quindi i metadati dall'origine e popola gli asset nella mappa dati.
Selezionare l'origine registrata nella scheda Origini dati
Selezionare una nuova analisi e specificare i dettagli:
- Usare il runtime di integrazione predefinito per questa analisi
- Le credenziali devono essere Microsoft Purview MSI (system)
- Il livello di analisi è Rilevamento automatico
- Selezionare una raccolta o usare il dominio (la raccolta deve essere la stessa raccolta o la stessa raccolta figlio di in cui è stata registrata l'origine dati)
- Selezionare Continua
Consiglio
A questo punto Microsoft Purview testerà la connessione per verificare che sia possibile eseguire un'analisi. Se non è stato concesso l'accesso al lettore MSI di Microsoft Purview nell'origine dati, l'operazione avrà esito negativo. Se non si è il proprietario dell'origine dati o si dispone di un collaboratore per l'accesso utente, l'analisi avrà esito negativo perché si prevede di avere l'autorizzazione per creare la connessione.
Selezionare ora solo il contenitore "gold" in cui è stata inserita la tabella delta nella sezione dei dati di compilazione dell'esercitazione. Ciò impedirà l'analisi di eventuali altri asset di dati presenti nell'archivio dati.
- Dovrebbe avere un solo assegno blu accanto all'oro, è possibile lasciare i controlli accanto a tutto perché analizzerà l'origine completa e creerà comunque gli asset che useremo e altro ancora.
- Selezionare Continua
Nella schermata selezionare un set di regole di analisi è consigliabile usare il set di regole di analisi predefinito.
Selezionare Continua
In impostare un trigger di analisi si imposterà la frequenza dell'analisi in modo da continuare ad aggiungere asset di dati al contenitore gold del lago che continuerà a popolare la mappa dati. Selezionare Una volta.
Selezionare Continua.
Selezionare Salva ed esegui. Verrà creata un'analisi che leggerà solo i metadati dal contenitore gold del data lake e popola la tabella che verrà usata in Microsoft Purview Unified Catalog nelle sezioni successive. Se si seleziona solo Salva, l'analisi non verrà eseguita e gli asset non verranno visualizzati. Dopo l'esecuzione dell'analisi, verrà visualizzata l'analisi creata con lo stato Ultima esecuzionein coda. Quando le letture dell'analisi completano gli asset sono pronti per la sezione successiva. Questa operazione potrebbe richiedere alcuni minuti o ore a seconda del numero di asset presenti nell'origine.
Passaggio 3: Pubblicare i prodotti dati
La creazione di prodotti dati è essenziale per garantire che i dati corretti siano resi individuabili dall'organizzazione. I prodotti dati consentono di evitare il sovragoverno dei dati che sono bassi o non hanno valore nel patrimonio dati perché non hanno alcun utilizzo o valore limitato. Assicurarsi che gli esperti di dati stiano per pubblicare i prodotti dati attiveranno i dati più importanti e creeranno il livello di governance corretto in base a tale valore. La cura di asset che i team tecnici non conoscono lo scopo aziendale o il tentativo di governare tutto ciò che è nel complesso e crescente patrimonio di dati causerà più tempo e perdita di produttività inseguendo i dettagli dei dati che potrebbero non essere mai usati o che potrebbero essere semplicemente rimossi dalla proprietà. Concentrarsi invece sui dati che hanno valore e che le persone devono individuare e creare ancora più valore. Man mano che i team usano più dati e ottengono una migliore comprensione di ciò che è necessario o è possibile creare prodotti dati più utili per soddisfare tali esigenze e la governance può adattarsi per garantire che rimanga sempre la dimensione corretta in base al valore e alla sensibilità dei dati.
Prerequisiti
- Deve essere un proprietario del prodotto dati per il dominio di governance in uso.
- Deve avere asset di dati nella mappa dati. In caso contrario, vedere la sezione 2 di questa esercitazione per aggiungerne alcune.
- Per pubblicare un prodotto dati, è necessario pubblicare un dominio di governance. Se non è disponibile, vedere la sezione 1 di questa esercitazione per crearne una.
Creare e pubblicare un prodotto dati
Aprire il portale di Microsoft Purview.
Selezionare Unified Catalog.
Selezionare Gestione catalogo e quindi Domini di governance.
Nella pagina Domini di governance selezionare il dominio Integrità personale
Selezionare il collegamento Vai ai prodotti dati in Concetti aziendali
Qui gli esperti di dati chiamati proprietari dei prodotti dati identificheranno gli asset di dati che devono essere utilizzati da altri utenti dell'organizzazione e forniranno le informazioni necessarie per renderli utilizzabili.
Selezionare Nuovo prodotto dati
Fornire informazioni dettagliate sul prodotto dati
- Nome: "Covid-19 Vaccinazione e tendenza dei casi in base all'età"
- Descrizione: "Questi dati provengono dal CDC come parte del Dipartimento della Salute degli Stati Uniti & Servizi Umani. I dati contengono tendenze nelle vaccinazioni e nei casi per fascia di età, a livello nazionale degli Stati Uniti. I dati vengono stratificati da almeno una dose e completamente vaccinati. I dati rappresentano anche tutti i partner per i vaccini, tra cui cliniche partner giurisdizionali, farmacie al dettaglio, strutture di assistenza a lungo termine, centri di dialisi, agenzia federale per la gestione delle emergenze e siti partner dell'amministrazione delle risorse e dei servizi sanitari e strutture di entità federali."
- Tipo: Set di dati
- Selezionare Avanti.
- Casi d'uso: "Questi dati sono forniti per uso pubblico e hanno lo scopo di aiutare a comprendere le tendenze della vaccinazione verso l'alto e i nuovi casi da diverse fasce di età. Le età sono raggruppate in due gruppi che vanno da <2 anni a oltre 65 anni. Analogamente, le tendenze sono fornite in numeri giornalieri che forniscono la media di sette giorni dei nuovi casi per fascia di età."
- Contrassegna come Approvato come selezionato.
- Seleziona Salva.
A questo momento sono stati compilati i metadati di base del prodotto dati. Aggiungere quindi alcune proprietà e mappare l'asset dalla mappa dati.
Selezionare il pulsante + Aggiungi asset di dati .
Verranno visualizzati gli asset analizzati nella mappa dati, che includerà tutte le cartelle e i livelli dell'origine dati.
Cercare l'asset Covid19 Vaccine and Case Trends aggiunto al contenitore gold del data lake e selezionare questo set di risorse.
Selezionare Aggiungi. È possibile selezionare tutti gli asset necessari per un prodotto dati, ma qui ne è necessario solo uno.
Consiglio
Provare il pulsante Ottieni suggerimenti per fare in modo che GenAI selezioni gli asset nella mappa dati e selezioni il vaccino Covid19 e le tendenze dei casi da un elenco ridotto di risultati.
È ora possibile visualizzare l'asset aggiunto al prodotto dati.
Selezionare + Aggiungi termine accanto al titolo dei termini del glossario
Selezionare il termine di epidemia creato in precedenza e selezionare Aggiungi
Dovrebbe essere visualizzato l'elemento dati critico per la fascia di età dall'asset mappato al prodotto dati.
Selezionare + Aggiungi OKR accanto al titolo OKR
Selezionare Riduci il rischio di pandemia abilitando l'adozione efficace del vaccino per i pazienti. È l'obiettivo creato nella prima sezione.
Gestire i criteri di richiesta di accesso ai prodotti dati
Nella parte superiore della pagina, l'ultimo passaggio prima di pubblicare il prodotto dati consiste nel selezionare il pulsante Gestisci criteri . In questo caso i criteri di accesso e il flusso di lavoro di accesso delle richieste vengono configurati effettuando selezioni e fornendo i nomi per l'approvazione. È anche possibile usare la scheda Criteri ereditati per visualizzare i criteri di dominio di governance applicati per l'attestazione delle copie dei dati applicata in precedenza. È lo stesso per l'approvazione del manager richiesta dal termine di glossario dell'epidemia.
Selezionare la scheda Gestisci criteri .
In Limite di tempo di accesso specificare i dettagli per quanto tempo la richiesta di accesso è valida prima di dover essere rinnovata. Verrà impostato in modo da concedere l'accesso per un massimo di un anno.
Nella casella, metti 1.
Selezionare anni nell'elenco a discesa.
In Requisiti di approvazione specificare il nome nella casella responsabili approvazione. (Richiederà il nome registrato in Microsoft Entra ID)
Nota
Non è necessario controllare l'approvazione del responsabile perché tale criterio è ereditato dal termine di glossario dell'epidemia.
Selezionare il pulsante Modulo di richiesta di anteprima per visualizzare i consumer del catalogo quando si richiede l'accesso. Verranno visualizzati l'attestazione della copia dei dati e l'approvazione del manager necessari perché sono stati impostati dal dominio di governance e dal termine del glossario.
Selezionare Salva modifiche.
Dopo aver eseguito il mapping degli asset di dati e aver configurato i criteri di accesso, è possibile pubblicare il prodotto dati nel catalogo.
Selezionare Pubblica nel prodotto dati.
Provare a creare un report di profitto in altri domini creati in precedenza
- Report profitto, tipo: dashboard/report.
- Product Master, Type: dati maser e dati di riferimento.
Nota
È possibile aggiungere molti asset a questi e vedere l'aspetto di un prodotto dati con molti asset e i prodotti dati ai termini di qualsiasi dominio per vedere come viene usato il glossario per descrivere i dati usando un set coerente di termini.
Passaggio 4: Eseguire la qualità dei dati
Ora che nel catalogo è disponibile un prodotto dati, l'esecuzione di regole di qualità dei dati indicherà a tutti che i dati sono in buona forma e pronti per essere usati. Man mano che si apprendono altre informazioni sulle nuove regole di qualità dei dati, è possibile aggiungerle per assicurarsi che siano adatte a tutti i casi d'uso. Garantire che i prodotti dati siano della massima qualità aiuterà a creare fiducia nei dati e a indicare ad altri utenti che viene monitorato un miglioramento. Man mano che il valore dei dati aumenta, la qualità di tali dati dovrà essere monitorata e controllata più da vicino perché i problemi di qualità dei dati possono causare impatti elevati se gestiti in modo non corretto.
Prerequisiti
- Le regole di qualità dei dati possono essere eseguite solo in tabelle di formato differenziale in ADLS Gen2 e Microsoft Fabric.
- L'identità gestita di Microsoft Purview deve essere abilitata per leggere l'origine dati perché è attualmente l'unica credenziale supportata per la qualità dei dati.
- È necessario avere il ruolo di amministratore della qualità dei dati nel dominio di governance in cui si esegue la qualità dei dati.
- È necessario essere il proprietario o disporre dell'accesso dell'amministratore dell'accesso utente all'origine dati in cui si sta connettendo l'analisi della qualità dei dati per garantire l'autorizzazione di sicurezza appropriata per analizzare i dati.
- Per eseguire profili nei dati, è necessario disporre del ruolo di amministratore del profilo dati .
Creare ed eseguire regole di qualità dei dati
Aprire il portale di Microsoft Purview.
Selezionare Unified Catalog.
Selezionare la scheda Qualità dei dati in Gestione dati.
Selezionare il dominio di integrità personale creato nella sezione 1.
Selezionare il pulsante Gestisci e selezionare Connections dal menu. La creazione di questa connessione garantisce la possibilità di eseguire analisi della qualità dei dati nell'origine dati in tale dominio di governance, impedendo ai team di ottenere l'accesso alla conoscenza dei dati senza un'autorizzazione appropriata.
Selezionare Nuovo nella schermata delle connessioni per creare una nuova connessione:
- Specificare il nome visualizzato 'Personal Health ADLSg2 DQ'.
- Selezionare il tipo di origine di Azure Data Lake Storage Gen2.
- Specificare i dettagli dell'origine dati creata nella sezione 2.
Nota
Le credenziali devono essere Microsoft Purview MSI (sistema) per una connessione data quality
- Selezionare Test connessione
- Dopo aver testato la connessione, selezionare Invia
- Specificare i dettagli dell'origine dati creata nella sezione 2.
Dopo aver stabilito la connessione, è possibile eseguire i profili e iniziare a creare regole di qualità dei dati. Ciò garantisce che gli esperti che conoscono le regole di business e le regole appropriate siano in esecuzione sui prodotti dati più importanti.
- Indietro alla pagina Qualità dei dati.
- Selezionare il dominio di governance dell'integrità personale.
- Selezionare il prodotto dati Covid-19 Vaccination and Case Trending by Age compilato nella sezione 3.
- Selezionare l'asset aggiunto al prodotto dati. (Deve essere in formato differenziale dalla sezione 2 o la qualità dei dati non verrà eseguita).
- Applicare regole di qualità dei dati alle colonne dei dati per misurare se soddisfa le aspettative di qualità:
- Selezionare la scheda Regole nell'asset selezionato.
- Selezionare Nuova regola.
- Selezionare La regola Campi vuoti/vuoti.
- Specificare i dettagli:
- Selezionare la colonna AgeGroupVacc dall'elenco a discesa della colonna
- Nome regola: Verificare che esista una fascia di età per la vaccinazione
- Selezionare Crea.
- Selezionare Nuova regola.
- Selezionare Corrispondenza tipo di dati.
- Specificare i dettagli.
- Selezionare DataColonna gestita.
- Selezionare Crea.
- Selezionare Esegui analisi qualità dati.
Dati del profilo
Creare un profilo per i dati per visualizzare i dati statici di alto livello di ogni colonna e individuare eventuali anomalie che potrebbero avere una nuova regola.
- In Unified Catalog selezionare Gestione integrità e quindi Qualità dei dati.
- Selezionare i dati del profilo
- Selezionare la casella in alto accanto a Nome colonna per profilare tutte le colonne. Microsoft Purview consiglierà quali colonne profilare ed è possibile selezionare le colonne che si sa vale la pena profilare per impedire che i profili su dati altamente sensibili o dati noti vengano popolati in modo sparse.
- Selezionare Esegui profilo
Al termine dell'analisi, sarà possibile esaminare il punteggio e il profilo di qualità dei dati per il nuovo prodotto dati e il punteggio di qualità dei dati sarà disponibile per tutti gli utenti del catalogo assicurandosi che tutti conoscano lo stato dei dati.
Creare una pianificazione per le analisi della qualità dei dati per assicurarsi di monitorare continuamente i problemi di qualità dei dati. Impostare gli avvisi per assicurarsi di risolvere i problemi di qualità dei dati prima che i consumer siano interessati.
- In Gestione dell'integrità selezionare Qualità dei dati.
- Selezionare il dominio Integrità personale in cui sono configurate le regole di qualità dei dati.
- Nell'elenco a discesa Gestisci selezionare Analisi pianificate.
- Nella pagina Scansioni pianificate selezionare Nuovo.
- Aggiungere i dettagli della panoramica
- Nome: Valutazione mensile DQ integrità personale
- Descrizione: analisi mensile delle regole DQ per il miglioramento continuo.
- Selezionare Continua
- Selezionare l'ambito dell'analisi
- Selezionare la casella accanto al prodotto dati Covid-19 Vaccination and Case Trending by Age
- Selezionare Continua
- Pianificare l'analisi per assicurarsi che venga eseguita l'ultimo giorno di ogni mese
- Selezionare Ricorrente
- Ricorrenza: ogni mese
- Giorni mese: Ultimo
- Orario analisi pianificazione (UTC): 12:00:00
- Start recurrence at (UTC): leave as default
- Selezionare Continua
- Esaminare i dettagli dell'analisi per verificare se sono presenti modifiche da apportare prima del salvataggio.
- Seleziona Salva. Poiché in precedenza è stata attivata un'analisi manuale, non è necessario attivare un'altra analisi ora, ma se è necessaria una nuova analisi, selezionare Salva ed esegui.
Configurare gli avvisi
Dopo che la qualità dei dati ha pianificato le analisi, è possibile attivare avvisi per comunicare agli amministratori se sono necessari problemi o attenzione a causa di problemi di qualità dei dati o errori di analisi. Configurare un avviso di qualità dei dati per le analisi non riuscite e quando il punteggio diminuisce di oltre il 5%.
- Indietro al dominio Integrità personale nella pagina Qualità dati.
- Nell'elenco a discesa Gestisci selezionare Avvisi.
- Selezionare Nuovo.
- Immettere i dettagli dell'avviso
- Nome visualizzato: Analisi mensile DQ integrità personale
- Descrizione: per garantire che le soglie minime di DQ soddisfino le aspettative dei consumatori.
- Destinazione: il punteggio diminuisce di più di
- Soglia: 5
- Disattiva notifiche: lasciare deselezionata
- Attivare la notifica per le analisi della qualità non riuscite: lasciare selezionata
- Destinatario: immettere il nome
- Selezionare Continua.
Consiglio
Quando si implementa nel Unified Catalog si desidera inviare gli avvisi agli amministratori che possono notificare il problema ai consumatori e collaborare con il proprietario tecnico dei dati per apportare correzioni.
Alla fine di questa sezione si avrà ora un Unified Catalog funzionante con qualità dei dati operativi per gestire i dati offerti ai consumer di dati dell'organizzazione. Tutto è stato per ottenere i dati più preziosi per il consumer e creare fiducia nei dati che avrebbero usato. Man mano che il valore dei dati aumenta e emergono nuove strategie di dati, la sezione successiva illustra come gestire l'intero catalogo o approfondire la gestione dei dati specifica con i dati master.
Passaggio 5: Gestione dei dati master
La gestione dei dati master è la pratica di conformità alle entità dati più importanti che devono essere accurate, univoche e applicate in modo coerente in tutte le aree dell'azienda perché errori e problemi in questi dati possono influire sull'intera azienda. Tramite uno dei nostri partner MDM, sarà possibile integrare la soluzione Master Gestione dati (MDM) con Microsoft Purview per abilitare l'unificazione, la standardizzazione e la pulizia dei dati che consentiranno la creazione di record aurei e la pubblicazione di dati master come prodotti dati.
Seguire le esercitazioni qui per la soluzione scelta: Gestione dei dati master in Microsoft Purview
Passaggio 6: Gestire l'integrità dei dati
In Microsoft Purview Data Estate Health, l'Ufficio dati centrale e altri responsabili dei dati sono in grado di valutare lo stato dei dati in base agli standard aziendali e gestire in modo efficace i progressi verso la strategia. Per assicurarsi che tutti i membri dell'azienda sappiano cosa si può fare per aumentare il valore dei dati, è essenziale che gli standard siano compresi e scalabili per l'intera organizzazione senza dover fare di tutti un esperto di governance dei dati. A partire da un set standard di controlli del settore disponibili in Microsoft Purview in ogni data office e personalizzare i controlli per soddisfare le aspettative e assicurarsi che siano allineati agli obiettivi dei dati. Fondamentale per l'efficacia di questi controlli non è solo la misurazione di questi standard, ma anche la garanzia che i responsabili dei dati siano in grado di intervenire autonomamente e di essere ritenuti responsabili di apportare i miglioramenti che influiscono sul valore dei dati. In Data Estate Health è possibile impostare e gestire tutte queste funzionalità critiche.
Prerequisiti
- Prodotti dati, termini del glossario e altri concetti aziendali pubblicati in Microsoft Purview Unified Catalog. È possibile seguire le sezioni precedenti per creare le sezioni seguenti:
- Almeno 24 ore dopo la cura dei prodotti dati.
- È necessario disporre del ruolo Proprietario integrità dati in Unified Catalog.
Valutare la governance dei dati con l'integrità del data estate
Aprire il portale di Microsoft Purview.
Selezionare Unified Catalog.
In Data Estate Health nel riquadro di spostamento a sinistra selezionare Controlli integrità.
Selezionare la carota > accanto al gruppo di controllo Creazione valore .
Durante il passaggio del mouse su un titolo del controllo, selezionare l'icona a matita per modificare il controllo. Modificando il controllo, si modifica la soglia del controllo per impostare le aspettative sul punteggio e si imposta l'assegnazione dei colori per illustrare le fasi di avanzamento.
I dettagli consentono di fornire una descrizione del controllo e del relativo significato per l'organizzazione e di impostare un proprietario per un controllo specifico.
Selezionare la scheda Regole del controllo per modificare la soglia. Ciò dimostra che ha una destinazione elevata e se non è integro è fondamentale eseguire il follow-up.
- Eredita dal gruppo: attiva/disattiva (dovrebbe diventare grigio).
- Punteggio di destinazione: 90
- Selezionare Nuova regola.
- Impostare la casella accanto al punteggio su GreaterThanOrEqual
- Impostare la percentuale su 90
- Stato = Integrità (verde)
- Else Box Status = Critical (Purple)
- Seleziona Salva.
In Integrità dell'area dati selezionare Qualità metadati.
Qui è possibile modificare o aggiungere regole che creano i punteggi del controllo. In questo caso si vuole modificare la gravità delle azioni per la creazione di valore per garantire che tutti gli utenti conoscano l'importanza di questa azione.
- Selezionare Configura gravità
- Selezionare il gruppo di controllo Creazione valore
- Selezionare il titolo del controllo di allineamento OKR business
- Modificare la gravità da Media a Alta e selezionare Salva
- Selezionare la scheda Azioni di integrità
- Filtro assegnato a: al proprio nome
- Selezionare un'azione in cui è possibile vedere cosa deve fare il proprietario dell'azione per garantire che le aspettative di governance siano soddisfatte o che possa assegnare un nuovo proprietario per ottenere il miglior esperto per fornire il proprio input. C'è anche uno stato che consente ad altri utenti di conoscere il lavoro in corso e dove altre azioni potrebbero richiedere la definizione delle priorità.
Passaggio 7: Democratizzazione dei dati
Consentire agli utenti di trovare e accedere ai dati necessari in un modo di reclamo è l'essenza della democratizzazione dei dati e garantisce che le persone possano trovare i dati necessari per creare valore aziendale. Offrire un'esperienza pulita e semplice per individuare i dati è lo scopo di Microsoft Purview Unified Catalog, consentendo al tempo stesso agli amministratori di aggiornare e gestire i dati resi disponibili nel catalogo su larga scala. In questa sezione viene illustrato come gli utenti possono trovare e richiedere l'accesso ai dati e assicurarsi che i responsabili approvazione appropriati siano in grado di tenere traccia e fornire input su tali richieste di accesso.
Prerequisiti
- Passaggi da 1 a 4 completati almeno:
- Unified Catalog autorizzazioni di lettura in un dominio di governance
Individuare i prodotti dati
- In Unified Catalog selezionare Individuazione e quindi Prodotti dati.
- Nella pagina Prodotti dati usare la barra di ricerca per cercare i tassi di vaccinazione in base all'età.
- Qui vengono visualizzati i prodotti dati pubblicati nella sezione 2. Questo mostra come gli utenti verranno esposti solo ai dati destinati a individuare e impedisce agli utenti di dover navigare in un data estate altamente tecnico.
- Selezionare il prodotto dati Covid-19 Vaccination and Case Trending by Age
- In questo caso, i consumer possono visualizzare i metadati forniti e qualsiasi altra proprietà configurata durante l'installazione. Il punteggio di qualità dei dati è anche qui in modo che i consumatori conoscano la qualità prima ancora di ottenere l'accesso ai dati.
- Selezionare l'asset e il consumer può visualizzare tutte le colonne in sono disponibili nell'asset di dati.
- Selezionare il termine glossario dell'epidemia e il consumer può visualizzare la descrizione e altre informazioni sul termine per ottenere una comprensione più approfondita dei dati.
- Una volta che il consumer è sicuro di voler usare tali dati, deve ottenere l'accesso approvato ai dati.
- Selezionare Richiedi accesso
- Compilare i dettagli del modulo per inviare una richiesta.
- Utente: lasciare il nome
- Approvazione manager: richiesta e indirizzata automaticamente al responsabile Microsoft Entra ID.
- Scopo: selezionare uno scopo
- Giustificazione aziendale: monitoraggio OKR
- Selezionare la casella accanto all'attestazione per dire di comprendere le aspettative di utilizzo di questi dati.
- Selezionare Invia.
La richiesta di accesso verrà ora inviata all'elenco gestito in Microsoft Entra ID. Da qui, il manager può accedere alle richieste aprendo il messaggio di posta elettronica e selezionando un collegamento o accedendo a Microsoft Purview. L'approvazione e la gestione dell'accesso possono essere eseguite direttamente in Microsoft Purview.
- In Unified Catalog selezionare Gestione catalogo e quindi Richieste.
- Selezionare il dominio Integrità personale .
- Selezionare la richiesta inviata.
- Ora i responsabili approvazione possono approvare o rifiutare selezionando Rispondi alla richiesta.