Processi di governance dei dati
Esistono quattro categorie di processi di governance dei dati.
Categoria dei processi | Processi |
---|---|
Processi di individuazione dei dati, per comprendere il panorama dei dati | Processo di individuazione, mapping e catalogazione di entità di dati e dati Processo di individuazione della profilatura dei dati per determinare la qualità dei dati Processo di classificazione della governance e di individuazione dei dati sensibili Processo di individuazione della manutenzione dei dati per l'analisi CRUD, ad esempio dai file di log, per comprendere l'utilizzo e la manutenzione dei dati, ad esempio i dati master nell'organizzazione |
Processi di definizione della governance dei dati | Creare e gestire un vocabolario aziendale comune in un glossario aziendale per definire le entità di dati, tra cui dati master, nomi degli attributi dei dati, regole di integrità dei dati e formati validi Definire i dati di riferimento per standardizzare i set di codice nell'organizzazione Definire schemi di classificazione della governance dei dati per etichettare i dati e determinare come gestirli Definire criteri e regole di governance dei dati per gestire i cicli di vita delle entità di dati e dei documenti Definire le metriche e la soglia di riuscita |
Processi di applicazione delle regole e dei criteri di governance dei dati | Processo per automatizzare l'applicazione e il controllo delle regole e dei criteri di governance dei dati Processo per applicare e controllare manualmente criteri e regole Processi di governance dei dati su richiesta, basati su eventi e basati da timer (batch) pubblicati come servizi che possono essere richiamati per gestire: Inserimento dati: catalogazione, classificazione, assegnazione del proprietario e archiviazione Qualità dei dati Sicurezza per l'accesso ai dati Privacy dei dati Utilizzo dei dati, ad esempio per la condivisione e per garantire che i dati concessi in licenza siano usati solo per scopi approvati Manutenzione dei dati, ad esempio i dati master Conservazione dei dati Sincronizzazione dei dati master e dei dati di riferimento |
Processi di monitoraggio | Monitorare e controllare l'attività di utilizzo dei dati, la qualità dei dati, la sicurezza dell'accesso ai dati, la privacy dei dati, la manutenzione dei dati e la conservazione dei dati Monitorare il rilevamento e la risoluzione delle violazioni delle regole dei criteri |
Il vocabolario aziendale comune deve essere definito in un glossario aziendale all'interno di un catalogo dati.
I gruppi di lavoro di governance dei dati pianificano e sviluppano la definizione dei dati e il miglioramento di domini dati specifici (ad esempio, cliente o fornitore); aggiornare il consiglio di controllo della governance dei dati sullo stato di avanzamento; e gestire l'amministrazione nell'intera azienda per un dominio specifico. Ogni gruppo di lavoro deve assumersi la responsabilità di definire un'entità dati o un'area di interesse dei dati specifica, ad esempio più entità correlate. La combinazione di più entità di dati nel vocabolario e di criteri e regole può quindi essere gestita in parallelo. Per informazioni, vedere Ruoli e responsabilità per la governance dei dati
Figura 1: Gruppo di lavoro di governance dei dati di esempio
L'integrazione del glossario aziendale del catalogo con altre tecnologie è quindi necessaria per ottenere nomi di dati comuni coerenti in tutte le tecnologie. Esempi di altre tecnologie con cui eseguire l'integrazione includono:
- Strumenti di estrazione, trasformazione e caricamento (ETL)
- Strumenti di modellazione dei dati
- Strumenti di business intelligence, sistemi di gestione di database
- Gestione dei dati master
- Strumenti di virtualizzazione dei dati
- Strumenti di sviluppo software
Per creare un vocabolario aziendale comune, è consigliabile creare un modello di concetto di dati. Il modello si basa su un approccio top-down che identifica i concetti di dati utilizzabili come entità di dati in un vocabolario aziendale comune. È quindi possibile assegnare un gruppo di lavoro di governance dei dati diverso a ogni concetto di dati (entità) o gruppo di concetti di dati correlati (area di interesse). Vengono assegnati gruppi di lavoro diversi per gestire entità di dati diverse in tutto il panorama.
Quando si compila un vocabolario aziendale comune, è possibile usare il software del catalogo dati per individuare automaticamente i dati esistenti in più archivi dati. Consente di identificare tutti gli attributi associati a entità di dati specifiche. Si tratta di un approccio bottom-up. Usando inizialmente un approccio top-down di un modello di concetto di dati e quindi un approccio di individuazione dei dati automatizzato bottom-up per identificare gli attributi di un'entità di dati, è possibile che più gruppi di lavoro creino rapidamente un vocabolario aziendale comune.
L'uso di un catalogo dati per l'individuazione automatizzata dei dati consente di associare dati diversi a un vocabolario comune. Il catalogo dati consente di comprendere dove si trovano nell'azienda i dati per ogni particolare entità di dati nel glossario aziendale.
Criteri e regole per gestire i dati in punti diversi del ciclo di vita
I criteri di governance dei dati descrivono un set di regole per controllare l'integrità, la qualità, la sicurezza degli accessi, la privacy e la conservazione dei dati. Esistono diversi tipi di criteri che includono:
- Criteri di integrità dei dati, ad esempio valori validi, integrità referenziale.
- Criteri di qualità dei dati con regole di standardizzazione, pulizia e corrispondenza dei dati.
- Criteri di protezione dei dati con regole di sicurezza dell'accesso e privacy dei dati.
- Criteri di conservazione dei dati per gestire il ciclo di vita con regole di conservazione, archiviazione e backup. Potrebbero essere necessarie più versioni di un criterio per gestire gli stessi dati in giurisdizioni legali diverse.
Lo schema di classificazione della riservatezza dei dati prevede cinque livelli di classificazione:
- Pubblici
- Solo per uso interno.
- Riservato
- Dati personali sensibili
- Con restrizioni
Gestire i dati combinando questo schema di classificazione con criteri e regole. Usare ognuno dei cinque livelli per etichettare i dati, ad esempio i dati personali sensibili. Creando regole per i dati personali sensibili e collegando tali regole a un criterio, si creano criteri per i dati personali sensibili. È possibile collegare i criteri all'etichetta dei dati personali sensibili e quindi collegare l'etichetta dei dati personali sensibili ai dati. In questo modo, tutti i dati etichettati come dati personali sensibili sono soggetti agli stessi criteri e alle stesse regole. Questo processo è noto come gestione dei criteri basata su tag. È flessibile perché singole regola o singoli criteri possono essere modificati in modo indipendente. Tutti i dati con etichetta dati personali sensibili sono gestiti dalle nuove regole. Analogamente, un'etichetta dati personali sensibili può essere scollegata dai dati ed è possibile usare un'etichetta riservata. In questo caso i dati diventano immediatamente gestiti da un nuovo set di criteri e regole associati all'etichetta riservata.
Dopo aver definito i criteri e le regole in un catalogo dati per ogni classe in uno schema di classificazione della governance dei dati, è possibile passarli ad altre tecnologie da un catalogo dati, tramite API, per consentirne l'applicazione. Una piattaforma di gestione dei dati comune in grado di connettersi a più archivi dati potrebbe invece consentirne un'applicazione diretta.
Dovrebbe quindi essere possibile monitorare la qualità dei dati, la privacy, la sicurezza dell'accesso, l'utilizzo, la manutenzione e la conservazione di entità di dati specifiche per l'intero ciclo di vita.