Condividi tramite


Processi di governance dei dati

Esistono quattro categorie di processi di governance dei dati.

Categoria dei processi Processi
Processi di individuazione dei dati, per comprendere il panorama dei dati Processo di individuazione, mapping e catalogazione di entità di dati e dati
Processo di individuazione della profilatura dei dati per determinare la qualità dei dati
Processo di classificazione della governance e di individuazione dei dati sensibili
Processo di individuazione della manutenzione dei dati per l'analisi CRUD, ad esempio dai file di log, per comprendere l'utilizzo e la manutenzione dei dati, ad esempio i dati master nell'organizzazione
Processi di definizione della governance dei dati Creare e gestire un vocabolario aziendale comune in un glossario aziendale per definire le entità di dati, tra cui dati master, nomi degli attributi dei dati, regole di integrità dei dati e formati validi
Definire i dati di riferimento per standardizzare i set di codice nell'organizzazione
Definire schemi di classificazione della governance dei dati per etichettare i dati e determinare come gestirli
Definire criteri e regole di governance dei dati per gestire i cicli di vita delle entità di dati e dei documenti
Definire le metriche e la soglia di riuscita
Processi di applicazione delle regole e dei criteri di governance dei dati Processo per automatizzare l'applicazione e il controllo delle regole e dei criteri di governance dei dati
Processo per applicare e controllare manualmente criteri e regole
Processi di governance dei dati su richiesta, basati su eventi e basati da timer (batch) pubblicati come servizi che possono essere richiamati per gestire:
Inserimento dati: catalogazione, classificazione, assegnazione del proprietario e archiviazione
Qualità dei dati
Sicurezza per l'accesso ai dati
Privacy dei dati
Utilizzo dei dati, ad esempio per la condivisione e per garantire che i dati concessi in licenza siano usati solo per scopi approvati
Manutenzione dei dati, ad esempio i dati master
Conservazione dei dati
Sincronizzazione dei dati master e dei dati di riferimento
Processi di monitoraggio Monitorare e controllare l'attività di utilizzo dei dati, la qualità dei dati, la sicurezza dell'accesso ai dati, la privacy dei dati, la manutenzione dei dati e la conservazione dei dati
Monitorare il rilevamento e la risoluzione delle violazioni delle regole dei criteri

Il vocabolario aziendale comune deve essere definito in un glossario aziendale all'interno di un catalogo dati.

I gruppi di lavoro di governance dei dati pianificano e sviluppano la definizione dei dati e il miglioramento di domini dati specifici (ad esempio, cliente o fornitore); aggiornare il consiglio di controllo della governance dei dati sullo stato di avanzamento; e gestire l'amministrazione nell'intera azienda per un dominio specifico. Ogni gruppo di lavoro deve assumersi la responsabilità di definire un'entità dati o un'area di interesse dei dati specifica, ad esempio più entità correlate. La combinazione di più entità di dati nel vocabolario e di criteri e regole può quindi essere gestita in parallelo. Per informazioni, vedere Ruoli e responsabilità per la governance dei dati

Diagramma della definizione di entità in un vocabolario aziendale comune. Figura 1: Gruppo di lavoro di governance dei dati di esempio

L'integrazione del glossario aziendale del catalogo con altre tecnologie è quindi necessaria per ottenere nomi di dati comuni coerenti in tutte le tecnologie. Esempi di altre tecnologie con cui eseguire l'integrazione includono:

  • Strumenti di estrazione, trasformazione e caricamento (ETL)
  • Strumenti di modellazione dei dati
  • Strumenti di business intelligence, sistemi di gestione di database
  • Gestione dei dati master
  • Strumenti di virtualizzazione dei dati
  • Strumenti di sviluppo software

Per creare un vocabolario aziendale comune, è consigliabile creare un modello di concetto di dati. Il modello si basa su un approccio top-down che identifica i concetti di dati utilizzabili come entità di dati in un vocabolario aziendale comune. È quindi possibile assegnare un gruppo di lavoro di governance dei dati diverso a ogni concetto di dati (entità) o gruppo di concetti di dati correlati (area di interesse). Vengono assegnati gruppi di lavoro diversi per gestire entità di dati diverse in tutto il panorama.

Quando si compila un vocabolario aziendale comune, è possibile usare il software del catalogo dati per individuare automaticamente i dati esistenti in più archivi dati. Consente di identificare tutti gli attributi associati a entità di dati specifiche. Si tratta di un approccio bottom-up. Usando inizialmente un approccio top-down di un modello di concetto di dati e quindi un approccio di individuazione dei dati automatizzato bottom-up per identificare gli attributi di un'entità di dati, è possibile che più gruppi di lavoro creino rapidamente un vocabolario aziendale comune.

L'uso di un catalogo dati per l'individuazione automatizzata dei dati consente di associare dati diversi a un vocabolario comune. Il catalogo dati consente di comprendere dove si trovano nell'azienda i dati per ogni particolare entità di dati nel glossario aziendale.

Criteri e regole per gestire i dati in punti diversi del ciclo di vita

I criteri di governance dei dati descrivono un set di regole per controllare l'integrità, la qualità, la sicurezza degli accessi, la privacy e la conservazione dei dati. Esistono diversi tipi di criteri che includono:

  • Criteri di integrità dei dati, ad esempio valori validi, integrità referenziale.
  • Criteri di qualità dei dati con regole di standardizzazione, pulizia e corrispondenza dei dati.
  • Criteri di protezione dei dati con regole di sicurezza dell'accesso e privacy dei dati.
  • Criteri di conservazione dei dati per gestire il ciclo di vita con regole di conservazione, archiviazione e backup. Potrebbero essere necessarie più versioni di un criterio per gestire gli stessi dati in giurisdizioni legali diverse.

Lo schema di classificazione della riservatezza dei dati prevede cinque livelli di classificazione:

  • Pubblici
  • Solo per uso interno.
  • Riservato
  • Dati personali sensibili
  • Con restrizioni

Gestire i dati combinando questo schema di classificazione con criteri e regole. Usare ognuno dei cinque livelli per etichettare i dati, ad esempio i dati personali sensibili. Creando regole per i dati personali sensibili e collegando tali regole a un criterio, si creano criteri per i dati personali sensibili. È possibile collegare i criteri all'etichetta dei dati personali sensibili e quindi collegare l'etichetta dei dati personali sensibili ai dati. In questo modo, tutti i dati etichettati come dati personali sensibili sono soggetti agli stessi criteri e alle stesse regole. Questo processo è noto come gestione dei criteri basata su tag. È flessibile perché singole regola o singoli criteri possono essere modificati in modo indipendente. Tutti i dati con etichetta dati personali sensibili sono gestiti dalle nuove regole. Analogamente, un'etichetta dati personali sensibili può essere scollegata dai dati ed è possibile usare un'etichetta riservata. In questo caso i dati diventano immediatamente gestiti da un nuovo set di criteri e regole associati all'etichetta riservata.

Dopo aver definito i criteri e le regole in un catalogo dati per ogni classe in uno schema di classificazione della governance dei dati, è possibile passarli ad altre tecnologie da un catalogo dati, tramite API, per consentirne l'applicazione. Una piattaforma di gestione dei dati comune in grado di connettersi a più archivi dati potrebbe invece consentirne un'applicazione diretta.

Dovrebbe quindi essere possibile monitorare la qualità dei dati, la privacy, la sicurezza dell'accesso, l'utilizzo, la manutenzione e la conservazione di entità di dati specifiche per l'intero ciclo di vita.

Passaggi successivi