Governance dei dati in Microsoft Fabric
Microsoft Fabric include alcune funzionalità di governance di base che potrebbero essere sufficienti per le esigenze di alcune organizzazioni.
Nel proprio provider di assistenza sanitaria, si hanno esigenze di governance dei dati precise, poiché la legislazione in alcuni territori è molto rigorosa, ma non si vuole incorrere in spese inutili. Si vogliono valutare le funzionalità di governance dei dati in Microsoft Fabric per scoprire se soddisfino i requisiti.
In questa unità verranno esaminate le funzionalità di governance di Fabric.
Che cos'è Microsoft Fabric?
Fabric è la piattaforma di dati e analisi end-to-end di Microsoft. La piattaforma SaaS (Software-as-a-Service) può archiviare, spostare, elaborare, inserire, trasformare e analizzare dati indipendentemente dalle dimensioni e dal formato corrente. Poiché Fabric integra facilmente i dati, non è più necessario interfacciare soluzioni di fornitori diversi usando vari protocolli. Dopo aver ottenuto dati nella posizione e nel formato necessari, le funzionalità avanzate di business intelligence possono analizzarli e generare informazioni dettagliate per supportare il processo decisionale. Tutte le funzionalità e gli strumenti di Fabric sono supportati con l'integrazione di intelligenza artificiale, che aumenta la produttività.
Nota
Microsoft Fabric include funzionalità una volta disponibili separatamente in Power BI, Azure Synapse Analytics e Azure Data Factory insieme a nuove funzionalità.
Esperienze di Fabric
Fabric include esperienze diverse per soddisfare tutte le esigenze di manipolazione e analisi dei dati:
- Data Factory: Usare questa esperienza per inserire, preparare e trasformare dati da varie origini tramite connettori dati diversi.
- Ingegneria dei dati Synapse: Questa esperienza è una piattaforma Spark che può essere usata per raccogliere, archiviare, elaborare e analizzare grandi volumi di dati tramite processi e notebook pianificati.
- Data Warehouse Synapse: Usare questa esperienza per separare le risorse di calcolo dall'archiviazione e ridimensionare ciascuna di esse in modo indipendente. I dati vengono archiviati in formato Data Lake e illustrano le prestazioni SQL leader del settore.
- Data Science Synapse: Usare questa esperienza per il training, la distribuzione e l'uso di modelli di Machine Learning.
- Intelligence in tempo reale: Questa esperienza è una soluzione completa per i dati basati su eventi, ad esempio i dati di telemetria dei dispositivi, i log dei dati e i dati di streaming.
- Power BI: Usare questa esperienza per visualizzare, analizzare e individuare tendenze nascoste nei dati. È possibile condividere report di Power BI per supportare un miglior processo decisionale.
- Data Activator: Usare questa esperienza per specificare azioni, ad esempio messaggi di posta elettronica e flussi di lavoro, che vengono avviate quando sono soddisfatte condizioni specifiche nei dati. È possibile creare queste azioni senza bisogno di scrivere codice.
OneLake
In Fabric, tutte le informazioni vengono archiviate in un data lake che può contenere dati strutturati e non strutturati. L'implementazione di Microsoft del data lake è denominata OneLake ed è basata su Azure Data Lake Storage (ADLS) di seconda generazione. Questo singolo meccanismo di archiviazione sottostante consente di eliminare silo e ridurre i costi garantendo al tempo stesso che i criteri e la sicurezza vengano applicati universalmente.
Che cos'è la governance dei dati?
I dati posseduti e processati dell'organizzazione sono spesso di importanza critica e altamente sensibili. È fondamentale per la maggior parte delle aziende che i dati vengano conservati in modo sicuro, siano facilmente disponibili e siano elaborati in conformità alla legislazione in tutti i territori in cui si opera.
La governance dei dati è un termine che descrive i criteri e le procedure usate per garantire la qualità, la coerenza, la sicurezza e l'usabilità dei dati. La disciplina comprende una serie di attività e responsabilità che gestiscono i dati in modo efficace nel corso del ciclo di vita.
Un programma di governance dei dati include in genere:
- Controllo: Registrare la provenienza dei dati e chi li modifica
- Valutazione: Valutazione dell'utilità e dell'accuratezza dei dati
- Documentazione: Descrivere la natura dei dati agli utenti che potrebbero farne uso
- Gestione: Rimuovere dati non accurati, rispondere a richieste di accesso, garantire la conformità con la legislazione dei dati
- Protezione: Proteggere i dati da accessi non autorizzati, ransomware e altri attacchi
I dati con governance appropriata sono affidabili e facilmente disponibili per gli utenti autorizzati.
Suggerimento
Le organizzazioni di grandi dimensioni dispongono spesso di dati divisi in silo. Sistemi e database storici, che appartengono a unità separate all'interno dell'azienda, impongono barriere impediscono l'accesso per scopi di sicurezza. In questi casi, l'integrazione di dati e la rimozione di silo di dati in modo tale che la sicurezza venga mantenuta è un componente essenziale della governance dei dati.
Un solido regime di governance dei dati può significare vantaggi per l'azienda, ad esempio:
- Un'unica origine di riferimento per evitare confusioni e supportare un processo decisionale ottimale.
- Dati di qualità superiore che riflettono quanto misurato in maniera più precisa.
- Conformità più rapida alle richieste di accesso.
- Riduzione dei costi per l'archiviazione e la gestione dei dati.
Funzionalità di governance dei dati in Microsoft Fabric
È possibile eseguire molte attività di governance dei dati in Fabric, con disponibilità immediata e senza bisogno di una sottoscrizione aggiuntiva a Microsoft Purview. Verranno ora esaminate alcune delle funzionalità disponibili:
Gestione del patrimonio di dati
Il patrimonio di dati dell'organizzazione è l'intera raccolta di asset di dati. Gli oggetti di grandi dimensioni richiedono tempo amministrativo per la conservazione e la gestione. Fabric può essere d'aiuto in questa attività tramite questi strumenti:
- Portale di amministrazione dell'infrastruttura: controllare le impostazioni del tenant, le capacità, i domini e altri oggetti, in genere riservati agli amministratori.
- Tenant, domini e aree di lavoro: contenitori logici che possono essere usati per controllare l'accesso a dati e funzionalità. Gli amministratori dell'infrastruttura, ad esempio, devono avere accesso a tutte le impostazioni nel tenant, mentre i titolari dei dati a livello di team potrebbero avere il controllo delle impostazioni solo nel proprio dominio o area di lavoro.
- I domini raggruppano i dati pertinenti a un'unica area aziendale o a un singolo campo oggetto.
- Le aree di lavoro raggruppano gli elementi Fabric usati da un singolo team o reparto.
- Capacità: Questi oggetti limitano l'utilizzo di risorse di calcolo per tutti i carichi di lavoro di Fabric.
- Analisi dei metadati: L'analisi estrae valori come nomi, identità, sensibilità, approvazioni etc. dai data lake. È possibile usare questi metadati per analizzare e impostare criteri di governance.
Sicurezza e protezione dei dati
I dati sicuri sono protetti da accessi non autorizzati e attacchi nocivi. Sono anche conformi alle normative di archiviazione dei dati applicabili nell'area. Fabric include gli strumenti utili seguenti:
- Tag dati: Usare i tag per identificare la riservatezza dei dati e applicare i criteri di conservazione e protezione dei dati.
- Ruoli dell'area di lavoro: Usare i ruoli per definire gli utenti autorizzati ad accedere ai dati in un'area di lavoro.
- Controlli a livello di dati: Usare i controlli a livello di elementi di Fabric, ad esempio tabelle, righe e colonne, per imporre restrizioni granulari.
- Certificazioni: Fabric è conforme a svariate certificazioni di gestione dei dati, tra cui HIPAA BAA, ISO/IEC 27017, ISO/IEC 27018, ISO/IEC 27001 e ISO/IEC 27701.
Incoraggiare l'individuazione e l'uso dei dati
I dati sono utili solo se gli utenti sono in grado di individuarli e analizzarli. Queste funzionalità di Fabric possono incoraggiare l'uso dei dati:
- Hub dati OneLake: Questo strumento semplifica l'individuazione e l'esplorazione dei dati nell'ambiente.
- Approvazione: Gli utenti approvano un elemento Fabric per identificarlo come di qualità elevata. Le approvazioni consentono ad altri utenti di considerare attendibili i dati contenuti nell'elemento.
- Derivazione dei dati: Questa funzionalità consente agli utenti di comprendere il flusso di dati tra elementi in un'area di lavoro e l'impatto di una potenziale modifica.
Monitoraggio dell'utilizzo dei dati
Fabric consente agli utenti di monitorare il modo in cui vengono usate le informazioni:
- Hub di monitoraggio: Questo hub mostra cosa è successo a elementi di Fabric. Vengono visualizzate solo le attività per gli elementi di Fabric per cui si dispone di autorizzazione per la visualizzazione.
- Metriche di capacità: Usare l'app Metriche di capacità per monitorare l'utilizzo e il consumo.
Altre informazioni
- Che cos'è Microsoft Fabric?
- Che cos'è la governance dei dati?
- Documentazione sulla governance di Microsoft Fabric