Condividi tramite


Catalogo dati

Il catalogo dati registra e gestisce le informazioni sui dati in una posizione centralizzata e le rende disponibili all'organizzazione. Protegge le aziende dalla duplicazione dei prodotti di dati causata dall'inserimento di dati ridondanti da parte di team di progetto diversi. È consigliabile creare un servizio catalogo dati per definire i metadati dei prodotti dati archiviati nelle zone di destinazione dei dati.

L'analisi su scala cloud si basa su Microsoft Purview per registrare le origini dati aziendali, classificarle, garantire la qualità dei dati e offrire un accesso self-service sicuro.

Microsoft Purview è un servizio basato su tenant e può comunicare con ogni zona di destinazione dei dati creando una rete virtuale gestita distribuita nell'area delle zone di destinazione dei dati. È possibile distribuire i runtime di integrazione della rete virtuale gestita di Azure all'interno delle reti virtuali gestite di Microsoft Purview in qualsiasi area di Microsoft Purview disponibile. Da qui, il runtime di integrazione della rete virtuale gestita può usare endpoint privati per connettersi alle origini dati supportate e analizzarle in modo sicuro. Per altre informazioni, vedere Usare una rete virtuale gestita con l'account Microsoft Purview. La creazione di un runtime di integrazione della rete virtuale gestita all'interno della rete virtuale gestita garantisce un processo di integrazione dei dati isolato e sicuro.

Quando si usa Azure Databricks, è consigliabile usare Azure Databricks Unity Catalog oltre a Microsoft Purview. Azure Databricks Unity Catalog offre funzionalità centralizzate di controllo degli accessi, audit, tracciabilità e individuazione dei dati nelle aree di lavoro di Databricks. Per le procedure consigliate per la configurazione di Unity Catalog, vedere procedure consigliate per Unity Catalog.

Nota

Anche se questa documentazione riguarda principalmente l'uso di Microsoft Purview per la governance, le aziende potrebbero aver investito in altri prodotti, ad esempio Alation, Okera o Collibra. Queste soluzioni sono basate su sottoscrizioni ed è consigliabile distribuirle nella zona di destinazione di gestione dei dati. Occorre essere consapevoli che potrebbe essere necessaria un'integrazione personalizzata.

Individuazione dei dati

L'individuazione dei dati riflette lo stato di tutti i dati di proprietà dell'azienda. Questi dati sono noti come patrimonio dati. Durante l'individuazione dei dati, il patrimonio dati viene analizzato e classificato. Il processo di analisi dei dati si connette direttamente all'origine dati in base a una pianificazione impostata.

Quando si aggiunge una nuova zona di destinazione dei dati all'ambiente, i data lake associati e le origini della persistenza poliglotta devono essere registrati come origini che verranno analizzate dai crawler del catalogo dati.

Con l'individuazione automatica del patrimonio dati per popolare il catalogo, è possibile:

  • Effettuare una ricerca per indicizzazione nei metadati da origini dati di Azure e locali
  • Analizzare i data lake, i BLOB e altre destinazioni supportate
  • Estrarre lo schema dalle destinazioni di dati per i tipi di file XML, TSV, CSV, PSV, SSV, JSON, Parquet, Avro e ORC
  • Consentire aggiornamenti automatici del catalogo tramite la pianificazione configurabile di analisi e set di regole di analisi

Importante

Quando si aggiunge una nuova zona di atterraggio dei dati all'ambiente, registrare i data lake associati e l'archiviazione poliglotta tramite Azure DevOps come origine per i crawler del catalogo dati per analizzare, governare e gestire l'integrità dei dati.

Classificazione dei dati

Microsoft Purview consente di applicare classificazioni dei dati di sistema o personalizzate agli asset di file, tabelle o colonne.

Le classificazioni dei dati sono simili a tag oggetto. Microsoft Purview contrassegna e identifica il contenuto di tipi di dati specifici trovati all'interno del patrimonio dati durante l'analisi. Usare le etichette di riservatezza per identificare le categorie dei tipi di classificazione all'interno dei dati dell'organizzazione. È anche possibile usare le etichette di riservatezza per raggruppare i criteri da applicare a ogni categoria. Microsoft Purview usa gli stessi tipi di informazioni sensibili di Microsoft 365, consentendo di estendere i criteri di sicurezza e le protezioni esistenti nell'intero contenuto e nel patrimonio di dati.

Microsoft Purview consente di analizzare e classificare automaticamente i documenti. Ad esempio, se si dispone di un file denominato multiple.docx che contiene un numero ID nazionale, Microsoft Purview aggiungerà una classificazione come EU National Identification Number nella pagina dei dettagli dell'asset.

Microsoft Defender per SQL è una funzionalità disponibile per database SQL di Azure, Istanza gestita di SQL di Azure e Azure Synapse Analytics. Include funzionalità per l'individuazione e la classificazione di dati sensibili, il rilevamento e l'attenuazione di potenziali vulnerabilità dei database e il rilevamento di attività anomale che possono costituire una minaccia per il database. Microsoft Defender per SQL offre un'unica posizione per abilitare e gestire queste funzionalità.

Passaggi successivi