Prezzi per il Microsoft Purview Data Map
Questa guida illustra le linee guida sui prezzi per la mappa dati nel portale di governance di Microsoft Purview.
Per informazioni dettagliate sulle linee guida sui prezzi per Microsoft Purview (in precedenza Azure Purview), vedere la panoramica delle linee guida sui prezzi.
Per informazioni dettagliate sui prezzi specifici, vedere la pagina dei prezzi di Microsoft Purview (in precedenza Azure Purview). Questo articolo illustra le funzionalità e i fattori che influiranno sui prezzi per il Microsoft Purview Data Map.
I costi diretti che influiscono sui prezzi per i Microsoft Purview Data Map si basano sulle tre dimensioni seguenti:
Data map elastico
La mappa dati è alla base dell'architettura del portale di governance di Microsoft Purview e quindi deve essere aggiornata con le informazioni sugli asset nel data estate in un determinato punto
La mappa dati viene addebitata in termini di unità di capacità (CU). Il provisioning della mappa dati viene eseguito in un'unica unità di archiviazione se il catalogo archivia fino a 10 GB di spazio di archiviazione dei metadati e serve fino a 25 operazioni di mapping dei dati/sec
Il provisioning della mappa dati viene sempre effettuato in una cu quando viene creato per la prima volta un account
Tuttavia, la mappa dati viene ridimensionata automaticamente tra i limiti minimi e massimi di tale finestra di elasticità, in modo da soddisfare le modifiche nella mappa dati rispetto a due fattori chiave: velocità effettiva dell'operazione e archiviazione dei metadati
Velocità effettiva dell'operazione
- Un fattore basato su eventi basato sulle operazioni Create, Read, Update, Delete eseguite sulla mappa dati
- Alcuni esempi delle operazioni di mapping dei dati sono:
- Creazione di un asset nella mappa dati
- Aggiunta di una relazione a un asset, ad esempio proprietario, amministratore, padre, derivazione
- Modifica di un asset per aggiungere metadati aziendali, ad esempio descrizione, termine glossario
- Ricerca di parole chiave che restituisce risultati nella pagina dei risultati della ricerca
- Importazione o esportazione di informazioni tramite l'API
- Se nella mappa dati vengono eseguite più query, aumenta anche il numero di operazioni di I/O con conseguente aumento della scalabilità verticale della mappa dati
- Il numero di utenti simultanei costituisce anche un fattore che regola l'unità di capacità della mappa dati
- Altri fattori da considerare sono il tipo di query di ricerca, l'interazione api, i flussi di lavoro, le approvazioni e così via
- Livello di burst dei dati
- Quando è necessaria una maggiore velocità effettiva delle operazioni/secondo, la mappa dati può eseguire la scalabilità automatica all'interno della finestra di elasticità per soddisfare il carico modificato
- Ciò costituisce la caratteristica di burst che deve essere stimata e pianificata per
- La caratteristica di burst comprende il livello di burst e la durata del burst per cui esiste il burst
- Il livello di burst è un indice moltiplicativo dell'elasticità coerente prevista in stato stazionario
- La durata del burst è la percentuale del mese in cui tali burst (in elasticità) sono previsti a causa dell'aumento dei metadati o di un numero maggiore di operazioni sulla mappa dati
Archiviazione dei metadati
- Se il numero di asset si riduce nel patrimonio dati e quindi viene rimosso nella mappa dati tramite analisi incrementali successive, il componente di archiviazione si riduce automaticamente e quindi la mappa dati si riduce
Analisi, classificazione e inserimento automatizzati
Esistono due principali processi automatizzati che possono attivare l'inserimento di metadati nel Microsoft Purview Data Map:
Analisi automatiche tramite connettori nativi. Questo processo include tre passaggi principali:
- Analisi dei metadati
- Classificazione automatica
- Inserimento di metadati nel Microsoft Purview Data Map
Inserimento automatizzato tramite pipeline di Azure Data Factory e/o Azure Synapse. Questo processo include:
- Inserimento di metadati e derivazione nel Microsoft Purview Data Map se l'account è connesso a qualsiasi pipeline Azure Data Factory o Azure Synapse.
Analisi automatiche con connettori nativi
Un'analisi completa elabora tutti gli asset all'interno di un ambito selezionato di un'origine dati, mentre un'analisi incrementale rileva ed elabora gli asset, che sono stati creati, modificati o eliminati dopo l'analisi precedente riuscita
Tutte le analisi (analisi complete o incrementali) prelevano asset aggiornati, modificati o eliminati
È importante considerare ed evitare gli scenari in cui più persone o gruppi appartenenti a reparti diversi configurano le analisi per la stessa origine dati, con conseguente aumento dei prezzi per l'analisi duplicata
Pianificare analisi incrementali frequenti dopo l'analisi completa iniziale allineata alle modifiche apportate alla proprietà dei dati. In questo modo la mappa dati viene sempre aggiornata e le analisi incrementali consumano meno ore v-core rispetto a un'analisi completa
Il collegamento "Visualizza dettagli" per un'origine dati consentirà agli utenti di eseguire un'analisi completa. Tuttavia, prendere in considerazione l'esecuzione di analisi incrementali dopo un'analisi completa per l'analisi ottimizzata, ad eccezione di quando si verifica una modifica al set di regole di analisi (classificazioni/tipi di file)
Registrare l'origine dati in una raccolta padre e analisi dell'ambito nella raccolta figlio con controlli di accesso diversi per assicurarsi che non siano previsti costi di analisi duplicati
Limitare gli utenti a cui è consentito registrare le origini dati per l'analisi tramite il controllo degli accessi granulari e il ruolo Amministratore origine dati usando l'autorizzazione raccolta. In questo modo sarà possibile registrare solo le origini dati valide e controllare l'analisi delle ore v-core, con conseguente riduzione dei costi per l'analisi
Si consideri che il tipo di origine dati e il numero di asset analizzati influiscono sulla durata dell'analisi
Creare set di regole di analisi personalizzati per includere solo il subset di tipi di file disponibili nel patrimonio dati e le classificazioni rilevanti per i requisiti aziendali per garantire un uso ottimale degli scanner
Durante la creazione di una nuova analisi per un'origine dati, seguire l'ordine di preparazione consigliato prima di eseguire effettivamente l'analisi. Ciò include la raccolta dei requisiti per le classificazioni e itipi di file specifici dell'azienda (per gli account di archiviazione) per consentire la definizione di set di regole di analisi appropriati per evitare più analisi e controllare i costi non necessari per più analisi tramite requisiti mancanti
Allineare le pianificazioni di analisi con le dimensioni delle macchine virtuali (Macchine virtuali) Self-Hosted Integration Runtime (SHIR) per evitare costi aggiuntivi collegati alle macchine virtuali
Inserimento automatizzato tramite pipeline di Azure Data Factory e/o Azure Synapse
- I metadati e la derivazione vengono inseriti dalle pipeline Azure Data Factory o Azure Synapse ogni volta che le pipeline vengono eseguite nel sistema di origine.
Set di risorse avanzati
Il Microsoft Purview Data Map usa set di risorse per affrontare la sfida di eseguire il mapping di un numero elevato di asset di dati a una singola risorsa logica, offrendo la possibilità di analizzare tutti i file nel data lake e trovare modelli (GUID, modelli di localizzazione e così via) per raggrupparli come singolo asset nella mappa dati
Il set di risorse avanzato è una funzionalità facoltativa che consente ai clienti di ottenere informazioni sul set di risorse arricchite calcolate, ad esempio Dimensioni totali, Conteggio partizioni e così via, e consente la personalizzazione del raggruppamento di set di risorse tramite regole del modello. Se la funzionalità Set di risorse avanzato non è abilitata, Unified Catalog conterrà comunque gli asset del set di risorse, ma senza le proprietà aggregate. In questo caso, al cliente non verrà fatturato alcun contatore "Set di risorse".
Usare la funzionalità set di risorse di base prima di attivare i set di risorse avanzati nel Microsoft Purview Data Map per verificare se i requisiti sono soddisfatti
Provare ad attivare set di risorse avanzati se:
- Lo schema dei data lake è in continua evoluzione e si sta cercando un valore maggiore oltre alla funzionalità di base del set di risorse per consentire al Microsoft Purview Data Map di calcolare parametri come #partitions, dimensioni del patrimonio dati e così via, come servizio
- È necessario personalizzare il modo in cui gli asset del set di risorse vengono raggruppati.
È importante notare che la fatturazione per i set di risorse avanzati si basa sul calcolo usato dal livello offline per aggregare le informazioni sui set di risorse e dipende dalle dimensioni/numero di set di risorse nel catalogo