Panoramica delle architetture
Prima di iniziare a creare le architetture dei dati del framework di analisi su scala cloud, vedere gli articoli nella tabella seguente.
Sezione | Descrizione |
---|---|
Creare una strategia iniziale | Come creare la strategia e il pivot dei dati per diventare un'organizzazione guidata dai dati. |
Definire il piano | Come sviluppare un piano per l'analisi su scala cloud. |
Preparare l'ambiente di analisi | Panoramica della preparazione del patrimonio di analisi su scala cloud con considerazioni chiave sull'area di progettazione, ad esempio registrazione aziendale, rete, gestione delle identità e degli accessi, criteri, continuità aziendale e ripristino di emergenza. |
Gestire l'analisi | Requisiti per gestire dati, catalogo dati, derivazione, gestione dei dati master, qualità dei dati, contratti di condivisione dei dati e metadati. |
Proteggere il patrimonio di analisi | Come proteggere l'ambiente di analisi con autenticazione e autorizzazione, privacy dei dati e gestione degli accessi ai dati. |
Organizzare utenti e team | Come organizzare operazioni, ruoli, team e funzioni del team efficaci. |
Gestire il patrimonio di analisi | Come effettuare il provisioning della piattaforma e dell'osservabilità per uno scenario. |
Architettura fisica
L'implementazione fisica dell'analisi su scala cloud è costituita da due architetture principali: la zona di destinazione della gestione dei dati e la zona di destinazione dei dati.
Applicazioni dati
Le applicazioni dati sono un concetto di base per la distribuzione di un prodotto dati e possono essere allineate sia ai modelli lakehouse che a mesh di dati.
Analisi cloud
È possibile ridimensionare la distribuzione di analisi su scala cloud usando più zone di destinazione dei dati.
Mesh di dati
Implementare la mesh di dati usando l'analisi su scala cloud. Anche se la maggior parte delle linee guida per l'analisi su scala cloud si applica, esistono alcune differenze da tenere presenti per i domini dati, le piattaforme dati self-service, l'onboarding di prodotti dati, governance, marketplace dei dati e condivisione dei dati.
Modelli di distribuzione per l'analisi su scala cloud
Nella tabella seguente sono elencati i modelli di riferimento che è possibile distribuire.
Repository | Contenuto | Richiesto | Modello di distribuzione |
---|---|---|---|
Modello di gestione dei dati | Servizi di gestione dei dati centrali e servizi dati condivisi, ad esempio catalogo dati e runtime di integrazione self-hosted | Sì | Una per analisi su scala cloud |
Modello della zona di destinazione per i dati | Servizi condivisi della zona di destinazione dei dati, inclusi i servizi di inserimento, gestione e archiviazione dei dati | Sì | Uno per zona di destinazione per i dati |
Modello di integrazione dei dati - Elaborazione batch | Servizi aggiuntivi necessari per l'elaborazione dei dati batch | No | Uno o più per zona di destinazione dei dati |
Modello di integrazione dei dati - Elaborazione del flusso | Servizi aggiuntivi necessari per l'elaborazione del flusso di dati | No | Uno o più per zona di destinazione dei dati |
Modello di prodotto dati - Analisi e data science | Servizi aggiuntivi necessari per l'analisi dei dati e l'intelligenza artificiale | No | Uno o più per zona di destinazione dei dati |
Questi modelli contengono modelli di Azure Resource Manager, i file di parametri dei modelli e le definizioni di pipeline CI/CD per la distribuzione delle risorse.
I modelli possono cambiare nel tempo a causa di nuovi servizi e requisiti di Azure. Proteggere il ramo principale di ogni repository in modo che rimanga privo di errori e pronto per l'utilizzo e la distribuzione. Usare una sottoscrizione di sviluppo per testare le modifiche di configurazione dei modelli prima di unire nuovamente i miglioramenti delle funzionalità nel ramo principale.
Connettersi agli ambienti privatamente
L'architettura di riferimento è protetta in base alla progettazione. Usa un approccio di sicurezza a più livelli per superare i rischi comuni di esfiltrazione dei dati.
La soluzione di sicurezza più semplice consiste nell'ospitare un jumpbox nella rete virtuale della zona di destinazione di gestione dei dati o della zona di destinazione dei dati per connettersi ai servizi dati tramite endpoint privati.
Domande frequenti
Per un elenco di domande e risposte sull'analisi su scala cloud, vedere Domande frequenti.
Passaggi successivi
Panoramica della zona di destinazione della gestione dei dati di analisi su scala cloud