Organizzare i membri del team di operazioni sui dati
L'architettura di analisi su scala cloud è stata progettata con un set di principi di base.
Principi di base
Abilitazione al self-service: Consentire ai team di progetto di lavorare autonomamente per consentire metodologie di sviluppo agile.
Governance: Applicare protezioni nella piattaforma Azure per garantire che i team di progetto visualizzino, modifichino ed eseseguono le funzioni all'interno delle autorizzazioni.
Implementazioni ottimizzate: Assicurarsi che i criteri comuni siano disponibili all'interno dell'organizzazione per aiutare i team a scalare rapidamente e sostenere i team meno esperti in alcuni elementi e progetti fondamentali.
Ruoli e team
Nell'analitica su scala cloud, è consigliabile passare da team suddivisi orizzontalmente in compartimenti stagni a team verticali agili e cross-domain. I team delle operazioni dati si concentrano sulla governance del piano di controllo, mentre i team delle applicazioni dati si concentrano su creare i dati come prodotto. Questa differenziazione richiede modifiche organizzative a un modello più allineato allo sviluppo di applicazioni. Ad esempio, ogni applicazione ha un proprietario del prodotto che definisce l'ambito dei requisiti e collabora con un team tra domini per distribuire un prodotto. In questo caso, il prodotto è dati per il consumo.
Per altre informazioni, vedere Informazioni sui ruoli e sui team per l'analisi su scala cloud in Azure
Distribuzione e operazioni
Il modello di processo di distribuzione e operazioni sui dati (DataOps) è una parte essenziale che supporta alcuni di questi principi di base. Le linee guida seguenti sono consigliate per le organizzazioni per allinearsi ai principi:
- Usare l'infrastruttura come codice.
- Distribuire modelli che coprono i casi d'uso principali all'interno dell'azienda.
- Seguire un processo di distribuzione che include una strategia per i fork e i rami di GitHub.
- Gestire un repository centrale e distribuire le zone d'atterraggio per la gestione dei dati.
Contributori con competenze individuabili e personali devono formare un gruppo di piattaforma per governare centralmente l'infrastruttura della piattaforma dati e costruire e distribuire componenti comuni dell'infrastruttura della piattaforma dati per la zona di atterraggio della gestione dei dati, oltre a varie zone di atterraggio dei dati. Il gruppo di piattaforme può anche creare, possedere e fornire una tecnologia indipendente che consente ai team dell'applicazione dati di acquisire, elaborare, archiviare e gestire le applicazioni dati.
Il gruppo di piattaforme deve presentare i servizi in modo self-service, che può includere strumenti per l'archiviazione di Big Data, il controllo delle versioni dei dati dei prodotti, l'organizzazione/implementazione della pipeline di dati, la de-identificazione dei dati e altro ancora. Questi tipi di strumenti sono fondamentali per ridurre al minimo i colli di bottiglia nel flusso di lavoro e ridurre il tempo di consegna per la creazione di nuovi prodotti di dati.
Il gruppo di piattaforme deve seguire le procedure consigliate descritte in questa sezione per raggiungere i propri obiettivi. Altri team del prodotto dati devono usare le procedure consigliate negli articoli successivi per testare e automatizzare i dati.
Per altre informazioni, vedere Automazione di DevOps per l'analisi su scala cloud in Azure