Condividi tramite


Integrare l'analisi su scala cloud nella strategia di adozione del cloud

Crea una strategia centralizzata unica di adozione del cloud per la tua organizzazione utilizzando la metodologia nel Cloud Adoption Framework di Azure. Se non hai già registrato la tua strategia di adozione del cloud, usa la strategia e il modello di piano per farlo.

Questo articolo contiene considerazioni per gli scenari di analisi su scala cloud che influiscono sulla strategia più ampia.

Prima di implementare l'analisi su scala cloud, è necessario implementare un piano per la strategia dei dati. È possibile iniziare con un singolo caso d'uso oppure è possibile avere un set più ampio di casi d'uso che richiedono la definizione delle priorità. Avere una strategia consente di stabilire i processi e di creare conversazioni iniziali sui pilastri su cui è necessario concentrarsi.

Assegnare priorità ai risultati aziendali per la strategia dei dati

Avere una strategia di dati efficace offre un vantaggio competitivo. È consigliabile allineare sempre la strategia dei dati ai risultati aziendali desiderati. La maggior parte dei risultati aziendali può essere classificata in una delle quattro categorie seguenti:

  • Dare potere ai dipendenti: Fornisci alla forza lavoro una conoscenza in tempo reale di clienti, dispositivi e macchine. Queste conoscenze consentono loro di collaborare in modo efficiente per soddisfare le esigenze aziendali o dei clienti con agilità.

  • Interagire con i clienti: Offrire un'esperienza ricca, personalizzata e connessa ispirata al marchio. Sfruttare la potenza dei dati e delle informazioni dettagliate per favorire la fedeltà dei clienti in ogni passaggio di un percorso del cliente.

  • Ottimizzare le operazioni: Aumentare il flusso di informazioni nell'intera organizzazione. Sincronizzare i processi aziendali e usare un approccio basato sui dati per rendere preziose tutte le interazioni.

  • Trasformare i prodotti e il ciclo di vita dello sviluppo: Raccogliere dati di telemetria sui servizi e sulle offerte. Usare i dati di telemetria per classificare in ordine di priorità una versione o creare una nuova funzionalità e valutare in modo continuo l'efficacia e l'adozione.

Dopo aver classificato in ordine di priorità i risultati aziendali, esaminare i progetti correnti e le iniziative strategiche a lungo termine e classificarle di conseguenza. Valutare la possibilità di combinare le quattro categorie di risultati aziendali in un formato matrice basato sulla complessità e sull'impatto. Considera anche di aggiungere pilastri architettonici per approfondire il tuo scenario.

Sbloccare il valore strategico

La creazione di una cultura basata sui dati che spinge il business in avanti in modo coerente, agile e informato presenta alcune complessità intrinseche e realtà di base. Prima di entrare nella fase di distribuzione, concentrarsi sulla formazione di una strategia di dati coerente che consente di ottenere i risultati aziendali desiderati.

L'analisi su scala cloud è allineata alle motivazioni incentrate sull'innovazione . I driver comuni seguenti motivano i clienti a integrare questo scenario nella strategia di adozione del cloud:

  • Un framework di analisi scalabile, che consente di creare una piattaforma dati aziendale
  • Self-service, che consente agli utenti di esplorare i dati, creare risorse di dati e nello sviluppo di prodotti
  • Una cultura basata sui dati con asset di dati riutilizzabili, community di dati, scambio sicuro con terze parti e condivisione in loco
  • Condivisione dei dati con fiducia, uso di criteri, identità comuni, riservatezza e crittografia
  • Esperienze e impegni dei clienti migliorati
  • Trasformazione di prodotti o servizi
  • Interruzione del mercato con nuovi prodotti o servizi

Il diagramma seguente contiene temi chiave che consentono di realizzare queste motivazioni nella propria strategia. Analizzare attentamente questi temi e come contribuiscono a una strategia coerente per i dati. Valutare anche come sbloccare il valore strategico dei dati e consentire una crescita aziendale coerente.

Diagramma che illustra i temi chiave dell'aumento dell'efficienza, della democratizzazione dei dati e della governance dei dati.

"Una strategia per i dati è la base per usare i dati come asset e promuovere il business. Non è un processo di patch per i problemi relativi ai dati. Si tratta di un piano guida a lungo termine che definisce le persone, i processi e la tecnologia da mettere in atto per risolvere le sfide dei dati".

La creazione della strategia è un passaggio. L'esecuzione della strategia su scala aziendale rappresenta una grande sfida per la cultura, le persone, i processi e le scelte tecnologiche esistenti dell'organizzazione. L'esecuzione richiede impegno e un chiaro senso di responsabilità a tutti i livelli dell'organizzazione.

Aumento dell'efficienza

L'agilità del cloud richiede alle organizzazioni di adattarsi rapidamente e portare efficienza a tutte le aree aziendali. Secondo il report sui rischi emergenti di Gartner, nonostante le organizzazioni continuino a concentrarsi sulle iniziative digitali e investire in iniziative digitali, due terzi di queste organizzazioni dimostrano i punti deboli dell'azienda e non riescono a realizzare aspettative, anche se continuano a concentrarsi su e investire in iniziative digitali.

Rendere operativa la gestione dei dati

Molte organizzazioni hanno lentamente decentralizzato l'IT centrale per abilitare l'agilità. Le organizzazioni vogliono innovare rapidamente e avere accesso ai dati unificati a livello aziendale in modo self-service li aiuta a soddisfare requisiti aziendali complessi.

Ci sono molti motivi per cui le aziende non riescono a sfruttare il potenziale completo dei dati. Potrebbe essere dovuto al fatto che le funzioni aziendali funzionano in silo, in cui ogni team usa strumenti e standard diversi per l'analisi dei dati. Oppure potrebbe essere dovuto a un errore di collegare gli indicatori di prestazioni chiave agli obiettivi aziendali complessivi.

La democratizzazione dei dati consente di restituire valore all'azienda e di raggiungere obiettivi di crescita aziendali impegnativi.

  • Comprendere e classificare in ordine di priorità le esigenze dei LOB.
  • Distribuire i dati tra domini per abilitare la proprietà e avvicinare i dati agli utenti.
  • Distribuire prodotti di dati self-service per generare approfondimenti e valore aziendale.

Per la governance dei dati, è necessario trovare un giusto equilibrio nel mondo decentralizzato della democratizzazione dei dati. Se si applica troppo rigorosamente la governance, è possibile soffocare l'innovazione. Tuttavia, se non si hanno almeno alcuni principi e processi di base, è probabile che si creino silos di dati. Questi silo possono danneggiare la reputazione dell'organizzazione e i potenziali ricavi. Un approccio olistico alla governance dei dati è fondamentale per sbloccare il valore strategico dei dati in modo coerente.

L'assenza di una strategia di dati ben ponderata comporta la necessità di "andare avanti" e iniziare rapidamente a fornire valore all'organizzazione. Affrontare i problemi aziendali attuali agendo sui temi chiave menzionati in precedenza o usandoli come principi strategici all'interno di un framework. L'uso di questi temi chiave consente anche di creare una strategia di dati olistica iterativa con la convalida, ma fornisce comunque risultati tempestivi. I leader aziendali e tecnologici devono sviluppare le strategie e la mentalità necessarie per generare valore dai dati e scalare rapidamente in modo semplificato e strutturato.

Per altre informazioni, vedere Che cos'è la governance dei dati?.

Sviluppare una cultura orientata ai dati

Per creare una strategia di dati efficace, sono necessarie impostazioni cultura basate sui dati. Sviluppare una cultura che promuove costantemente la partecipazione aperta e collaborativa. In questo tipo di cultura, l'intera forza lavoro può imparare, comunicare e migliorare i risultati aziendali dell'organizzazione. Lo sviluppo di una cultura basata sui dati migliora anche la capacità di ogni dipendente di generare un impatto o un'influenza supportata dai dati.

Il punto di partenza del viaggio dipende dall'organizzazione, dal settore e dalla posizione attuale lungo la curva di maturità. Il diagramma seguente mostra un modello di maturità di esempio che delinea i livelli di maturità dell'utilizzo dell'intelligenza artificiale di un'organizzazione:

Diagramma della maturità di un'organizzazione in evoluzione.

Livello 0

I dati non vengono sfruttati a livello di codice e in modo coerente. L'attenzione ai dati dell'organizzazione è dal punto di vista dello sviluppo di applicazioni.

Al livello 0, l'organizzazione ha spesso progetti di analisi non pianificati. Ogni applicazione è altamente specializzata per i dati univoci e le esigenze degli stakeholder. Ogni applicazione dispone anche di codebase e team di progettazione significativi, con molti tecnici all'esterno dell'IT. L'abilitazione dei casi di utilizzo e l'analisi sono trattate in modo isolato.

Livello 1

Al livello 1, i team vengono creati e la strategia viene creata, ma l'analisi rimane repartizzata. L'organizzazione tende a essere valida per l'analisi e l'acquisizione dei dati tradizionali. Potrebbe avere un certo livello di impegno per un approccio su scala cloud. Ad esempio, potrebbe già accedere ai dati dal cloud.

Livello 2

La piattaforma di innovazione dell'organizzazione è quasi pronta. I flussi di lavoro sono stati implementati per gestire la qualità dei dati. L'organizzazione può rispondere ad alcune domande "perché".

Al livello 2, l'organizzazione sta cercando attivamente una strategia dei dati end-to-end che utilizza archivi data lake gestiti centralmente per controllare la proliferazione degli archivi dati e migliorare l'individuabilità dei dati. L'organizzazione è pronta per applicazioni intelligenti che portano il calcolo ai data lake gestiti centralmente. Queste applicazioni intelligenti riducono i rischi per la privacy, i costi di calcolo e la necessità di copie federate di dati importanti.

A questo livello, l'organizzazione è anche pronta per l'uso di servizi dati condivisi multi-tenant ospitati centralmente per attività comuni di data computing. Questi servizi dati condivisi consentono informazioni rapide dai servizi di intelligence basati sull'analisi scientifica dei dati.

Livello 3

L'organizzazione usa un approccio olistico ai dati. I progetti correlati ai dati sono integrati all'interno dei risultati aziendali. L'organizzazione usa le piattaforme di analisi per eseguire stime.

Al livello 3, l'organizzazione sblocca l'innovazione digitale sia dal punto di vista dello sviluppo di applicazioni che di data estate. I servizi dati fondamentali sono disponibili, inclusi data lake e servizi dati condivisi.

Molte squadre all'interno dell'organizzazione realizzano con successo carichi di lavoro aziendali cruciali, casi d'uso aziendali chiave e risultati misurabili. I nuovi servizi dati condivisi vengono identificati usando i dati di telemetria. L'IT è un consulente attendibile per i team in tutta l'azienda, usando una strategia di dati end-to-end attendibile e connessa per migliorare i processi aziendali critici.

Livello 4

Al livello 4, l'intera organizzazione usa framework, standard, azienda e una cultura basata sui dati. L'automazione, i cicli di feedback basati sui dati e i centri di eccellenza per l'analisi o l'automazione possono essere osservati in azione.

Sviluppare obiettivi allineati all'azienda

L'identificazione delle priorità in linea con la visione aziendale e il mantenimento di un'ideologia "think big, start small, and act fast" sono fondamentali per il successo. La scelta del caso d'uso corretto non deve sempre essere un processo di valutazione lungo e difficile. Potrebbe trattarsi di un problema in corso in qualsiasi business unit in cui ci sono dati sufficienti per convalidare il ritorno sugli investimenti, maggiore interesse e facile accettazione. Le cose possono muoversi rapidamente, ed è qui che la maggior parte delle organizzazioni può faticare a partire.

Informazioni sugli attributi dei dati

Per creare una strategia avanzata per i dati, è necessario comprendere il funzionamento dei dati. Conoscere le caratteristiche principali dei dati consente di creare una pratica di principio per la gestione dei dati.

I dati viaggiano rapidamente, ma la sua velocità non può sfidare le leggi della fisica. I dati devono essere conformi alle leggi del territorio e dell'industria che l'ha creata.

I dati non cambiano autonomamente, ma sono soggetti a modifiche e perdite accidentali, a meno che non vengano messe in atto misure per attenuare tali sfide. Inserire misure anti-corruzione per controlli, database e archiviazione in modo da poter gestire modifiche impreviste. Assicurarsi inoltre di configurare il monitoraggio, i controlli, gli avvisi e i processi downstream.

Da solo, i dati non producono informazioni dettagliate né producono alcun valore. Per ottenere informazioni dettagliate o estrarre valore, è necessario inserire la maggior parte o tutti i dati in quattro passaggi discreti:

  1. Ingestione
  2. Immagazzinamento
  3. Elaborazione
  4. Analisi

Ognuno di questi quattro passaggi ha i propri principi, processi, strumenti e tecnologie.

La ritenzione delle risorse di dati e delle informazioni dettagliate correlate può influenzare le decisioni socioeconomiche, politiche, di ricerca e di investimento. È fondamentale che l'organizzazione sia in grado di fornire informazioni dettagliate in modo sicuro e responsabile. Tutti i dati generati o acquisiti devono essere sottoposti a un esercizio di classificazione dei dati, a meno che non diversamente specificato in modo esplicito. La crittografia è lo standard d'oro per la gestione dei dati riservati sia a riposo che in transito.

I dati, le applicazioni e i servizi hanno tutte le proprie pull gravitazionali, ma il pull dei dati è il più grande. A differenza della mitica mela di Sir Isaac Newton, i dati non hanno massa fisica che influisce sugli oggetti circostanti. Ha invece latenza e throughput, che fungono da acceleratori per i processi di analisi. La latenza, la velocità effettiva e la facilità di accesso spesso richiedono la duplicazione dei dati, anche quando non è consigliabile. Configurare le persone, i processi, gli strumenti e le tecnologie in modo appropriato, in modo da poter bilanciare tali requisiti con i criteri dei dati dell'organizzazione.

I costrutti architetturali regolano la velocità con cui è possibile elaborare i dati. I costrutti sono facilitati tramite innovazioni nel software, nell'hardware e nella rete. Alcune considerazioni sull'architettura sono:

  • Configurazione della distribuzione dei dati
  • Partizionamento
  • Tecnologie della cache
  • Elaborazione batch contro flusso
  • Bilanciamento del back-end e dell'elaborazione lato client

Definire la strategia dei dati

L'uso dei dati come vantaggio competitivo per la creazione di prodotti migliori e servizi di valore superiore non è un nuovo concetto. Tuttavia, il volume, la velocità e la varietà di dati abilitati dal cloud computing sono senza precedenti.

La progettazione di una moderna piattaforma di analisi dei dati nel cloud è costituita da sicurezza, governance, monitoraggio, scalabilità su richiesta, operazioni sui dati e self-service. Comprendere l'interazione tra questi facet è ciò che distingue una strategia di dati ottimale da una buona strategia. Usare strumenti come Cloud Adoption Framework per garantire la coerenza dell'architettura, l'integrità e le procedure consigliate.

Per essere efficace, la strategia dei dati deve contenere disposizioni per la governance dei dati. Il diagramma seguente illustra le fasi principali di un ciclo di vita dei dati, concentrandosi sulla governance dei dati come obiettivo:

Diagramma di un ciclo di vita dei dati.

Le sezioni seguenti descrivono le considerazioni da usare durante la decisione sui principi di progettazione per i livelli della strategia dei dati. Concentrarsi sulla generazione di risultati per l'azienda e valore dai tuoi dati.

Inserimento dati

Una considerazione fondamentale per l'inserimento dati è la possibilità di creare rapidamente una pipeline di dati in modo sicuro e conforme, dai requisiti fino all'ambiente di produzione. Gli elementi importanti includono tecnologie basate su metadati, self-service e low-code che idratano il data lake.

Quando si sviluppano pipeline, considerare sia la progettazione che la capacità di gestire i dati, distribuire i dati e scalare le risorse di calcolo. È anche necessario assicurarsi di avere il supporto DevOps adeguato per l'integrazione continua e la consegna della pipeline.

Strumenti come Azure Data Factory supportano un'ampia gamma di origini dati locali, origini dati SaaS (Software as a Service) e altre origini dati da altri cloud pubblici.

Immagazzinamento

Contrassegna e organizza i dati in livelli fisici e logici. I data lake fanno parte di tutte le moderne architetture di analisi dei dati. L'organizzazione deve applicare requisiti appropriati per la privacy dei dati, la sicurezza e la conformità che soddisfano tutti i requisiti di classificazione dei dati e conformità del settore in base ai quali si opera. La catalogazione e l'accesso self-service ai dati a livello di organizzazione facilitano la democratizzazione dei dati, alimentando l'innovazione sotto la guida di un controllo di accesso appropriato.

Scegli l'archiviazione appropriata per il tuo carico di lavoro. Anche se non si riesce a impostare l'archiviazione correttamente al primo tentativo, il cloud consente di passare rapidamente a una soluzione alternativa e di riprendere il percorso. Utilizzare i requisiti dell'applicazione per selezionare il database migliore. Assicurarsi di prendere in considerazione la possibilità di elaborare i dati batch e di streaming durante la scelta della piattaforma di analisi.

Elaborazione dati

Le esigenze di elaborazione dei dati variano a seconda di ogni carico di lavoro. La maggior parte dell'elaborazione dei dati su larga scala contiene elementi di elaborazione batch e in tempo reale. La maggior parte delle aziende ha anche elementi dei requisiti di elaborazione delle serie temporali e la necessità di elaborare testo in formato libero per le funzionalità di ricerca aziendale.

L'elaborazione delle transazioni online (OLTP) offre i requisiti di elaborazione dell'organizzazione più diffusi. Alcuni carichi di lavoro richiedono un'elaborazione specializzata come HPC (High Performance Computing), talvolta denominata "Big Compute". Questi carichi di lavoro risolvono attività matematiche complesse usando molti computer basati su CPU o GPU.

Per determinati carichi di lavoro specializzati, i clienti possono proteggere ambienti di esecuzione come il confidential computing di Azure, che consente agli utenti di proteggere i dati mentre i dati sono in uso all'interno di piattaforme cloud pubbliche. Questo stato è necessario per un'elaborazione efficiente. I dati sono protetti all'interno di un ambiente di esecuzione attendibile(TEE), noto anche come enclave. Un ambiente tee protegge il codice e i dati da qualsiasi visualizzazione e modifica esterna. Gli TEE consentono di eseguire il training di modelli di intelligenza artificiale senza sacrificare la riservatezza dei dati, anche se si usano origini dati di organizzazioni diverse.

Elaborazione analitica

Il costrutto ETL (Extract, Transform, Load) è correlato alle esigenze di elaborazione analitica online (OLAP) e data warehousing. Un modello di dati allineato all'azienda e un modello semantico che consente alle organizzazioni di implementare regole business e indicatori di prestazioni chiave (KPI) vengono spesso implementati come parte del processo analitico. Una funzionalità utile è il rilevamento automatico della deriva dello schema.

Riepilogo della strategia dei dati

Adottare un approccio basato su principi per altre considerazioni, come la governance dei dati e l'intelligenza artificiale responsabile, porterà vantaggi in futuro.

Microsoft segue quattro principi fondamentali: equità, affidabilità e sicurezza, privacy e sicurezza e inclusività. I due principi fondamentali della trasparenza e della responsabilità sono alla base di tutti e quattro i principi fondamentali.

Abbiamo messo in pratica i nostri principi e l'IA responsabile sviluppando risorse e un sistema di governance. Alcune delle linee guida riguardano l'interazione umana/intelligenza artificiale, l'intelligenza artificiale conversazionale, la progettazione inclusiva, un elenco di controllo dell'equità di intelligenza artificiale e un foglio dati per i set di dati.

Abbiamo anche sviluppato un set di strumenti per aiutare gli altri a comprendere, proteggere e controllare l'IA in ogni fase dell'innovazione. Questi strumenti sono frutto di sforzi di collaborazione multidisciplinari per rafforzare e accelerare l'IA responsabile. La collaborazione ha esteso ingegneria e sviluppo software, scienze sociali, ricerca degli utenti, legge e politica.

Per migliorare la collaborazione, abbiamo open source molti strumenti come InterpretML e Fairlearn. Altri possono contribuire e basarsi su questi strumenti open source. Abbiamo anche democratizzato gli strumenti tramite Azure Machine Learning.

Il pivot per diventare un'organizzazione basata sui dati è fondamentale per offrire un vantaggio competitivo nella nuova normalità. Si vuole aiutare i clienti a passare da un approccio di sola applicazione a un approccio basato su applicazioni e dati. Un approccio incentrato sulle applicazioni e sui dati consente di creare una strategia di dati end-to-end che garantisce la ripetibilità e la scalabilità nei casi d'uso correnti e futuri che influiscono sui risultati aziendali.

Diagramma dello sblocco dell'innovazione digitale.

Promuovere l'impegno, la comunicazione e il coinvolgimento

Tutti i ruoli chiave coinvolti nella strategia dei dati devono comprendere chiaramente l'approccio adottato e gli obiettivi aziendali comuni. I ruoli chiave possono includere un team di leadership (a livello C), business unit, IT, operazioni e team di distribuzione.

La comunicazione è una delle parti più importanti di questo framework. L'organizzazione deve elaborare un processo per una comunicazione efficace tra ruoli. La comunicazione consente di fornire in modo efficace nel contesto del progetto corrente. Definisce anche un forum che aiuta tutti gli utenti coinvolti a rimanere in linea, aggiornati e incentrati sull'obiettivo complessivo di creare una strategia olistica dei dati per il futuro.

L'engagement è essenziale tra i due gruppi seguenti:

  • Membri del team che progettano e implementano la strategia dei dati
  • Membri del team che contribuiscono a, consumano e sfruttano i dati (ad esempio le business unit che prendono decisioni e sviluppano risultati in base ai dati)

Per metterla in un altro modo, le strategie dei dati e le piattaforme dati associate costruite senza il coinvolgimento degli utenti rischiano di non essere pertinenti e di non essere adottate.

Due processi strategici consentono di realizzare correttamente questo framework:

  • Formazione di un centro di eccellenza
  • Adozione di un metodo di distribuzione agile

Per altre informazioni, vedere Sviluppare un piano per l'analisi su scala cloud.

Fornire valore

Quando si consegnano prodotti di dati secondo i criteri di successo in modo standardizzato e strutturato, la consegna convalida il framework iterativo. Inoltre, l'uso dell'apprendimento per innovare continuamente consente di creare fiducia aziendale e ampliare gli obiettivi di strategia dei dati. Questo processo offre un'adozione più chiara e veloce nell'intera organizzazione.

Lo stesso vale per la piattaforma dati. Quando si dispone di una configurazione in cui più team operano in modo abbastanza autonomo, è consigliabile orientarsi verso una rete. Raggiungere quel risultato è un processo iterativo. In molti casi, richiede modifiche significative alla configurazione, alla preparazione e all'allineamento aziendale dell'organizzazione.

Passaggi successivi

Leggere gli articoli seguenti per trovare indicazioni per il percorso di adozione del cloud e fare in modo che lo scenario di adozione del cloud riesca: