Quando usare Esplora dati di Azure
In questa sezione viene illustrato come decidere se Esplora dati di Azure è la scelta giusta per le proprie esigenze di analisi dei Big Data. Valutando i criteri seguenti, è possibile determinare se Esplora dati di Azure soddisfa gli obiettivi funzionali e di prestazioni.
- Analisi interattiva
- Ampia gamma di dati
- Velocità dei dati
- Volume dei dati
- Organizzazione dei dati
- Concorrenza delle query
- Build o acquisto
Criteri decisionali
Esplora dati di Azure è una piattaforma di analisi interattiva dei Big Data che consente agli utenti di prendere decisioni guidate da dati in un ambiente altamente agile. I fattori qui elencati possono essere utili per valutare se Esplora dati di Azure è adatto al carico di lavoro disponibile. Trovare una risposta alle domande chiave seguenti:
Analisi interattiva
Si ha l'esigenza di analizzare i dati in modo interattivo?
L'analisi dei dati include tecniche, come l'aggregazione, la determinazione dell'ambito, la valutazione, la correlazione, il rilevamento anomalie, la previsione e la valutazione generale del modello, che consentono di trarre da grandi quantità di dati conclusioni praticabili. L'esecuzione interattiva di queste attività è compito di Esplora dati di Azure. Queste attività possono essere eseguite nei dashboard interattivi, nell'applicazione personalizzata analitica o tramite l'interazione diretta con i dati tramite query e visualizzazioni descrittive. Esplora dati di Azure potrebbe non essere la tecnologia giusta per l'esecuzione di processi batch a esecuzione prolungata sui dati. Per le attività a esecuzione prolungata, si consiglia di considerare l'uso di tecnologie come Microsoft Spark che sono compatibili con Esplora dati di Azure.
Ampia gamma di dati
Quanto è varia la struttura dei dati?
Esplora dati di Azure supporta gli indici full-text scalabili ad alte prestazioni e lo schema dinamico. Se occorre analizzare ed elaborare dati strutturati, semistrutturati (json/xml) e testuali, Esplora dati di Azure è una soluzione valida per il carico di lavoro disponibile.
Velocità dei dati
L'analisi dei dati in tempo reale è un fattore critico?
Esplora dati di Azure può acquisire grandi quantità di dati in modo rapido e con una bassa latenza. I set di dati tipici sono costituiti da tracce, log delle transazioni, serie temporali, metriche e, in generale, flussi di record attività. L'analisi near real-time di nuovi dati è un caso d'uso comune. Per alimentare questi carichi di lavoro, Esplora dati di Azure è ben connesso alle tecnologie di streaming come Hub eventi di Azure, hub IoT e Kafka. Tuttavia, nel caso in cui sia necessaria l'analisi in tempo reale, Esplora dati di Azure potrebbe non essere l'opzione migliore.
Volume dei dati
Quanti dati è necessario inserire?
Esplora dati di Azure è progettato per fornire analisi del percorso a caldo, interattive e tramite API, su carichi di lavoro con grandi quantità di dati. Per gli scenari in cui le dimensioni totali dei dati accumulati sono di pochi gigabyte, esistono altre soluzioni più efficienti in termini di costi.
Organizzazione dei dati
Con quanta coerenza sono organizzati i dati?
Esplora dati di Azure è progettato per applicare lo schema in lettura ai dati non elaborati. Questo approccio crea la flessibilità necessaria per esaminare i dati in modi diversi e da punti di vista diversi in base alle esigenze correnti. Questa capacità è utile per affrontare sfide impreviste come quelle che si verificano, a titolo di esempio, negli ambienti della sicurezza, operativi e competitivi. Esplora dati di Azure offre un alto livello di velocità, scalabilità ed efficienza dei costi per l'analisi dei dati non elaborati. Spesso, nelle distribuzioni di data warehouse, un processo di estrazione, trasformazione e caricamento (ETL) genera periodicamente un set ben gestito, altamente coerente e ben documentato di entità e attributi. L'analisi di questi complessi schemi a stella comporta in genere join di tipo fact-to-fact di grandi dimensioni per i quali Esplora dati di Azure non è ottimizzato.
Concorrenza delle query
Quanti utenti devono eseguire query sui dati, inserirli ed elaborarli contemporaneamente?
Esplora dati di Azure viene ampiamente usato per l'implementazione di offerte SaaS di analisi. Se è necessario supportare esigenze di analisi diverse e univoche da un numero elevato di richieste in parallelo, Esplora dati di Azure deve fornire una soluzione efficace.
Build o acquisto
Quanto si vuole personalizzare la piattaforma dati?
Esplora dati di Azure è una piattaforma distribuita come servizio completamente gestita. Non è tuttavia una soluzione chiavi in mano predefinita. Perché offra una soluzione (build), deve essere personalizzato, configurato, connesso e occorre aggiungergli esperienze. Esistono diverse soluzioni, di Microsoft e di terze parti che usano Esplora dati di Azure per offrire tali soluzioni chiavi in mano in domini e verticali diversi. Ad esempio, Monitoraggio di Azure per le operazioni IT. Microsoft Advanced Threat Protection e Microsoft Sentinel nel dominio della sicurezza e Azure Time Series Insights e Azure IoT Central nei domini IoT.
Applicare i criteri
Esplora dati di Azure funziona al meglio quando si tratta di offrire funzionalità di analisi interattiva ai knowledge worker su dati non elaborati ad alta velocità e diversificati. Si pensi ora a come applicare i criteri elencati in precedenza ai processi di esempio nello scenario dell'azienda di abbigliamento.
È consigliabile Esplora dati di Azure per i dati di produzione?
Il reparto di produzione dell'azienda di abbigliamento di esempio deve prendere decisioni su come gestire i volumi di inventario e di produzione. L'azienda ha a disposizione log di dati in ingresso per l'inventario. Intende anche usare i dati geospaziali ottenuti dal marketing per prevedere le esigenze dei prodotti in base all'area. Questi dati hanno un elevato grado di varietà, velocitàe volume. Non sono organizzati in modo coerente e molti stakeholder devono eseguire query simultanee su questi dati. Dall'inserimento all'esecuzione delle query, è necessario che la latenza sia bassa. I tempi di risposta delle query devono essere inferiori a un secondo o al massimo di un secondo. In base ai criteri decisionali, Esplora dati di Azure rappresenta una buona scelta per il reparto di produzione dell'azienda di abbigliamento.
Ha senso usare Esplora dati di Azure per i dati di marketing?
Il reparto di marketing dell'azienda di abbigliamento vuole valutare l'efficacia della propria campagna. Dispone dei dati clickstream provenienti dal sito Web e dalle campagne pubblicitarie. Dispone anche dei dati di testo libero (non strutturati) derivati dai social media. Questi dati sono estremamente vari e non organizzati. Il reparto intende eseguire analisi interattive esplorative. In base ai criteri decisionali, Esplora dati di Azure rappresenta una buona scelta per il reparto di marketing dell'azienda di abbigliamento.
Riepilogo delle indicazioni
Nella tabella seguente viene illustrato come valutare nuovi casi d'uso. Anche se questo non copre tutti i casi d'uso, pensiamo che possa aiutare a prendere una decisione in merito alla validità o meno di Esplora dati di Azure come soluzione alle proprie esigenze.
Caso d'uso | Analisi interattiva | Big Data (varietà, velocità, volume) | Organizzazione dei dati | Concorrenza | Build o acquisto | Quando usare Esplora dati di Azure? |
---|---|---|---|---|---|---|
Implementazione di un SaaS di analisi sicurezza | Uso intenso dell'analisi near real-time interattiva. | I dati sulla sicurezza sono vari, voluminosi e molto veloci. | Variabile | Il sistema viene spesso usato da più analisti da più tenant. | L'implementazione di un'offerta SaaS è uno scenario di Build. | Sì |
Analisi dei log della rete CDN | Interattiva per la risoluzione dei problemi, monitoraggio QoS. | I log della rete CDN sono vari, voluminosi e molto veloci. | Record di log separati. | Può essere usata da un gruppo ristretto di data scientist, ma può anche alimentare molti dashboard. | Il valore estratto dall'analisi della rete CDN è specifico per lo scenario e richiede un'analisi personalizzata. | Sì |
Database di serie temporali per i dati di telemetria IoT | Interattivo per la risoluzione dei problemi, l'analisi delle tendenze, l'utilizzo e il rilevamento di anomalie. | I dati di telemetria IoT sono ad alta velocità, ma possono essere solo strutturati o di dimensioni medie. | Set di record correlati. | Può essere usata da un gruppo ristretto di data scientist, ma può anche alimentare molti dashboard. | Quando si cerca un database, il contesto è in genere Build. | Sì |
Il diagramma di flusso seguente riepiloga le domande chiave da porsi quando si valuta l'uso di Esplora dati di Azure.