Quando usare Azure HDInsight
È possibile usare HDInsight per elaborare i Big Data in molti scenari, usando dati cronologici o in tempo reale. Ma è consigliabile farlo? Il punto di forza principale di HDInsight è l'ampia gamma di configurazioni disponibili. In questa unità si vedrà come valutare se HDInsight è la scelta corretta per l'organizzazione. Verranno analizzati i criteri seguenti per decidere:
- Intervallo di carichi di lavoro
- Scalabilità
- Tolleranza di errore
- Sicurezza
Criteri decisionali
Per determinare se HDInsight può soddisfare le esigenze dell'organizzazione per l'elaborazione dei Big Data, usare i criteri descritti nella tabella seguente:
Criteri | Analisi |
---|---|
Intervallo di carichi di lavoro | Se è necessario il supporto per diversi carichi di lavoro, sarà necessaria una piattaforma in grado di supportare tali requisiti. |
Scalabilità | L'organizzazione deve adattarsi per supportare aumenti del volume di dati e della velocità dei dati? È importante scegliere una piattaforma che supporti la scalabilità automatica e il ridimensionamento delle risorse di calcolo e di archiviazione in modo indipendente. |
Tolleranza di errore | Se l'analisi dei dati deve continuare nonostante gli errori dei componenti, sarà necessario scegliere una piattaforma a tolleranza di errore. |
Sicurezza | La maggior parte delle organizzazioni si aspetta che i dati con cui lavorano siano sicuri sia quando inattivi che in transito. È anche importante che quasi tutte le organizzazioni soddisfino gli standard di conformità governativi. |
Applicare i criteri
Considerare il modo in cui l'organizzazione vuole usare i Big Data. Applicare ora i criteri decisionali per determinare se HDInsight è una scelta valida:
Gamma di carichi di lavoro: HDInsight consente di supportare un'ampia gamma di carichi di lavoro. Questi carichi di lavoro possono essere l'elaborazione dei dati in batch, l'uso di flussi di dati o la gestione di carichi di lavoro di data warehousing e/o di data science. Questa funzionalità rende HDInsight una soluzione interessante, soprattutto se il processo aziendale contiene più carichi di lavoro.
Scalabilità: HDInsight supporta risorse di calcolo e archiviazione scalabili in modo indipendente. Inoltre, i nodi di lavoro possono essere ridimensionati automaticamente in base al carico di lavoro o alla pianificazione.
Suggerimento
Si possono ottenere ottimizzazioni significative dei costi con la separazione delle risorse di calcolo e di archiviazione e con la scalabilità automatica del cluster.
Tolleranza di errore: i nodi head di HDInsight sono resilienti agli errori e sono supportati da macchine virtuali a tolleranza di errore. Questo lo rende un servizio a disponibilità elevata con un contratto di servizio del 99,9%.
Sicurezza: L'integrazione di Microsoft Entra fornisce i meccanismi di autenticazione e autorizzazione per la sicurezza aziendale. Queste funzionalità, oltre alla crittografia e al supporto della rete virtuale, offrono un controllo granulare su chi può accedere ai dati.
In sintesi, prendere in considerazione l'uso di HDInsight quando si vuole:
Raccogliere enormi quantità di dati su larga scala e:
- Ottenere informazioni dettagliate in tempo reale.
- Elaborare i dati con costi ottimizzati, impegno minimo e sicurezza avanzata.
Migrazione:
- Un software open source locale, una distribuzione Hadoop in pacchetto del fornitore nel cloud con costo e fatica minimi.
- Un software open source, un servizio Big Data da un'offerta cloud della concorrenza ad Azure.