Quando usare Azure HDInsight

Completato

È possibile usare HDInsight per elaborare i Big Data in molti scenari, usando dati cronologici o in tempo reale. Ma è consigliabile farlo? Il punto di forza principale di HDInsight è l'ampia gamma di configurazioni disponibili. In questa unità si vedrà come valutare se HDInsight è la scelta corretta per l'organizzazione. Verranno analizzati i criteri seguenti per decidere:

  • Intervallo di carichi di lavoro
  • Scalabilità
  • Tolleranza di errore
  • Sicurezza

Criteri decisionali

Per determinare se HDInsight può soddisfare le esigenze dell'organizzazione per l'elaborazione dei Big Data, usare i criteri descritti nella tabella seguente:

Criteri Analisi
Intervallo di carichi di lavoro Se è necessario il supporto per diversi carichi di lavoro, sarà necessaria una piattaforma in grado di supportare tali requisiti.
Scalabilità L'organizzazione deve adattarsi per supportare aumenti del volume di dati e della velocità dei dati? È importante scegliere una piattaforma che supporti la scalabilità automatica e il ridimensionamento delle risorse di calcolo e di archiviazione in modo indipendente.
Tolleranza di errore Se l'analisi dei dati deve continuare nonostante gli errori dei componenti, sarà necessario scegliere una piattaforma a tolleranza di errore.
Sicurezza La maggior parte delle organizzazioni si aspetta che i dati con cui lavorano siano sicuri sia quando inattivi che in transito. È anche importante che quasi tutte le organizzazioni soddisfino gli standard di conformità governativi.

Applicare i criteri

Considerare il modo in cui l'organizzazione vuole usare i Big Data. Applicare ora i criteri decisionali per determinare se HDInsight è una scelta valida:

  • Gamma di carichi di lavoro: HDInsight consente di supportare un'ampia gamma di carichi di lavoro. Questi carichi di lavoro possono essere l'elaborazione dei dati in batch, l'uso di flussi di dati o la gestione di carichi di lavoro di data warehousing e/o di data science. Questa funzionalità rende HDInsight una soluzione interessante, soprattutto se il processo aziendale contiene più carichi di lavoro.

  • Scalabilità: HDInsight supporta risorse di calcolo e archiviazione scalabili in modo indipendente. Inoltre, i nodi di lavoro possono essere ridimensionati automaticamente in base al carico di lavoro o alla pianificazione.

    Suggerimento

    Si possono ottenere ottimizzazioni significative dei costi con la separazione delle risorse di calcolo e di archiviazione e con la scalabilità automatica del cluster.

  • Tolleranza di errore: i nodi head di HDInsight sono resilienti agli errori e sono supportati da macchine virtuali a tolleranza di errore. Questo lo rende un servizio a disponibilità elevata con un contratto di servizio del 99,9%.

  • Sicurezza: L'integrazione di Microsoft Entra fornisce i meccanismi di autenticazione e autorizzazione per la sicurezza aziendale. Queste funzionalità, oltre alla crittografia e al supporto della rete virtuale, offrono un controllo granulare su chi può accedere ai dati.

In sintesi, prendere in considerazione l'uso di HDInsight quando si vuole:

  • Raccogliere enormi quantità di dati su larga scala e:

    • Ottenere informazioni dettagliate in tempo reale.
    • Elaborare i dati con costi ottimizzati, impegno minimo e sicurezza avanzata.
  • Migrazione:

    • Un software open source locale, una distribuzione Hadoop in pacchetto del fornitore nel cloud con costo e fatica minimi.
    • Un software open source, un servizio Big Data da un'offerta cloud della concorrenza ad Azure.