Strategie di ottimizzazione dei costi per i cluster di HDInsight
Il primo passaggio per l'ottimizzazione dei costi di HDInsight è la selezione del tipo di cluster corretto per il carico di lavoro che viene gestito. La scelta del tipo di cluster sbagliato può comportare tempi di elaborazione più lunghi e l'uso di più risorse di calcolo del necessario. Questo genera costi che potrebbero non essere appropriati per l'attività in atto e che potrebbero essere eccessivi per l'operazione.
In precedenza, anche la selezione delle dimensioni corrette del cluster era ugualmente importante per garantire che i carichi di lavoro potessero essere gestiti rapidamente nel momento di picco della domanda. Tuttavia, la selezione delle dimensioni del cluster è stata risolta. Non è stato possibile modificarla senza arrestare il cluster e eseguirne di nuovo il provisioning manualmente con le nuove dimensioni. Questi passaggi sono stati disagevoli e hanno ritardato l'elaborazione dei dati.
Negli ultimi tempi, HDInsight ha introdotto una funzionalità di scalabilità automatica che consente di ridimensionare il calcolo del cluster per soddisfare le esigenze di elaborazione su richiesta. La funzionalità di scalabilità automatica consente di aumentare le dimensioni del cluster di HDInsight durante i picchi di domanda e di ridurle quando le operazioni sono relativamente tranquille. Questa funzionalità garantisce che sia possibile ridurre la spesa sulla base del fabbisogno gestito dalla configurazione HDInsight.
È opportuno eliminare i cluster non in uso. È possibile monitorare il cluster di HDInsight usando Apache Ambari o Monitoraggio di Azure per identificare i cluster non usati.