Estrategias de optimización de costos para clústeres de HDInsight

Completado

El primer paso para la optimización de costos de HDInsight consiste en seleccionar el tipo de clúster correcto para la carga de trabajo que se va a atender. La elección de un tipo de clúster incorrecto puede conllevar tiempos de procesamiento más largos y un uso de la capacidad de proceso superior al necesario. Como consecuencia, pueden surgir costos inadecuados para la actividad que se está realizando y excesivos para la operación.

Antes, también era importante seleccionar el tamaño de clúster correcto para garantizar que se pudiese atender rápidamente las cargas de trabajo en un momento de máxima demanda. El problema era que la selección del tamaño del clúster era fija. No se podía cambiar a menos que se detuviese el clúster y se reaprovisionase manualmente con el nuevo tamaño. Estos pasos no eran prácticos y retrasaban el procesamiento de los datos.

Recientemente, HDInsight ha incorporado una característica de escalado automático que escala la capacidad de proceso del clúster para satisfacer las necesidades de procesamiento a petición. La característica de escalado automático permite escalar verticalmente el clúster de HDInsight durante la máxima demanda y reducirlo verticalmente cuando las operaciones son relativamente tranquilas. Esta característica permite minimizar los gastos en función de la demanda a la que atiende la configuración de HDInsight.

Debe eliminar los clústeres que no estén en uso. Puede supervisar el clúster de HDInsight mediante Apache Ambari o Azure Monitor para identificar los clústeres que no se usan.