Stratégies d’optimisation des coûts pour les clusters HDInsight
La première étape de l’optimisation des coûts de HDInsight consiste à sélectionner le type de cluster approprié au vu de la charge de travail à gérer. Le choix d’un type de cluster incorrect peut allonger les temps de traitement et augmenter l’utilisation des ressources de calcul au-delà de ce qui est nécessaire. Cela entraîne des coûts qui peuvent ne pas convenir à l’activité exécutée et qui peuvent se révéler excessifs sur le plan opérationnel.
Auparavant, il était aussi important de choisir une taille de cluster appropriée pour que vos charges de travail puissent rapidement s’adapter aux pics de demande. Mais ce choix était alors fixe. Vous ne pouviez pas le modifier sans arrêter le cluster et le réapprovisionner manuellement en déployant la nouvelle taille de cluster. Ces procédures étaient peu pratiques et retardaient le traitement des données.
Récemment, HDInsight a introduit une fonctionnalité de mise à l’échelle automatique qui permet de mettre à l’échelle les ressources de calcul du cluster pour répondre aux besoins de traitement à la demande. La fonctionnalité de mise à l’échelle automatique vous permet d’effectuer un scale-up du cluster HDInsight pendant les pics de demande et d’effectuer un scale-down lorsque les opérations ralentissent. Cette fonctionnalité vous aide à réduire vos dépenses en fonction de la demande que traite votre configuration HDInsight.
Vous devez également supprimer les clusters que vous n’utilisez pas. Vous pouvez surveiller le cluster HDInsight à l’aide d’Apache Ambari ou d’Azure Monitor pour identifier les clusters qui ne sont pas utilisés.