Strategier för kostnadsoptimering för HDInsight-kluster
Det första steget i kostnadsoptimeringen för HDInsight är att välja rätt klustertyp för den arbetsbelastning som hanteras. Om du väljer fel klustertyp kan det leda till längre bearbetningstider, där mer beräkning används än vad som krävs. Detta resulterar i kostnader som kanske inte är lämpliga för den aktivitet som utförs och kan vara överdrivna för åtgärden.
Tidigare var det också lika viktigt att välja rätt storlek på klustret för att säkerställa att dina arbetsbelastningar kan hanteras snabbt vid hög efterfrågan. Det gick dock att välja klusterstorleken. Det gick inte att ändra det utan att stoppa klustret och manuellt återskapa det med den nya storleken. De här stegen var obekväma och skulle fördröja bearbetningen av data.
På senare tid har HDInsight introducerat en funktion för automatisk skalning som skalar klustrets beräkning så att den uppfyller bearbetningsbehoven på begäran. Med funktionen för automatisk skalning kan du skala upp HDInsight-klustret under hög efterfrågan och skala ned när åtgärderna är relativt tysta. Den här funktionen säkerställer att du kan minimera dina utgifter i enlighet med den efterfrågan som din HDInsight-konfiguration betjänar.
Du bör ta bort kluster som inte används. Du kan övervaka HDInsight-klustret med antingen Apache Ambari eller Azure Monitor för att identifiera de kluster som inte används.