Strategie optymalizacji kosztów dla klastrów usługi HDInsight
Pierwszym krokiem optymalizacji kosztów usługi HDInsight jest wybranie prawidłowego typu klastra dla obsługiwanego obciążenia. Wybranie niewłaściwego typu klastra może prowadzić do dłuższego czasu przetwarzania, a użycie większej ilości zasobów obliczeniowych jest wymagane. Powoduje to koszty, które mogą nie być odpowiednie dla wykonywanego działania i mogą być nadmierne dla operacji.
Wcześniej wybranie prawidłowego rozmiaru klastra było równie ważne, aby zapewnić szybkie obsługę obciążeń przy szczytowym zapotrzebowaniu. Jednak wybranie rozmiaru klastra zostało naprawione. Nie można go zmienić bez zatrzymywania klastra i ręcznego ponownego aprowizowania go przy użyciu nowego rozmiaru. Te kroki były niewygodne i opóźniłyby przetwarzanie danych.
W ostatnim czasie usługa HDInsight wprowadziła funkcję skalowania automatycznego, która skaluje obliczenia klastra w celu spełnienia wymagań związanych z przetwarzaniem na żądanie. Funkcja skalowania automatycznego umożliwia skalowanie klastra usługi HDInsight w górę podczas szczytowego zapotrzebowania i skalowania w dół, gdy operacje są względnie ciche. Dzięki tej funkcji można zminimalizować wydatki zgodnie z zapotrzebowaniem, które jest obsługiwane przez konfigurację usługi HDInsight.
Należy usunąć klastry, które nie są używane. Klaster usługi HDInsight można monitorować przy użyciu narzędzia Apache Ambari lub usługi Azure Monitor, aby zidentyfikować klastry, które nie są używane.