Automatické škálování online koncových bodů ve službě Azure Machine Learning

Článek
09/01/2024

PLATÍ PRO:Rozšíření Azure CLI ml v2 (aktuální)Python SDK azure-ai-ml v2 (aktuální)

V tomto článku se dozvíte, jak spravovat využití prostředků v nasazení konfigurací automatického škálování na základě metrik a plánů. Proces automatického škálování umožňuje automaticky spouštět správné množství prostředků pro zpracování zatížení vaší aplikace. Online koncové body ve službě Azure Machine Learning podporují automatické škálování prostřednictvím integrace s funkcí automatického škálování ve službě Azure Monitor.

Automatické škálování služby Azure Monitor umožňuje nastavit pravidla, která při splnění podmínek pravidel aktivují jednu nebo více akcí automatického škálování. Můžete nakonfigurovat škálování na základě metrik (například využití procesoru větší než 70 %), škálování na základě plánu (například pravidla škálování pro špičku pracovní doby) nebo kombinaci těchto dvou. Další informace najdete v tématu Přehled automatického škálování v Microsoft Azure.

Diagram znázorňující, jak automatické škálování podle potřeby přidává a odebírá instance

Automatické škálování můžete v současné době spravovat pomocí Azure CLI, rozhraní REST API, Azure Resource Manageru, sady Python SDK nebo webu Azure Portal založeného na prohlížeči.

Požadavky

Nasazený koncový bod. Další informace najdete v tématu Nasazení a určení skóre modelu strojového učení pomocí online koncového bodu.
Pokud chcete použít automatické škálování, musí být role microsoft.insights/autoscalesettings/write přiřazená identitě, která spravuje automatické škálování. Můžete použít jakékoli předdefinované nebo vlastní role, které tuto akci umožňují. Obecné pokyny ke správě rolí pro Azure Machine Learning najdete v tématu Správa uživatelů a rolí. Další informace o nastavení automatického škálování z Azure Monitoru najdete v tématu Automatické škálování Microsoft.Insights.
Pokud chcete ke správě služby Azure Monitor použít sadu Python SDK, nainstalujte azure-mgmt-monitor balíček pomocí následujícího příkazu:
```
pip install azure-mgmt-monitor
```

Definování profilu automatického škálování

Pokud chcete povolit automatické škálování pro online koncový bod, nejprve definujete profil automatického škálování. Profil určuje výchozí, minimální a maximální kapacitu škálovací sady. Následující příklad ukazuje, jak nastavit počet instancí virtuálního počítače pro výchozí, minimální a maximální kapacitu škálování.

PLATÍ PRO: Rozšíření Azure CLI ml v2 (aktuální)

Pokud jste ještě nenastavili výchozí hodnoty pro Azure CLI, uložte výchozí nastavení. Pokud se chcete vyhnout předávání hodnot pro vaše předplatné, pracovní prostor a skupinu prostředků několikrát, spusťte tento kód:

az account set --subscription <subscription ID>
az configure --defaults workspace=<Azure Machine Learning workspace name> group=<resource group>

Nastavte názvy koncových bodů a nasazení:

# set your existing endpoint name
ENDPOINT_NAME=your-endpoint-name
DEPLOYMENT_NAME=blue

Získejte ID Azure Resource Manageru pro nasazení a koncový bod:

# ARM id of the deployment
DEPLOYMENT_RESOURCE_ID=$(az ml online-deployment show -e $ENDPOINT_NAME -n $DEPLOYMENT_NAME -o tsv --query "id")
# ARM id of the deployment. todo: change to --query "id"
ENDPOINT_RESOURCE_ID=$(az ml online-endpoint show -n $ENDPOINT_NAME -o tsv --query "properties.\"azureml.onlineendpointid\"")
# set a unique name for autoscale settings for this deployment. The below will append a random number to make the name unique.
AUTOSCALE_SETTINGS_NAME=autoscale-$ENDPOINT_NAME-$DEPLOYMENT_NAME-`echo $RANDOM`

Vytvořte profil automatického škálování:

az monitor autoscale create \
  --name $AUTOSCALE_SETTINGS_NAME \
  --resource $DEPLOYMENT_RESOURCE_ID \
  --min-count 2 --max-count 5 --count 2

Poznámka:

Další informace najdete v tématu az monitor autoscale reference.

PLATÍ PRO: Python SDK azure-ai-ml v2 (aktuální)

Import potřebných modulů:

from azure.ai.ml import MLClient
from azure.identity import DefaultAzureCredential
from azure.mgmt.monitor import MonitorManagementClient
from azure.mgmt.monitor.models import AutoscaleProfile, ScaleRule, MetricTrigger, ScaleAction, Recurrence, RecurrentSchedule
import random 
import datetime

Definujte proměnné pro pracovní prostor, koncový bod a nasazení:

subscription_id = "<YOUR-SUBSCRIPTION-ID>"
resource_group = "<YOUR-RESOURCE-GROUP>"
workspace = "<YOUR-WORKSPACE>"

endpoint_name = "<YOUR-ENDPOINT-NAME>"
deployment_name = "blue"

Získejte klienty Azure Machine Learning a Azure Monitor:

credential = DefaultAzureCredential()
ml_client = MLClient(
    credential, subscription_id, resource_group, workspace
)

mon_client = MonitorManagementClient(
    credential, subscription_id
)

Získejte objekty koncového bodu a nasazení:

deployment = ml_client.online_deployments.get(
    deployment_name, endpoint_name
)

endpoint = ml_client.online_endpoints.get(
    endpoint_name
)

Vytvořte profil automatického škálování:

# Set a unique name for autoscale settings for this deployment. The following code appends a random number to create a unique name.
autoscale_settings_name = f"autoscale-{endpoint_name}-{deployment_name}-{random.randint(0,1000)}"

mon_client.autoscale_settings.create_or_update(
    resource_group, 
    autoscale_settings_name, 
    parameters = {
        "location" : endpoint.location,
        "target_resource_uri" : deployment.id,
        "profiles" : [
            AutoscaleProfile(
                name="my-scale-settings",
                capacity={
                    "minimum" : 2, 
                    "maximum" : 5,
                    "default" : 2
                },
                rules = []
            )
        ]
    }
)

Vytvoření pravidla škálování na více instancí na základě metrik nasazení

Běžným pravidlem horizontálního navýšení kapacity je zvýšení počtu instancí virtuálních počítačů, když je průměrné zatížení procesoru vysoké. Následující příklad ukazuje, jak přidělit dva více uzlů (až do maxima), pokud je průměrné zatížení procesoru větší než 70 % po dobu 5 minut:

PLATÍ PRO: Rozšíření Azure CLI ml v2 (aktuální)

az monitor autoscale rule create \
  --autoscale-name $AUTOSCALE_SETTINGS_NAME \
  --condition "CpuUtilizationPercentage > 70 avg 5m" \
  --scale out 2

Pravidlo je součástí my-scale-settings profilu, kde autoscale-name odpovídá name části profilu. Hodnota argumentu pravidla označuje triggery pravidla condition , když "Průměrná spotřeba procesoru mezi instancemi virtuálních počítačů překročí 70 % po dobu 5 minut.". Jakmile je podmínka splněná, přidělí se dvě další instance virtuálních počítačů.

Poznámka:

Další informace najdete v referenčních informacích k syntaxi Azure CLI az monitor autoscale .

PLATÍ PRO: Python SDK azure-ai-ml v2 (aktuální)

Vytvořte definici pravidla:

rule_scale_out = ScaleRule(
    metric_trigger = MetricTrigger(
        metric_name="CpuUtilizationPercentage",
        metric_resource_uri = deployment.id, 
        time_grain = datetime.timedelta(minutes = 1),
        statistic = "Average",
        operator = "GreaterThan", 
        time_aggregation = "Last",
        time_window = datetime.timedelta(minutes = 5), 
        threshold = 70
    ), 
    scale_action = ScaleAction(
        direction = "Increase", 
        type = "ChangeCount", 
        value = 2, 
        cooldown = datetime.timedelta(hours = 1)
    )
)

Toto pravidlo odkazuje na posledních 5minutový CPUUtilizationpercentage průměr hodnoty z argumentů metric_name, time_windowa time_aggregation. Pokud je hodnota metriky větší než threshold 70, nasazení přidělí dvě více instancí virtuálních počítačů.

my-scale-settings Aktualizujte profil tak, aby zahrnoval toto pravidlo:

mon_client.autoscale_settings.create_or_update(
    resource_group, 
    autoscale_settings_name, 
    parameters = {
        "location" : endpoint.location,
        "target_resource_uri" : deployment.id,
        "profiles" : [
            AutoscaleProfile(
                name="my-scale-settings",
                capacity={
                    "minimum" : 2, 
                    "maximum" : 5,
                    "default" : 2
                },
                rules = [
                    rule_scale_out
                ]
            )
        ]
    }
)

Vytvoření pravidla horizontálního snížení kapacity na základě metrik nasazení

Pokud je průměrné zatížení procesoru lehké, pravidlo škálování může snížit počet instancí virtuálních počítačů. Následující příklad ukazuje, jak uvolnit jeden uzel na minimálně dva, pokud je zatížení procesoru menší než 30 % po dobu 5 minut.

PLATÍ PRO: Rozšíření Azure CLI ml v2 (aktuální)

az monitor autoscale rule create \
  --autoscale-name $AUTOSCALE_SETTINGS_NAME \
  --condition "CpuUtilizationPercentage < 25 avg 5m" \
  --scale in 1

PLATÍ PRO: Python SDK azure-ai-ml v2 (aktuální)

Vytvořte definici pravidla:

rule_scale_in = ScaleRule(
    metric_trigger = MetricTrigger(
        metric_name="CpuUtilizationPercentage",
        metric_resource_uri = deployment.id, 
        time_grain = datetime.timedelta(minutes = 1),
        statistic = "Average",
        operator = "LessThan", 
        time_aggregation = "Last",
        time_window = datetime.timedelta(minutes = 5), 
        threshold = 30
    ), 
    scale_action = ScaleAction(
        direction = "Increase", 
        type = "ChangeCount", 
        value = 1, 
        cooldown = datetime.timedelta(hours = 1)
    )
)

my-scale-settings Aktualizujte profil tak, aby zahrnoval toto pravidlo:

mon_client.autoscale_settings.create_or_update(
    resource_group, 
    autoscale_settings_name, 
    parameters = {
        "location" : endpoint.location,
        "target_resource_uri" : deployment.id,
        "profiles" : [
            AutoscaleProfile(
                name="my-scale-settings",
                capacity={
                    "minimum" : 2, 
                    "maximum" : 5,
                    "default" : 2
                },
                rules = [
                    rule_scale_out, 
                    rule_scale_in
                ]
            )
        ]
    }
)

Vytvoření pravidla škálování na základě metrik koncových bodů

V předchozích částech jste vytvořili pravidla pro horizontální navýšení nebo snížení kapacity na základě metrik nasazení. Můžete také vytvořit pravidlo, které platí pro koncový bod nasazení. V této části se dozvíte, jak přidělit jiný uzel, když je latence požadavku větší než průměr 70 milisekund po dobu 5 minut.

PLATÍ PRO: Rozšíření Azure CLI ml v2 (aktuální)

az monitor autoscale rule create \
 --autoscale-name $AUTOSCALE_SETTINGS_NAME \
 --condition "RequestLatency > 70 avg 5m" \
 --scale out 1 \
 --resource $ENDPOINT_RESOURCE_ID

PLATÍ PRO: Python SDK azure-ai-ml v2 (aktuální)

Vytvořte definici pravidla:

rule_scale_out_endpoint = ScaleRule(
    metric_trigger = MetricTrigger(
        metric_name="RequestLatency",
        metric_resource_uri = endpoint.id, 
        time_grain = datetime.timedelta(minutes = 1),
        statistic = "Average",
        operator = "GreaterThan", 
        time_aggregation = "Last",
        time_window = datetime.timedelta(minutes = 5), 
        threshold = 70
    ), 
    scale_action = ScaleAction(
        direction = "Increase", 
        type = "ChangeCount", 
        value = 1, 
        cooldown = datetime.timedelta(hours = 1)
    )
)

Pole tohoto pravidla metric_resource_uri teď odkazuje na koncový bod, nikoli na nasazení.

my-scale-settings Aktualizujte profil tak, aby zahrnoval toto pravidlo:

mon_client.autoscale_settings.create_or_update(
    resource_group, 
    autoscale_settings_name, 
    parameters = {
        "location" : endpoint.location,
        "target_resource_uri" : deployment.id,
        "profiles" : [
            AutoscaleProfile(
                name="my-scale-settings",
                capacity={
                    "minimum" : 2, 
                    "maximum" : 5,
                    "default" : 2
                },
                rules = [
                    rule_scale_out, 
                    rule_scale_in,
                    rule_scale_out_endpoint
                ]
            )
        ]
    }
)

Vyhledání ID podporovaných metrik

Pokud chcete použít jiné metriky v kódu k nastavení pravidel automatického škálování pomocí Azure CLI nebo sady SDK, přečtěte si tabulku v dostupných metrikách.

Vytvoření pravidla škálování na základě plánu

Můžete také vytvořit pravidla, která platí jenom v určitých dnech nebo v určitých časech. V této části vytvoříte pravidlo, které nastaví počet uzlů na 2 o víkendech.

PLATÍ PRO: Rozšíření Azure CLI ml v2 (aktuální)

az monitor autoscale profile create \
  --name weekend-profile \
  --autoscale-name $AUTOSCALE_SETTINGS_NAME \
  --min-count 2 --count 2 --max-count 2 \
  --recurrence week sat sun --timezone "Pacific Standard Time"

PLATÍ PRO: Python SDK azure-ai-ml v2 (aktuální)

mon_client.autoscale_settings.create_or_update(
    resource_group, 
    autoscale_settings_name, 
    parameters = {
        "location" : endpoint.location,
        "target_resource_uri" : deployment.id,
        "profiles" : [
            AutoscaleProfile(
                name="Default",
                capacity={
                    "minimum" : 2, 
                    "maximum" : 2,
                    "default" : 2
                },
                recurrence = Recurrence(
                    frequency = "Week", 
                    schedule = RecurrentSchedule(
                        time_zone = "Pacific Standard Time", 
                        days = ["Saturday", "Sunday"], 
                        hours = [], 
                        minutes = []
                    )
                )
            )
        ]
    }
)

Povolení nebo zakázání automatického škálování

Můžete povolit nebo zakázat konkrétní profil automatického škálování.

PLATÍ PRO: Rozšíření Azure CLI ml v2 (aktuální)

az monitor autoscale update \
  --autoscale-name $AUTOSCALE_SETTINGS_NAME \
  --enabled false

PLATÍ PRO: Python SDK azure-ai-ml v2 (aktuální)

mon_client.autoscale_settings.create_or_update(
    resource_group, 
    autoscale_settings_name, 
    parameters = {
        "location" : endpoint.location,
        "target_resource_uri" : deployment.id,
        "enabled" : False
    }
)

Odstranění prostředků

Pokud nasazení nebudete používat, odstraňte prostředky pomocí následujícího postupu.

PLATÍ PRO: Rozšíření Azure CLI ml v2 (aktuální)

# delete the autoscaling profile
az monitor autoscale delete -n "$AUTOSCALE_SETTINGS_NAME"

# delete the endpoint
az ml online-endpoint delete --name $ENDPOINT_NAME --yes --no-wait

PLATÍ PRO: Python SDK azure-ai-ml v2 (aktuální)

mon_client.autoscale_settings.delete(
    resource_group, 
    autoscale_settings_name
)

ml_client.online_endpoints.begin_delete(endpoint_name)

Sdílet prostřednictvím

Automatické škálování online koncových bodů ve službě Azure Machine Learning

Požadavky

Definování profilu automatického škálování

Vytvoření pravidla škálování na více instancí na základě metrik nasazení

Vytvoření pravidla horizontálního snížení kapacity na základě metrik nasazení

Vytvoření pravidla škálování na základě metrik koncových bodů

Vyhledání ID podporovaných metrik

Vytvoření pravidla škálování na základě plánu

Povolení nebo zakázání automatického škálování

Odstranění prostředků

Váš názor

Další materiály

Sdílet prostřednictvím

Automatické škálování online koncových bodů ve službě Azure Machine Learning

Požadavky

Definování profilu automatického škálování

Vytvoření pravidla škálování na více instancí na základě metrik nasazení

Vytvoření pravidla horizontálního snížení kapacity na základě metrik nasazení

Vytvoření pravidla škálování na základě metrik koncových bodů

Vyhledání ID podporovaných metrik

Vytvoření pravidla škálování na základě plánu

Povolení nebo zakázání automatického škálování

Odstranění prostředků

Související obsah

Váš názor

Další materiály