Sdílet prostřednictvím


Správa výpočetní instance služby Azure Machine Learning

PLATÍ PRO:Rozšíření Azure CLI ml v2 (aktuální)Python SDK azure-ai-ml v2 (aktuální)

Zjistěte, jak spravovat výpočetní instanci v pracovním prostoru Azure Machine Learning.

Jako plně nakonfigurované a spravované vývojové prostředí v cloudu použijte výpočetní instanci. Pro vývoj a testování můžete také použít instanci jako trénovací cílový výpočetní objekt. Výpočetní instance může paralelně spouštět více úloh a má frontu úloh. Jako vývojové prostředí není možné výpočetní instanci sdílet s ostatními uživateli ve vašem pracovním prostoru.

V tomto článku se dozvíte, jak spustit, zastavit, restartovat, odstranit výpočetní instanci. Informace o vytvoření výpočetní instance najdete v tématu Vytvoření výpočetní instance služby Azure Machine Learning.

Poznámka:

Tento článek ukazuje rozhraní příkazového řádku v2 v následujících částech. Pokud stále používáte rozhraní příkazového řádku verze 1, přečtěte si téma Vytvoření výpočetního clusteru Azure Machine Learning CLI v1.

Požadavky

Na základě preferované metody správy výpočetní instance vyberte příslušnou kartu pro zbývající požadavky.

  • Pokud kód ve výpočetní instanci nespusíte, nainstalujte sadu Azure Machine Learning Python SDK. Tato sada SDK je už pro vás nainstalovaná ve výpočetní instanci.

  • Připojte se k pracovnímu prostoru ve skriptu Pythonu:

    Spuštěním tohoto kódu se připojte k pracovnímu prostoru Služby Azure Machine Learning.

    V následujícím kódu nahraďte ID předplatného, název skupiny prostředků a název pracovního prostoru. Tyto hodnoty najdete takto:

    1. Přihlaste se k studio Azure Machine Learning.
    2. Otevřete pracovní prostor, který chcete použít.
    3. V pravém horním studio Azure Machine Learning panelu nástrojů vyberte název pracovního prostoru.
    4. Zkopírujte hodnotu pro pracovní prostor, skupinu prostředků a ID předplatného do kódu.

    PLATÍ PRO: Python SDK azure-ai-ml v2 (aktuální)

    # Enter details of your AML workspace
    subscription_id = "<SUBSCRIPTION_ID>"
    resource_group = "<RESOURCE_GROUP>"
    workspace = "<AML_WORKSPACE_NAME>"
    # get a handle to the workspace
    from azure.ai.ml import MLClient
    from azure.identity import DefaultAzureCredential
    
    ml_client = MLClient(
        DefaultAzureCredential(), subscription_id, resource_group, workspace
    )

    ml_client je obslužná rutina pracovního prostoru, který používáte ke správě jiných prostředků a úloh.

Spravovat

Spusťte, zastavte, restartujte a odstraňte výpočetní instanci. Výpočetní instance ne vždy automaticky vertikálně navyšuje kapacitu, proto nezapomeňte zastavit prostředek, aby se zabránilo průběžným poplatkům. Zastavení výpočetní instance zruší její přidělení. Pak ho znovu spusťte, až ho budete potřebovat. I když zastavení výpočetní instance zastaví účtování výpočetního času, bude se vám stále účtovat disk, veřejná IP adresa a nástroj pro vyrovnávání zatížení úrovně Standard.

Automatické vypnutí můžete povolit, aby se výpočetní instance po zadané době automaticky zastavila.

Můžete také vytvořit plán , který výpočetní instanci automaticky spustí a zastaví na základě času a dne v týdnu.

Tip

Výpočetní instance má 120GB disk s operačním systémem. Pokud vám dojde místo na disku, před zastavením nebo restartováním výpočetní instance pomocí terminálu vymažte alespoň 5 GB. Nezastavujte výpočetní instanci tím, že v terminálu vydáte vypnutí sudo. Velikost dočasného disku na výpočetní instanci závisí na zvolené velikosti virtuálního počítače a je připojena k /mnt.

PLATÍ PRO: Python SDK azure-ai-ml v2 (aktuální)

V těchto příkladech je název výpočetní instance uložen v proměnné ci_basic_name.

  • Získání stavu

    from azure.ai.ml.entities import ComputeInstance, AmlCompute
    
    # Get compute
    ci_basic_state = ml_client.compute.get(ci_basic_name)
  • Zastavit

    from azure.ai.ml.entities import ComputeInstance, AmlCompute
    
    # Stop compute
    ml_client.compute.begin_stop(ci_basic_name).wait()
  • Spustit

    from azure.ai.ml.entities import ComputeInstance, AmlCompute
    
    # Start compute
    ml_client.compute.begin_start(ci_basic_name).wait()
  • Restartovat

    from azure.ai.ml.entities import ComputeInstance, AmlCompute
    
    # Restart compute
    ml_client.compute.begin_restart(ci_basic_name).wait()
  • Odstranění

    from azure.ai.ml.entities import ComputeInstance, AmlCompute
    
    ml_client.compute.begin_delete(ci_basic_name).wait()

Azure RBAC umožňuje řídit, kteří uživatelé v pracovním prostoru můžou vytvářet, odstraňovat, spouštět, zastavovat, restartovat výpočetní instanci. Všichni uživatelé v roli přispěvatele a vlastníka pracovního prostoru můžou vytvářet, odstraňovat, spouštět, zastavovat a restartovat výpočetní instance v celém pracovním prostoru. Přístup k Jupyteru, JupyterLabu a RStudiu pro tuto výpočetní instanci však může přistupovat pouze tvůrce konkrétní výpočetní instance nebo uživatel přiřazený jeho jménem. Výpočetní instance je vyhrazená pro jednoho uživatele, který má kořenový přístup. Tento uživatel má přístup k Jupyter/JupyterLab/RStudio spuštěné v instanci. Výpočetní instance má jednotné přihlašování a všechny akce používají identitu uživatele pro Azure RBAC a přiřazování úloh experimentu. Přístup SSH se řídí prostřednictvím mechanismu veřejného/privátního klíče.

Tyto akce můžou řídit Azure RBAC:

  • Microsoft.MachineLearningServices/workspaces/computes/read
  • Microsoft.MachineLearningServices/workspaces/computes/write
  • Microsoft.MachineLearningServices/workspaces/computes/delete
  • Microsoft.MachineLearningServices/workspaces/computes/start/action
  • Microsoft.MachineLearningServices/workspaces/computes/stop/action
  • Microsoft.MachineLearningServices/workspaces/computes/restart/action
  • Microsoft.MachineLearningServices/workspaces/computes/updateSchedules/action

K vytvoření výpočetní instance budete potřebovat oprávnění pro následující akce:

  • Microsoft.MachineLearningServices/workspaces/computes/write
  • Microsoft.MachineLearningServices/workspaces/checkComputeNameAvailability/action

Auditování a sledování verze výpočetní instance

Po nasazení výpočetní instance se automaticky neaktualizuje. Microsoft každý měsíc vydává nové image virtuálních počítačů. Informace o možnostech udržování nejnovějších verzí najdete v postupech správy ohrožení zabezpečení.

Pokud chcete sledovat, jestli je verze operačního systému instance aktuální, můžete její verzi dotazovat pomocí rozhraní příkazového řádku, sady SDK nebo uživatelského rozhraní sady Studio.

PLATÍ PRO: Python SDK azure-ai-ml v2 (aktuální)

from azure.ai.ml.entities import ComputeInstance, AmlCompute

# Display operating system version
instance = ml_client.compute.get("myci")
print instance.os_image_metadata

Další informace o třídách, metodách a parametrech použitých v tomto příkladu najdete v následujících referenčních dokumentech:

Správci IT můžou pomocí služby Azure Policy monitorovat inventář instancí napříč pracovními prostory na portálu pro dodržování předpisů Azure Policy. Přiřaďte předdefinované zásady Auditování instancí výpočetních prostředků Azure Machine Learning se zastaralým operačním systémem v rámci předplatného Azure nebo oboru skupiny pro správu Azure.

Další kroky