Explore o SDK do Python

Concluído

Importante

Atualmente, existem duas versões do Python SDK: versão 1 (v1) e versão 2 (v2). Para quaisquer novos projetos, você deve usar v2 e, portanto, o conteúdo nesta unidade cobre apenas v2. Saiba mais sobre como decidir entre v1 e v2.

Os cientistas de dados podem usar o Aprendizado de Máquina do Azure para treinar, acompanhar e gerenciar modelos de aprendizado de máquina. Como cientista de dados, você trabalhará principalmente com os ativos dentro do espaço de trabalho do Azure Machine Learning para suas cargas de trabalho de aprendizado de máquina.

Como a maioria dos cientistas de dados está familiarizada com o Python, o Azure Machine Learning oferece um kit de desenvolvimento de software (SDK) para que você possa interagir com o espaço de trabalho usando o Python.

O SDK Python para Azure Machine Learning é uma ferramenta ideal para cientistas de dados que pode ser usada em qualquer ambiente Python. Se você normalmente trabalha com blocos de anotações Jupyter, Visual Studio Code, você pode instalar o Python SDK e se conectar ao espaço de trabalho.

Instalar o SDK do Python

Para instalar o SDK do Python em seu ambiente Python, você precisa do Python 3.7 ou posterior. Você pode instalar o pacote com pip:

pip install azure-ai-ml

Nota

Ao trabalhar com blocos de anotações no estúdio do Azure Machine Learning, o novo SDK do Python já está instalado ao usar o Python 3.10 ou posterior. Você pode usar o Python SDK v2 com versões anteriores do Python, mas você terá que instalá-lo primeiro.

Conectar-se ao espaço de trabalho

Depois que o SDK do Python for instalado, você precisará se conectar ao espaço de trabalho. Ao se conectar, você está autenticando seu ambiente para interagir com o espaço de trabalho para criar e gerenciar ativos e recursos.

Para autenticar, você precisa dos valores para três parâmetros necessários:

  • subscription_id: O seu ID de subscrição.
  • resource_group: O nome do seu grupo de recursos.
  • workspace_name: O nome do seu espaço de trabalho.

Em seguida, você pode definir a autenticação usando o seguinte código:

from azure.ai.ml import MLClient
from azure.identity import DefaultAzureCredential

ml_client = MLClient(
    DefaultAzureCredential(), subscription_id, resource_group, workspace
)

Depois de definir a autenticação, você precisa chamar MLClient o ambiente para se conectar ao espaço de trabalho. Você ligará MLClient sempre que quiser criar ou atualizar um ativo ou recurso no espaço de trabalho.

Por exemplo, você se conectará ao espaço de trabalho quando criar um novo trabalho para treinar um modelo:

from azure.ai.ml import command

# configure job
job = command(
    code="./src",
    command="python train.py",
    environment="AzureML-sklearn-0.24-ubuntu18.04-py37-cpu@latest",
    compute="aml-cluster",
    experiment_name="train-model"
)

# connect to workspace and submit job
returned_job = ml_client.create_or_update(job)

Utilize a documentação de referência

Para trabalhar eficientemente com o Python SDK, você precisará usar a documentação de referência. Na documentação de referência, você encontrará todas as classes, métodos e parâmetros possíveis disponíveis no SDK do Python.

A documentação de MLClient referência na classe inclui os métodos que você pode usar para se conectar e interagir com o espaço de trabalho. Além disso, ele também se vincula às operações possíveis para as várias entidades, como listar os armazenamentos de dados existentes em seu espaço de trabalho.

A documentação de referência também inclui uma lista das classes para todas as entidades com as quais você pode interagir. Por exemplo, existem classes separadas quando você deseja criar um armazenamento de dados vinculado a um Armazenamento de Blob do Azure ou a um Azure Data Lake Gen 2.

Ao selecionar uma classe específica como AmlCompute na lista de entidades, você pode encontrar uma página mais detalhada sobre como usar a classe e quais parâmetros ela aceita.