Explorar o SDK do Python
Importante
Atualmente, há duas versões do SDK do Python: versão 1 (v1) e versão 2 (v2). Em novos projetos, você deve usar v2, portanto, o conteúdo nesta unidade abrange apenas a v2. Saiba mais sobre como decidir entre a v1 e a v2.
Como cientista de dados, você pode usar o Azure Machine Learning para treinar, acompanhar e gerenciar seus modelos de machine learning. Como cientista de dados, você trabalhará principalmente com os ativos de suas cargas de trabalho de machine learning no workspace do Azure Machine Learning.
Como a maioria dos cientistas de dados está familiarizada com o Python, o Azure Machine Learning oferece um SDK (Software Development Kit) para que você possa interagir com o workspace usando o Python.
O SDK do Python para o Azure Machine Learning é a ferramenta ideal para cientistas de dados e pode ser usado em qualquer ambiente do Python. Se você normalmente trabalha com notebooks Jupyter, Visual Studio Code, pode instalar o SDK do Python e se conectar ao workspace.
Instalar o SDK do Python
Para instalar o SDK do Python em seu ambiente do Python, você precisa do Python 3.7 ou posterior. Você pode instalar o agente com pip
:
pip install azure-ai-ml
Observação
Ao trabalhar com notebooks no Estúdio do Azure Machine Learning, o novo SDK do Python já está instalado ao usar o Python 3.10 ou posterior. Você pode usar o SDK do Python v2 com versões anteriores do Python, mas primeiro precisará instalá-lo.
Conectar-se ao workspace
Depois que o SDK do Python for instalado, você precisará se conectar ao workspace. Ao se conectar, você autenticará seu ambiente para interagir com o workspace a fim de criar e gerenciar ativos e recursos.
Para se autenticar, você precisa dos valores dos três parâmetros necessários:
subscription_id
: sua ID da assinatura.resource_group
: o nome do grupo de recursos.workspace_name
: o nome de seu workspace.
Em seguida, você pode definir a autenticação usando o seguinte código:
from azure.ai.ml import MLClient
from azure.identity import DefaultAzureCredential
ml_client = MLClient(
DefaultAzureCredential(), subscription_id, resource_group, workspace
)
Depois de definir a autenticação, você precisa chamar MLClient
para o ambiente se conectar ao workspace. Você chamará MLClient
sempre que quiser criar ou atualizar um ativo ou recurso no workspace.
Por exemplo, você se conectará ao workspace ao criar um novo trabalho para treinar um modelo:
from azure.ai.ml import command
# configure job
job = command(
code="./src",
command="python train.py",
environment="AzureML-sklearn-0.24-ubuntu18.04-py37-cpu@latest",
compute="aml-cluster",
experiment_name="train-model"
)
# connect to workspace and submit job
returned_job = ml_client.create_or_update(job)
Usar a documentação de referência
Para trabalhar de forma eficiente com o SDK do Python, você precisará usar a documentação de referência. Na documentação de referência, você encontrará todas as possíveis classes, métodos e parâmetros disponíveis no SDK do Python.
A documentação de referência na classe MLClient
inclui os métodos que você pode usar para se conectar e interagir com o workspace. E também se vincula às possíveis operações das várias entidades, como ao listar os armazenamentos de dados existentes no workspace.
A documentação de referência também inclui uma lista das classes para todas as entidades com as quais você pode interagir. Por exemplo, existem classes separadas quando você deseja criar um armazenamento de dados que se vincule a um Armazenamento de Blobs do Azure ou a um Azure Data Lake Gen 2.
Ao selecionar uma classe específica como AmlCompute
na lista de entidades, você pode encontrar uma página mais detalhada sobre como usar a classe e quais parâmetros ela aceita.