Esplora l'SDK di Python
Importante
Attualmente sono disponibili due versioni di Python SDK: versione 1 (v1) e versione 2 (v2). Per tutti i nuovi progetti, è consigliabile usare v2 e pertanto il contenuto in questa unità copre solo v2. Scopri di più su la scelta tra v1 e v2.
I data scientist possono usare Azure Machine Learning per eseguire il training, tenere traccia e gestire i modelli di Machine Learning. In qualità di data scientist, si useranno principalmente gli asset all'interno dell'area di lavoro di Azure Machine Learning per i carichi di lavoro di Machine Learning.
Poiché la maggior parte dei data scientist ha familiarità con Python, Azure Machine Learning offre un software development kit (SDK) in modo da poter interagire con l'area di lavoro usando Python.
Python SDK per Azure Machine Learning è uno strumento ideale per i data scientist che possono essere usati in qualsiasi ambiente Python. Indipendentemente dal fatto che si lavori normalmente con notebook di Jupyter, Visual Studio Code, è possibile installare Python SDK e connettersi all'area di lavoro.
Installare Python SDK
Per installare Python SDK nell'ambiente Python, è necessario Python 3.7 o versione successiva. È possibile installare il pacchetto con pip
:
pip install azure-ai-ml
Nota
Quando si usano notebook all'interno di Azure Machine Learning Studio, il nuovo SDK python è già installato quando si usa Python 3.10 o versione successiva. È possibile usare Python SDK v2 con le versioni precedenti di Python, ma sarà prima necessario installarlo.
Connettersi all'area di lavoro
Dopo aver installato Python SDK, è necessario connettersi all'area di lavoro. Collegandoti, stai autenticando il tuo ambiente per interagire con lo spazio di lavoro per creare e gestire asset e risorse.
Per eseguire l'autenticazione, sono necessari i valori per tre parametri necessari:
-
subscription_id
: ID sottoscrizione. -
resource_group
: nome del gruppo di risorse. -
workspace_name
: nome dell'area di lavoro.
Successivamente, è possibile definire l'autenticazione usando il codice seguente:
from azure.ai.ml import MLClient
from azure.identity import DefaultAzureCredential
ml_client = MLClient(
DefaultAzureCredential(), subscription_id, resource_group, workspace
)
Dopo aver definito l'autenticazione, è necessario chiamare MLClient
affinché l'ambiente si connetta all'area di lavoro. Chiamerai MLClient
ogni volta che vuoi creare o aggiornare un asset o una risorsa nell'area di lavoro.
Ad esempio, si connetterà all'area di lavoro quando si crea un nuovo processo per eseguire il training di un modello:
from azure.ai.ml import command
# configure job
job = command(
code="./src",
command="python train.py",
environment="AzureML-sklearn-0.24-ubuntu18.04-py37-cpu@latest",
compute="aml-cluster",
experiment_name="train-model"
)
# connect to workspace and submit job
returned_job = ml_client.create_or_update(job)
Usare la documentazione di riferimento
Per usare in modo efficiente Python SDK, è necessario usare la documentazione di riferimento. Nella documentazione di riferimento sono disponibili tutte le classi, i metodi e i parametri possibili all'interno di Python SDK.
La documentazione di riferimento sulla classe MLClient
include i metodi che è possibile usare per connettersi e interagire con l'area di lavoro. Inoltre, collega anche alle possibili operazioni per le varie entità, ad esempio come elencare gli archivi dati esistenti nell'area di lavoro.
La documentazione di riferimento include anche un elenco delle classi per tutte le entità con cui è possibile interagire. Ad esempio, esistono classi separate quando si vuole creare un archivio dati che si collega a un archivio BLOB di Azure o a un'istanza di Azure Data Lake Gen 2.
Selezionando una classe specifica come AmlCompute
dall'elenco di entità, è possibile trovare una pagina più dettagliata su come usare la classe e su quali parametri accetta.