Exploración del SDK de Python
Importante
Actualmente, hay dos versiones del SDK de Python: versión 1 (v1) y versión 2 (v2). En el caso de los nuevos proyectos, debe usar v2 y, por lo tanto, el contenido de esta unidad solo cubre la versión 2. Obtenga más información sobre cómo decidir entre v1 y v2.
Los científicos de datos pueden usar Azure Machine Learning para entrenar, realizar un seguimiento y administrar modelos de aprendizaje automático. Como científico de datos, trabajará principalmente con los recursos del área de trabajo de Azure Machine Learning para las cargas de trabajo de aprendizaje automático.
Como la mayoría de los científicos de datos están familiarizados con Python, Azure Machine Learning ofrece un kit de desarrollo de software (SDK) para que pueda interactuar con el área de trabajo mediante Python.
El SDK de Python para Azure Machine Learning es una herramienta ideal para científicos de datos que se pueden usar en cualquier entorno de Python. Tanto si normalmente trabaja con cuadernos de Jupyter Notebook o Visual Studio Code, puede instalar el SDK de Python y conectarse al área de trabajo.
Instalación del SDK para Python
Para instalar el SDK de Python en el entorno de Python, necesita Python 3.7 o posterior. Puede instalar el paquete con pip
:
pip install azure-ai-ml
Nota
Al trabajar con cuadernos dentro de Estudio de Azure Machine Learning, el nuevo SDK de Python ya estará instalado al usar Python 3.10 o posterior. Puede usar el SDK de Python v2 con versiones anteriores de Python, pero primero tendrá que instalarlo.
Conexión a un área de trabajo
Una vez instalado el SDK de Python, deberá conectarse al área de trabajo. Al conectarse, va a autenticar el entorno para interactuar con el área de trabajo con el objetivo de crear y administrar recursos y activos.
Para autenticarse, necesita los valores en tres parámetros necesarios:
subscription_id
: el identificador de suscripción.resource_group
: el nombre del grupo de recursos.workspace_name
: el nombre del área de trabajo.
A continuación, puede definir la autenticación mediante el código siguiente:
from azure.ai.ml import MLClient
from azure.identity import DefaultAzureCredential
ml_client = MLClient(
DefaultAzureCredential(), subscription_id, resource_group, workspace
)
Después de definir la autenticación, debe llamar al método MLClient
del entorno para conectarse al área de trabajo. Llamará a MLClient
cada vez que quiera crear o actualizar un recurso o un recurso en el área de trabajo.
Por ejemplo, se conectará al área de trabajo al crear un nuevo trabajo para entrenar un modelo:
from azure.ai.ml import command
# configure job
job = command(
code="./src",
command="python train.py",
environment="AzureML-sklearn-0.24-ubuntu18.04-py37-cpu@latest",
compute="aml-cluster",
experiment_name="train-model"
)
# connect to workspace and submit job
returned_job = ml_client.create_or_update(job)
Uso de la documentación de referencia
Para trabajar eficazmente con el SDK de Python, deberá usar la documentación de referencia. En la documentación de referencia, encontrará todas las clases, métodos y parámetros posibles disponibles en el SDK de Python.
La documentación de referencia de la claseMLClient
incluye los métodos que puede usar para conectarse e interactuar con el área de trabajo. Además, también vincula a las posibles operaciones de las distintas entidades; por ejemplo, cómo mostrar los almacenes de datos del área de trabajo.|
La documentación de referencia también incluye una lista de las clases de todas las entidades con las que puede interactuar. Por ejemplo, existen clases independientes cuando desea crear un almacén de datos que se vincule a una instancia de Azure Blob Storage o a una instancia de Azure Data Lake Gen 2.
Al seleccionar una clase específica como AmlCompute
en la lista de entidades, puede encontrar una página más detallada sobre cómo usar la clase y qué parámetros acepta.