Migración del registro del SDK v1 a SDK v2

Artículo
02/05/2025

Azure Machine Learning solo usa el seguimiento de MLflow para el registro de métricas y el almacenamiento de artefactos para los experimentos, tanto si los ha creado a través del SDK de Python de Azure Machine Learning, la CLI de Azure Machine Learning o Azure Machine Learning studio. Se recomienda usar MLflow para realizar el seguimiento de experimentos.

Si va a actualizar de SDK v1 a SDK v2, use la información de esta sección para comprender los equivalentes de MLflow de las API de registro de SDK v1.

¿Por qué MLflow?

MLflow, con más de 13 millones de descargas mensuales, se ha convertido en la plataforma estándar para MLOps de un extremo a otro, lo que permite a los equipos de todos los tamaños realizar un seguimiento, compartir, empaquetar e implementar cualquier modelo para la inferencia por lotes o en tiempo real. Azure Machine Learning se integra con MLflow, lo que permite que tu código de capacitación logre una verdadera portabilidad y una integración perfecta con otras plataformas, ya que no contiene instrucciones específicas de Azure Machine Learning.

Preparación para la migración a MLflow

Para usar el seguimiento de MLflow, debes instalar el paquete SDK de Mlflow mlflow y el complemento Azure Machine Learning para MLflow azureml-mlflow. Todos los entornos de Azure Machine Learning ya tienen estos paquetes disponibles, pero tendrás que incluirlos si crea su propio entorno.

pip install mlflow azureml-mlflow

Conexión con su área de trabajo

Azure Machine Learning permite a los usuarios realizar el seguimiento en trabajos de entrenamiento que se ejecutan en el área de trabajo o ejecutarse de forma remota (seguimiento de experimentos que se ejecutan fuera de Azure Machine Learning). Si realizas el seguimiento remoto, deberás indicar el área de trabajo a la que desea conectar MLflow.

Proceso de Azure Machine Learning
Proceso remoto

Ya está conectado al área de trabajo cuando se ejecuta en el proceso de Azure Machine Learning.

Configurar URI de seguimiento

Obtenga el URI de seguimiento del área de trabajo:
SE APLICA A:Extensión de ML de la CLI de Azure v2 (actual)
1. Inicie sesión y configure su área de trabajo:
```
az account set --subscription <subscription-ID>
az configure --defaults workspace=<workspace-name> group=<resource-group-name> location=<location> 
```
2. Obtenga el URI de seguimiento utilizando el comando az ml workspace:
```
az ml workspace show --query mlflow_tracking_uri
```
SE APLICA A: SDK de Python azure-ai-ml v2 (actual)

Puede usar el SDK v2 de Azure Machine Learning para Python para obtener el URI de seguimiento de MLflow de Azure Machine Learning. Asegúrese de que la biblioteca de azure-ai-ml esté instalada en la instancia de proceso. A continuación, use el código siguiente para obtener el URI de seguimiento de MLFLow único asociado al área de trabajo.
1. Use una instancia de MLClient para iniciar sesión en el área de trabajo. Hay dos opciones para iniciar sesión:
  - La manera más fácil es usar el archivo de configuración del área de trabajo:
    
    from azure.ai.ml import MLClient from azure.identity import DefaultAzureCredential ml_client = MLClient.from_config(credential=DefaultAzureCredential())
    
    Sugerencia
    
    Para descargar el archivo de configuración del área de trabajo, siga estos pasos:
    
    Vaya a Azure Machine Learning Studio.
    
    En la esquina superior derecha, seleccione el nombre del área de trabajo.
    
    En la ventana Directorio + Suscripción + Área de trabajo, seleccione Descargar archivo de configuración.
    
    Guarde el archivo config.json en el directorio en el que está trabajando.
  - También puede utilizar el id. de suscripción, el nombre del grupo de recursos y el nombre del área de trabajo para iniciar sesión:
    
    from azure.ai.ml import MLClient from azure.identity import DefaultAzureCredential # Enter information about your Azure Machine Learning workspace. subscription_id = "<subscription-ID>" resource_group = "<resource-group-name>" workspace_name = "<workspace-name>" ml_client = MLClient(credential=DefaultAzureCredential(), subscription_id=subscription_id, resource_group_name=resource_group, workspace_name=workspace_name)
    
    Importante
    
    El método DefaultAzureCredential intenta extraer las credenciales del contexto disponible. Sin embargo, es posible que quiera especificar credenciales de una manera diferente, por ejemplo, mediante el uso del explorador web de forma interactiva. En estos casos, puede usar InteractiveBrowserCredential o cualquier otro método disponible en el paquete de azure.identity.
2. Obtenga el URI de seguimiento de Azure Machine Learning:
```
mlflow_tracking_uri = ml_client.workspaces.get(ml_client.workspace_name).mlflow_tracking_uri
```
Utilice el Estudio de Azure Machine Learning para obtener el URI de seguimiento:
1. Abra el Estudio de Azure Machine Learning y use sus credenciales para iniciar sesión.
2. En la esquina superior derecha, seleccione el nombre del área de trabajo.
3. En la ventana Directorio + Suscripción + Área de trabajo, seleccione Ver todas las propiedades en Azure Portal. La página de recursos del área de trabajo se abre en Azure Portal.
4. En Información esencial, copie el valor del URI de seguimiento de MLflow.
Puede construir manualmente el URI de seguimiento de Azure Machine Learning. Necesita el identificador de suscripción, la región en la que se implementa el área de trabajo, el nombre del grupo de recursos y el nombre del área de trabajo. Para obtener el URI, escriba dichos valores en el código siguiente:

Advertencia

Si usa un área de trabajo con vínculo privado, el punto de conexión de MLflow también utiliza un vínculo privado para comunicarse con Azure Machine Learning. Como resultado, el URI de seguimiento usa un formato diferente del de este artículo. En este caso, debe usar el SDK de Azure Machine Learning para Python o la CLI v2 de Azure Machine Learning para obtener el URI de seguimiento.
```
region = "<region>"
subscription_id = "<subscription-ID>"
resource_group = "<resource-group-name>"
workspace_name = "<workspace-name>"

mlflow_tracking_uri = f"azureml://{region}.api.azureml.ms/mlflow/v1.0/subscriptions/{subscription_id}/resourceGroups/{resource_group}/providers/Microsoft.MachineLearningServices/workspaces/{workspace_name}"
```
Configure el URI de seguimiento:
- MLflow SDK
- Variables de entorno
Use el método set_tracking_uri() para establecer el URI de seguimiento de MLflow en el URI de seguimiento del área de trabajo.
```
import mlflow

mlflow.set_tracking_uri(mlflow_tracking_uri)
```
En la instancia de proceso, use el código siguiente para establecer la variable de entorno de MLflow MLFLOW_TRACKING_URI en el URI de seguimiento del área de trabajo. Esta asignación hace que todas las interacciones con MLflow en esa instancia de proceso apunten a Azure Machine Learning de forma predeterminada. Para obtener más información, consulte Funciones de registro.
```
MLFLOW_TRACKING_URI=$(az ml workspace show --query mlflow_tracking_uri | sed 's/"//g') 
```
Sugerencia

Algunos escenarios implican trabajar en un entorno compartido, como un clúster de Azure Databricks o un clúster de Azure Synapse Analytics. En estos casos, resulta útil establecer la variable de entorno MLFLOW_TRACKING_URI en el nivel de clúster en lugar de hacerlo para cada sesión. Al establecer la variable en el nivel de clúster, se configura automáticamente el URI de seguimiento de MLflow para que apunte a Azure Machine Learning en todas las sesiones del clúster.

Configurar la autenticación

Una vez configurado el seguimiento, también deberás configurar cómo se debe realizar la autenticación en el área de trabajo asociada. De forma predeterminada, el complemento de Azure Machine Learning para MLflow realiza la autenticación interactiva abriendo el explorador predeterminado para solicitar las credenciales. Consulte Configuración de MLflow para Azure Machine Learning: Configuración de la autenticación para conocer más formas de configurar la autenticación para MLflow en áreas de trabajo de Azure Machine Learning.

Para los trabajos interactivos en los que hay un usuario conectado a la sesión, puede confiar en la autenticación interactiva. No es necesario hacer nada.

Advertencia

Explorador interactivo autenticación bloquea la ejecución del código cuando solicita credenciales. Este enfoque no es adecuado para la autenticación en entornos desatendidos, como los trabajos de entrenamiento. Se recomienda configurar un modo de autenticación diferente en esos entornos.

En escenarios que requieren una ejecución desasistida, debe configurar una entidad de servicio para comunicarse con Azure Machine Learning. Para obtener información sobre cómo crear una entidad de servicio, consulte Configurar una entidad de servicio.

Use el identificador de inquilino, el identificador de cliente y el secreto de cliente de la entidad de servicio en el código siguiente:

MLflow SDK
Variables de entorno

import os

os.environ["AZURE_TENANT_ID"] = "<Azure-tenant-ID>"
os.environ["AZURE_CLIENT_ID"] = "<Azure-client-ID>"
os.environ["AZURE_CLIENT_SECRET"] = "<Azure-client-secret>"

export AZURE_TENANT_ID="<Azure-tenant-ID>"
export AZURE_CLIENT_ID="<Azure-client-ID>"
export AZURE_CLIENT_SECRET="<Azure-client-secret>"

Sugerencia

Al trabajar en entornos compartidos, se recomienda configurar estas variables de entorno en el nivel de proceso. Como práctica recomendada, adminístrelos como secretos en una instancia de Azure Key Vault.

Por ejemplo, en una configuración de clúster de Azure Databricks, puede usar secretos en variables de entorno de la siguiente manera: AZURE_CLIENT_SECRET={{secrets/<scope-name>/<secret-name>}}. Para obtener más información sobre la implementación de este enfoque en Azure Databricks, consulte Referencia a un secreto en una variable de entorno o consulte la documentación de su plataforma.

Experimentos y ejecuciones

SDK v1

from azureml.core import Experiment

# create an Azure Machine Learning experiment and start a run
experiment = Experiment(ws, "create-experiment-sdk-v1")
azureml_run = experiment.start_logging()

SDK v2 con MLflow

# Set the MLflow experiment and start a run
mlflow.set_experiment("logging-with-mlflow")
mlflow_run = mlflow.start_run()

Comparación de API de registro

Registro de una métrica de tipo entero o float

SDK v1

azureml_run.log("sample_int_metric", 1)

SDK v2 con MLflow

mlflow.log_metric("sample_int_metric", 1)

Registro de un valor booleano

SDK v1

azureml_run.log("sample_boolean_metric", True)

SDK v2 con MLflow

mlflow.log_metric("sample_boolean_metric", 1)

Registro de una métrica de cadena

SDK v1

azureml_run.log("sample_string_metric", "a_metric")

SDK v2 con MLflow

mlflow.log_text("sample_string_text", "string.txt")

La cadena se registra como un artefacto, no como una métrica. En Estudio de Azure Machine Learning, el valor se muestra en la pestaña Salidas y registros.

Registro de una imagen en un archivo PNG o JPEG

SDK v1

azureml_run.log_image("sample_image", path="Azure.png")

SDK v2 con MLflow

mlflow.log_artifact("Azure.png")

La imagen se registra como un artefacto y aparece en la pestaña Imágenes de Estudio de Azure Machine Learning.

Registro de un elemento matplotlib.pyplot

SDK v1

import matplotlib.pyplot as plt

plt.plot([1, 2, 3])
azureml_run.log_image("sample_pyplot", plot=plt)

SDK v2 con MLflow

import matplotlib.pyplot as plt

plt.plot([1, 2, 3])
fig, ax = plt.subplots()
ax.plot([0, 1], [2, 3])
mlflow.log_figure(fig, "sample_pyplot.png")

La imagen se registra como un artefacto y aparece en la pestaña Imágenes de Estudio de Azure Machine Learning.

Registro de una lista de métricas

SDK v1

list_to_log = [1, 2, 3, 2, 1, 2, 3, 2, 1]
azureml_run.log_list('sample_list', list_to_log)

SDK v2 con MLflow

list_to_log = [1, 2, 3, 2, 1, 2, 3, 2, 1]
from mlflow.entities import Metric
from mlflow.tracking import MlflowClient
import time

metrics = [Metric(key="sample_list", value=val, timestamp=int(time.time() * 1000), step=0) for val in list_to_log]
MlflowClient().log_batch(mlflow_run.info.run_id, metrics=metrics)

Las métricas aparecen en la pestaña Métricas de Estudio de Azure Machine Learning.
No se admiten los valores de texto.

Registro de una fila de métricas

SDK v1

azureml_run.log_row("sample_table", col1=5, col2=10)

SDK v2 con MLflow

metrics = {"sample_table.col1": 5, "sample_table.col2": 10}
mlflow.log_metrics(metrics)

Las métricas no se representan como una tabla en Estudio de Azure Machine Learning.
No se admiten los valores de texto.
Se registra como un artefacto, no como una métrica.

Registro de una tabla

SDK v1

table = {
"col1" : [1, 2, 3],
"col2" : [4, 5, 6]
}
azureml_run.log_table("table", table)

SDK v2 con MLflow

# Add a metric for each column prefixed by metric name. Similar to log_row
row1 = {"table.col1": 5, "table.col2": 10}
# To be done for each row in the table
mlflow.log_metrics(row1)

# Using mlflow.log_artifact
import json

with open("table.json", 'w') as f:
json.dump(table, f)
mlflow.log_artifact("table.json")

Registra las métricas de cada columna.
Las métricas no se representan como una tabla en Estudio de Azure Machine Learning.
No se admiten los valores de texto.
Se registra como un artefacto, no como una métrica.

Registro de una tabla de precisión

SDK v1

ACCURACY_TABLE = '{"schema_type": "accuracy_table", "schema_version": "v1", "data": {"probability_tables": ' +\
        '[[[114311, 385689, 0, 0], [0, 0, 385689, 114311]], [[67998, 432002, 0, 0], [0, 0, ' + \
        '432002, 67998]]], "percentile_tables": [[[114311, 385689, 0, 0], [1, 0, 385689, ' + \
        '114310]], [[67998, 432002, 0, 0], [1, 0, 432002, 67997]]], "class_labels": ["0", "1"], ' + \
        '"probability_thresholds": [0.52], "percentile_thresholds": [0.09]}}'

azureml_run.log_accuracy_table('v1_accuracy_table', ACCURACY_TABLE)

SDK v2 con MLflow

ACCURACY_TABLE = '{"schema_type": "accuracy_table", "schema_version": "v1", "data": {"probability_tables": ' +\
        '[[[114311, 385689, 0, 0], [0, 0, 385689, 114311]], [[67998, 432002, 0, 0], [0, 0, ' + \
        '432002, 67998]]], "percentile_tables": [[[114311, 385689, 0, 0], [1, 0, 385689, ' + \
        '114310]], [[67998, 432002, 0, 0], [1, 0, 432002, 67997]]], "class_labels": ["0", "1"], ' + \
        '"probability_thresholds": [0.52], "percentile_thresholds": [0.09]}}'

mlflow.log_dict(ACCURACY_TABLE, 'mlflow_accuracy_table.json')

Las métricas no se representan como una tabla de precisión en Estudio de Azure Machine Learning.
Se registra como un artefacto, no como una métrica.
El método mlflow.log_dict es experimental.

Registro de una matriz de confusión

SDK v1

CONF_MATRIX = '{"schema_type": "confusion_matrix", "schema_version": "v1", "data": {"class_labels": ' + \
    '["0", "1", "2", "3"], "matrix": [[3, 0, 1, 0], [0, 1, 0, 1], [0, 0, 1, 0], [0, 0, 0, 1]]}}'

azureml_run.log_confusion_matrix('v1_confusion_matrix', json.loads(CONF_MATRIX))

SDK v2 con MLflow

CONF_MATRIX = '{"schema_type": "confusion_matrix", "schema_version": "v1", "data": {"class_labels": ' + \
    '["0", "1", "2", "3"], "matrix": [[3, 0, 1, 0], [0, 1, 0, 1], [0, 0, 1, 0], [0, 0, 0, 1]]}}'

mlflow.log_dict(CONF_MATRIX, 'mlflow_confusion_matrix.json')

Las métricas no se representan como una matriz de confusión en Estudio de Azure Machine Learning.
Se registra como un artefacto, no como una métrica.
El método mlflow.log_dict es experimental.

Registro de predicciones

SDK v1

PREDICTIONS = '{"schema_type": "predictions", "schema_version": "v1", "data": {"bin_averages": [0.25,' + \
    ' 0.75], "bin_errors": [0.013, 0.042], "bin_counts": [56, 34], "bin_edges": [0.0, 0.5, 1.0]}}'

azureml_run.log_predictions('test_predictions', json.loads(PREDICTIONS))

SDK v2 con MLflow

PREDICTIONS = '{"schema_type": "predictions", "schema_version": "v1", "data": {"bin_averages": [0.25,' + \
    ' 0.75], "bin_errors": [0.013, 0.042], "bin_counts": [56, 34], "bin_edges": [0.0, 0.5, 1.0]}}'

mlflow.log_dict(PREDICTIONS, 'mlflow_predictions.json')

Las métricas no se representan como una matriz de confusión en Estudio de Azure Machine Learning.
Se registra como un artefacto, no como una métrica.
El método mlflow.log_dict es experimental.

Registro de valores residuales

SDK v1

RESIDUALS = '{"schema_type": "residuals", "schema_version": "v1", "data": {"bin_edges": [100, 200, 300], ' + \
'"bin_counts": [0.88, 20, 30, 50.99]}}'

azureml_run.log_residuals('test_residuals', json.loads(RESIDUALS))

SDK v2 con MLflow

RESIDUALS = '{"schema_type": "residuals", "schema_version": "v1", "data": {"bin_edges": [100, 200, 300], ' + \
'"bin_counts": [0.88, 20, 30, 50.99]}}'

mlflow.log_dict(RESIDUALS, 'mlflow_residuals.json')

Las métricas no se representan como una matriz de confusión en Estudio de Azure Machine Learning.
Se registra como un artefacto, no como una métrica.
El método mlflow.log_dict es experimental.

Visualización de la información y los datos de ejecución

Puede acceder a la información de ejecución mediante las propiedades data y info del objeto de ejecución de MLflow (mlflow.entities.Run).

Sugerencia

La información de seguimiento de experimentos y ejecuciones en Azure Machine Learning se puede consultar mediante MLflow, que proporciona una API de búsqueda integral para consultar y buscar experimentos y ejecuciones fácilmente, y comparar resultados rápidamente. Para obtener más información sobre todas las funcionalidades de MLflow en esta dimensión, consulte Query & compare experiments and runs with MLflow (Consulta y comparación de experimentos y ejecuciones con MLflow).

En el ejemplo siguiente se muestra cómo recuperar una ejecución finalizada:

from mlflow.tracking import MlflowClient

# Use MlFlow to retrieve the run that was just completed
client = MlflowClient()
finished_mlflow_run = MlflowClient().get_run("<RUN_ID>")

En el ejemplo siguiente se muestra cómo ver los elementos metrics, tags y params:

metrics = finished_mlflow_run.data.metrics
tags = finished_mlflow_run.data.tags
params = finished_mlflow_run.data.params

Nota:

metrics solo tendrá el valor que se haya registrado más recientemente en una métrica determinada. Por ejemplo, si inicia sesión según el orden de los valores 1, 2, 3 y, por último, 4 en una métrica denominada sample_metric, solo 4 estará presente en el diccionario metrics. Para obtener todas las métricas registradas en una métrica con nombre específica, use MlFlowClient.get_metric_history:

with mlflow.start_run() as multiple_metrics_run:
    mlflow.log_metric("sample_metric", 1)
    mlflow.log_metric("sample_metric", 2)
    mlflow.log_metric("sample_metric", 3)
    mlflow.log_metric("sample_metric", 4)

print(client.get_run(multiple_metrics_run.info.run_id).data.metrics)
print(client.get_metric_history(multiple_metrics_run.info.run_id, "sample_metric"))

Para obtener más información, consulte la referencia MlFlowClient.

El campo info proporciona información general sobre la ejecución, como la hora de inicio, el id. de ejecución, el id.de experimento, etc.:

run_start_time = finished_mlflow_run.info.start_time
run_experiment_id = finished_mlflow_run.info.experiment_id
run_id = finished_mlflow_run.info.run_id

Visualización de artefactos de ejecución

Para ver los artefactos de una ejecución, puede usar MlFlowClient.list_artifacts:

client.list_artifacts(finished_mlflow_run.info.run_id)

Para descargar un artefacto, usa MlFlowClient.download_artifacts:

mlflow.artifacts.download_artifacts(run_id=finished_mlflow_run.info.run_id, artifact_path="Azure.png")

Compartir a través de

Migración del registro del SDK v1 a SDK v2

¿Por qué MLflow?

Preparación para la migración a MLflow

Conexión con su área de trabajo

Experimentos y ejecuciones

Comparación de API de registro

Registro de una métrica de tipo entero o float

Registro de un valor booleano

Registro de una métrica de cadena

Registro de una imagen en un archivo PNG o JPEG

Registro de un elemento matplotlib.pyplot

Registro de una lista de métricas

Registro de una fila de métricas

Registro de una tabla

Registro de una tabla de precisión

Registro de una matriz de confusión

Registro de predicciones

Registro de valores residuales

Visualización de la información y los datos de ejecución

Visualización de artefactos de ejecución

Pasos siguientes

Comentarios

Recursos adicionales