Logboekregistratie migreren van SDK v1 naar SDK v2

Artikel
02/05/2025

Azure Machine Learning maakt gebruik van MLflow Tracking voor metrische logboekregistratie en artefactopslag voor uw experimenten, ongeacht of u de experimenten hebt gemaakt via de Azure Machine Learning Python SDK, de Azure Machine Learning CLI of Azure Machine Learning-studio. U wordt aangeraden MLflow te gebruiken voor het bijhouden van experimenten.

Als u een upgrade uitvoert van SDK v1 naar SDK v2, gebruikt u de informatie in deze sectie om inzicht te hebben in de MLflow-equivalenten van SDK v1-logboekregistratie-API's.

Waarom MLflow?

MLflow, met meer dan 13 miljoen maandelijkse downloads, is het standaardplatform geworden voor end-to-end MLOps, waardoor teams van alle grootten elk model kunnen bijhouden, delen, verpakken en implementeren voor batch- of realtimedeductie. Azure Machine Learning kan worden geïntegreerd met MLflow, waarmee uw trainingscode echte draagbaarheid en naadloze integratie met andere platforms kan bereiken, omdat deze geen specifieke Instructies voor Azure Machine Learning bevat.

Voorbereiden voor migratie naar MLflow

Als u MLflow-tracering wilt gebruiken, moet u het Mlflow SDK-pakket mlflow en de Azure Machine Learning-invoegtoepassing voor MLflow azureml-mlflowinstalleren. Alle Azure Machine Learning-omgevingen hebben deze pakketten al voor u beschikbaar, maar u moet ze opnemen als u uw eigen omgeving maakt.

pip install mlflow azureml-mlflow

Verbinding maken met uw werkruimte

Met Azure Machine Learning kunnen gebruikers bijhouden in trainingstaken die worden uitgevoerd in uw werkruimte of extern worden uitgevoerd (bijhouden van experimenten die buiten Azure Machine Learning worden uitgevoerd). Als u externe tracering uitvoert, moet u de werkruimte aangeven waarmee u MLflow wilt verbinden.

Azure Machine Learning-rekenproces
Externe rekenkracht

U bent al verbonden met uw werkruimte wanneer deze wordt uitgevoerd op Azure Machine Learning Compute.

Tracerings-URI configureren

Haal de tracerings-URI voor uw werkruimte op:
- Azure-CLI
- Python SDK
- Studio
- Handmatig
VAN TOEPASSING OP: Azure CLI ml-extensie v2 (huidige)
1. Meld u aan en configureer uw werkruimte:
```
az account set --subscription <subscription-ID>
az configure --defaults workspace=<workspace-name> group=<resource-group-name> location=<location> 
```
2. Haal de tracerings-URI op met behulp van de az ml workspace opdracht:
```
az ml workspace show --query mlflow_tracking_uri
```
VAN TOEPASSING OP: Python SDK azure-ai-ml v2 (actueel)

U kunt de Azure Machine Learning SDK v2 voor Python gebruiken om de URI voor het bijhouden van Azure Machine Learning MLflow op te halen. Zorg ervoor dat de azure-ai-ml bibliotheek is geïnstalleerd in uw rekenproces. Gebruik vervolgens de volgende code om de unieke MLFLow-tracerings-URI op te halen die is gekoppeld aan uw werkruimte.
1. Gebruik een exemplaar om MLClient u aan te melden bij uw werkruimte. Er zijn twee opties voor aanmelden:
  - De eenvoudigste manier is om het configuratiebestand voor de werkruimte te gebruiken:
    
    from azure.ai.ml import MLClient from azure.identity import DefaultAzureCredential ml_client = MLClient.from_config(credential=DefaultAzureCredential())
    
    Tip
    
    U kunt het configuratiebestand voor de werkruimte downloaden door de volgende stappen uit te voeren:
    
    Ga naar Azure Machine Learning-studio.
    
    Selecteer in de rechterbovenhoek de naam van uw werkruimte.
    
    Selecteer in het venster Map + Abonnement + Werkruimte de optie Configuratiebestand downloaden.
    
    Sla het config.json bestand op in de map waarin u werkt.
  - U kunt ook uw abonnements-id, resourcegroepnaam en werkruimtenaam gebruiken om u aan te melden:
    
    from azure.ai.ml import MLClient from azure.identity import DefaultAzureCredential # Enter information about your Azure Machine Learning workspace. subscription_id = "<subscription-ID>" resource_group = "<resource-group-name>" workspace_name = "<workspace-name>" ml_client = MLClient(credential=DefaultAzureCredential(), subscription_id=subscription_id, resource_group_name=resource_group, workspace_name=workspace_name)
    
    Belangrijk
    
    De DefaultAzureCredential methode probeert referenties op te halen uit de beschikbare context. Maar misschien wilt u referenties op een andere manier opgeven, bijvoorbeeld door de webbrowser op een interactieve manier te gebruiken. In deze gevallen kunt u of een andere methode gebruiken InteractiveBrowserCredential die beschikbaar is in het azure.identity pakket.
2. Haal de azure Machine Learning-tracerings-URI op:
```
mlflow_tracking_uri = ml_client.workspaces.get(ml_client.workspace_name).mlflow_tracking_uri
```
Gebruik Azure Machine Learning-studio om de tracerings-URI op te halen:
1. Open Azure Machine Learning-studio en gebruik uw referenties om u aan te melden.
2. Selecteer in de rechterbovenhoek de naam van uw werkruimte.
3. Selecteer in het venster Directory + Abonnement + Werkruimte alle eigenschappen weergeven in De Azure-portal. De resourcepagina voor uw werkruimte wordt geopend in Azure Portal.
4. Kopieer onder Essentials de URI-waarde voor het bijhouden van MLflow.
U kunt de azure Machine Learning-tracerings-URI handmatig maken. U hebt uw abonnements-id nodig, de regio waarin uw werkruimte is geïmplementeerd, de naam van uw resourcegroep en de naam van uw werkruimte. Als u de URI wilt ophalen, voert u deze waarden in de volgende code in:

Waarschuwing

Als u een werkruimte met private link-functionaliteit gebruikt, gebruikt het MLflow-eindpunt ook een privékoppeling om te communiceren met Azure Machine Learning. Als gevolg hiervan gebruikt de tracerings-URI een andere indeling dan die in dit artikel. In dit geval moet u de Azure Machine Learning SDK voor Python of de Azure Machine Learning CLI v2 gebruiken om de tracerings-URI op te halen.
```
region = "<region>"
subscription_id = "<subscription-ID>"
resource_group = "<resource-group-name>"
workspace_name = "<workspace-name>"

mlflow_tracking_uri = f"azureml://{region}.api.azureml.ms/mlflow/v1.0/subscriptions/{subscription_id}/resourceGroups/{resource_group}/providers/Microsoft.MachineLearningServices/workspaces/{workspace_name}"
```
Configureer de tracerings-URI:
- MLflow SDK
- Omgevingsvariabelen
Gebruik de set_tracking_uri() methode om de MLflow-tracerings-URI in te stellen op de tracerings-URI van uw werkruimte.
```
import mlflow

mlflow.set_tracking_uri(mlflow_tracking_uri)
```
Gebruik in uw rekenproces de volgende code om de MLFLOW_TRACKING_URI omgevingsvariabele MLflow in te stellen op de tracerings-URI van uw werkruimte. Deze toewijzing zorgt ervoor dat alle interacties met MLflow in dat rekenproces standaard verwijzen naar Azure Machine Learning. Zie Logboekregistratiefuncties voor meer informatie.
```
MLFLOW_TRACKING_URI=$(az ml workspace show --query mlflow_tracking_uri | sed 's/"//g') 
```
Tip

Sommige scenario's omvatten het werken in een gedeelde omgeving, zoals een Azure Databricks-cluster of een Azure Synapse Analytics-cluster. In deze gevallen is het handig om de MLFLOW_TRACKING_URI omgevingsvariabele in te stellen op clusterniveau in plaats van voor elke sessie. Als u de variabele instelt op clusterniveau, wordt de MLflow-tracerings-URI automatisch geconfigureerd om naar Azure Machine Learning te verwijzen voor alle sessies in het cluster.

Verificatie configureren

Zodra het bijhouden is geconfigureerd, moet u ook configureren hoe de verificatie moet gebeuren met de bijbehorende werkruimte. De Azure Machine Learning-invoegtoepassing voor MLflow voert standaard interactieve verificatie uit door de standaardbrowser te openen om om referenties te vragen. Raadpleeg MLflow configureren voor Azure Machine Learning: verificatie configureren voor meer manieren om verificatie voor MLflow in Azure Machine Learning-werkruimten te configureren.

Voor interactieve taken waarbij er een gebruiker is verbonden met de sessie, kunt u vertrouwen op interactieve verificatie. Er is geen verdere actie vereist.

Waarschuwing

Met interactieve browserverificatie wordt de uitvoering van code geblokkeerd wanneer er om referenties wordt gevraagd. Deze benadering is niet geschikt voor verificatie in omgevingen zonder toezicht, zoals trainingstaken. U wordt aangeraden een andere verificatiemodus in deze omgevingen te configureren.

Voor scenario's waarvoor uitvoering zonder toezicht is vereist, moet u een service-principal configureren om te communiceren met Azure Machine Learning. Zie Een service-principal configureren voor informatie over het maken van een service-principal.

Gebruik de tenant-id, client-id en het clientgeheim van uw service-principal in de volgende code:

MLflow SDK
Omgevingsvariabelen

import os

os.environ["AZURE_TENANT_ID"] = "<Azure-tenant-ID>"
os.environ["AZURE_CLIENT_ID"] = "<Azure-client-ID>"
os.environ["AZURE_CLIENT_SECRET"] = "<Azure-client-secret>"

export AZURE_TENANT_ID="<Azure-tenant-ID>"
export AZURE_CLIENT_ID="<Azure-client-ID>"
export AZURE_CLIENT_SECRET="<Azure-client-secret>"

Tip

Wanneer u in gedeelde omgevingen werkt, raden we u aan deze omgevingsvariabelen op rekenniveau te configureren. Als best practice kunt u ze beheren als geheimen in een exemplaar van Azure Key Vault.

In een Azure Databricks-clusterconfiguratie kunt u bijvoorbeeld geheimen in omgevingsvariabelen op de volgende manier gebruiken: AZURE_CLIENT_SECRET={{secrets/<scope-name>/<secret-name>}}. Zie Referentie voor een geheim in een omgevingsvariabele of raadpleeg de documentatie voor uw platform voor meer informatie over het implementeren van deze benadering in Azure Databricks.

Experimenten en uitvoeringen

SDK v1

from azureml.core import Experiment

# create an Azure Machine Learning experiment and start a run
experiment = Experiment(ws, "create-experiment-sdk-v1")
azureml_run = experiment.start_logging()

SDK v2 met MLflow

# Set the MLflow experiment and start a run
mlflow.set_experiment("logging-with-mlflow")
mlflow_run = mlflow.start_run()

Vergelijking van logboekregistratie-API

Een geheel getal of metrische floatgegevens registreren

SDK v1

azureml_run.log("sample_int_metric", 1)

SDK v2 met MLflow

mlflow.log_metric("sample_int_metric", 1)

Een booleaanse metrische waarde vastleggen

SDK v1

azureml_run.log("sample_boolean_metric", True)

SDK v2 met MLflow

mlflow.log_metric("sample_boolean_metric", 1)

Een metrische tekenreeks registreren

SDK v1

azureml_run.log("sample_string_metric", "a_metric")

SDK v2 met MLflow

mlflow.log_text("sample_string_text", "string.txt")

De tekenreeks wordt geregistreerd als een artefact, niet als metrische waarde. In Azure Machine Learning-studio wordt de waarde weergegeven op het tabblad Uitvoer en logboeken.

Een afbeelding vastleggen in een PNG- of JPEG-bestand

SDK v1

azureml_run.log_image("sample_image", path="Azure.png")

SDK v2 met MLflow

mlflow.log_artifact("Azure.png")

De afbeelding wordt geregistreerd als een artefact en wordt weergegeven op het tabblad Afbeeldingen in Azure Machine Learning-studio.

Een matplotlib.pyplot registreren

SDK v1

import matplotlib.pyplot as plt

plt.plot([1, 2, 3])
azureml_run.log_image("sample_pyplot", plot=plt)

SDK v2 met MLflow

import matplotlib.pyplot as plt

plt.plot([1, 2, 3])
fig, ax = plt.subplots()
ax.plot([0, 1], [2, 3])
mlflow.log_figure(fig, "sample_pyplot.png")

De afbeelding wordt geregistreerd als een artefact en wordt weergegeven op het tabblad Afbeeldingen in Azure Machine Learning-studio.

Een lijst met metrische gegevens registreren

SDK v1

list_to_log = [1, 2, 3, 2, 1, 2, 3, 2, 1]
azureml_run.log_list('sample_list', list_to_log)

SDK v2 met MLflow

list_to_log = [1, 2, 3, 2, 1, 2, 3, 2, 1]
from mlflow.entities import Metric
from mlflow.tracking import MlflowClient
import time

metrics = [Metric(key="sample_list", value=val, timestamp=int(time.time() * 1000), step=0) for val in list_to_log]
MlflowClient().log_batch(mlflow_run.info.run_id, metrics=metrics)

Metrische gegevens worden weergegeven op het tabblad Metrische gegevens in Azure Machine Learning-studio.
Tekstwaarden worden niet ondersteund.

Een rij met metrische gegevens registreren

SDK v1

azureml_run.log_row("sample_table", col1=5, col2=10)

SDK v2 met MLflow

metrics = {"sample_table.col1": 5, "sample_table.col2": 10}
mlflow.log_metrics(metrics)

Metrische gegevens worden niet weergegeven als een tabel in Azure Machine Learning-studio.
Tekstwaarden worden niet ondersteund.
Geregistreerd als een artefact, niet als metrische waarde.

Een tabel registreren

SDK v1

table = {
"col1" : [1, 2, 3],
"col2" : [4, 5, 6]
}
azureml_run.log_table("table", table)

SDK v2 met MLflow

# Add a metric for each column prefixed by metric name. Similar to log_row
row1 = {"table.col1": 5, "table.col2": 10}
# To be done for each row in the table
mlflow.log_metrics(row1)

# Using mlflow.log_artifact
import json

with open("table.json", 'w') as f:
json.dump(table, f)
mlflow.log_artifact("table.json")

Registreert metrische gegevens voor elke kolom.
Metrische gegevens worden niet weergegeven als een tabel in Azure Machine Learning-studio.
Tekstwaarden worden niet ondersteund.
Geregistreerd als een artefact, niet als metrische waarde.

Een nauwkeurigheidstabel vastleggen

SDK v1

ACCURACY_TABLE = '{"schema_type": "accuracy_table", "schema_version": "v1", "data": {"probability_tables": ' +\
        '[[[114311, 385689, 0, 0], [0, 0, 385689, 114311]], [[67998, 432002, 0, 0], [0, 0, ' + \
        '432002, 67998]]], "percentile_tables": [[[114311, 385689, 0, 0], [1, 0, 385689, ' + \
        '114310]], [[67998, 432002, 0, 0], [1, 0, 432002, 67997]]], "class_labels": ["0", "1"], ' + \
        '"probability_thresholds": [0.52], "percentile_thresholds": [0.09]}}'

azureml_run.log_accuracy_table('v1_accuracy_table', ACCURACY_TABLE)

SDK v2 met MLflow

ACCURACY_TABLE = '{"schema_type": "accuracy_table", "schema_version": "v1", "data": {"probability_tables": ' +\
        '[[[114311, 385689, 0, 0], [0, 0, 385689, 114311]], [[67998, 432002, 0, 0], [0, 0, ' + \
        '432002, 67998]]], "percentile_tables": [[[114311, 385689, 0, 0], [1, 0, 385689, ' + \
        '114310]], [[67998, 432002, 0, 0], [1, 0, 432002, 67997]]], "class_labels": ["0", "1"], ' + \
        '"probability_thresholds": [0.52], "percentile_thresholds": [0.09]}}'

mlflow.log_dict(ACCURACY_TABLE, 'mlflow_accuracy_table.json')

Metrische gegevens worden niet weergegeven als een nauwkeurigheidstabel in Azure Machine Learning-studio.
Geregistreerd als een artefact, niet als metrische waarde.
De mlflow.log_dict methode is experimenteel.

Een verwarringsmatrix registreren

SDK v1

CONF_MATRIX = '{"schema_type": "confusion_matrix", "schema_version": "v1", "data": {"class_labels": ' + \
    '["0", "1", "2", "3"], "matrix": [[3, 0, 1, 0], [0, 1, 0, 1], [0, 0, 1, 0], [0, 0, 0, 1]]}}'

azureml_run.log_confusion_matrix('v1_confusion_matrix', json.loads(CONF_MATRIX))

SDK v2 met MLflow

CONF_MATRIX = '{"schema_type": "confusion_matrix", "schema_version": "v1", "data": {"class_labels": ' + \
    '["0", "1", "2", "3"], "matrix": [[3, 0, 1, 0], [0, 1, 0, 1], [0, 0, 1, 0], [0, 0, 0, 1]]}}'

mlflow.log_dict(CONF_MATRIX, 'mlflow_confusion_matrix.json')

Metrische gegevens worden niet weergegeven als verwarringsmatrix in Azure Machine Learning-studio.
Geregistreerd als een artefact, niet als metrische waarde.
De mlflow.log_dict methode is experimenteel.

Logboekvoorspellingen

SDK v1

PREDICTIONS = '{"schema_type": "predictions", "schema_version": "v1", "data": {"bin_averages": [0.25,' + \
    ' 0.75], "bin_errors": [0.013, 0.042], "bin_counts": [56, 34], "bin_edges": [0.0, 0.5, 1.0]}}'

azureml_run.log_predictions('test_predictions', json.loads(PREDICTIONS))

SDK v2 met MLflow

PREDICTIONS = '{"schema_type": "predictions", "schema_version": "v1", "data": {"bin_averages": [0.25,' + \
    ' 0.75], "bin_errors": [0.013, 0.042], "bin_counts": [56, 34], "bin_edges": [0.0, 0.5, 1.0]}}'

mlflow.log_dict(PREDICTIONS, 'mlflow_predictions.json')

Metrische gegevens worden niet weergegeven als verwarringsmatrix in Azure Machine Learning-studio.
Geregistreerd als een artefact, niet als metrische waarde.
De mlflow.log_dict methode is experimenteel.

Logboekresiduen

SDK v1

RESIDUALS = '{"schema_type": "residuals", "schema_version": "v1", "data": {"bin_edges": [100, 200, 300], ' + \
'"bin_counts": [0.88, 20, 30, 50.99]}}'

azureml_run.log_residuals('test_residuals', json.loads(RESIDUALS))

SDK v2 met MLflow

RESIDUALS = '{"schema_type": "residuals", "schema_version": "v1", "data": {"bin_edges": [100, 200, 300], ' + \
'"bin_counts": [0.88, 20, 30, 50.99]}}'

mlflow.log_dict(RESIDUALS, 'mlflow_residuals.json')

Metrische gegevens worden niet weergegeven als verwarringsmatrix in Azure Machine Learning-studio.
Geregistreerd als een artefact, niet als metrische waarde.
De mlflow.log_dict methode is experimenteel.

Uitvoeringsinformatie en -gegevens weergeven

U hebt toegang tot uitvoeringsinformatie met behulp van de eigenschappen data en info van het MLflow-runobject (mlflow.entities.Run).

Tip

Experimenten en traceringsgegevens in Azure Machine Learning kunnen worden opgevraagd met behulp van MLflow, dat een uitgebreide zoek-API biedt om experimenten op te vragen en te zoeken en eenvoudig uit te voeren en resultaten snel te vergelijken. Zie Query && compare experimenten and runs with MLflow with MLflow(MLflow) voor meer informatie over alle mogelijkheden in MLflow in deze dimensie .

In het volgende voorbeeld ziet u hoe u een voltooide uitvoering kunt ophalen:

from mlflow.tracking import MlflowClient

# Use MlFlow to retrieve the run that was just completed
client = MlflowClient()
finished_mlflow_run = MlflowClient().get_run("<RUN_ID>")

In het volgende voorbeeld ziet u hoe u de metrics, tagsen params:

metrics = finished_mlflow_run.data.metrics
tags = finished_mlflow_run.data.tags
params = finished_mlflow_run.data.params

Notitie

De metrics waarde die het laatst is geregistreerd voor een bepaalde metrische waarde, heeft alleen de laatst geregistreerde waarde. Als u zich bijvoorbeeld aanmeldt op volgorde van een waarde van 1, dan 2, 3en ten slotte 4 aan een metrische waarde met de naam sample_metric, zal alleen 4 aanwezig zijn in de metrics woordenlijst. Als u alle metrische gegevens wilt ophalen die zijn geregistreerd voor een specifieke benoemde metriek, gebruikt u MlFlowClient.get_metric_history:

with mlflow.start_run() as multiple_metrics_run:
    mlflow.log_metric("sample_metric", 1)
    mlflow.log_metric("sample_metric", 2)
    mlflow.log_metric("sample_metric", 3)
    mlflow.log_metric("sample_metric", 4)

print(client.get_run(multiple_metrics_run.info.run_id).data.metrics)
print(client.get_metric_history(multiple_metrics_run.info.run_id, "sample_metric"))

Zie de mlFlowClient-verwijzing voor meer informatie.

Het info veld bevat algemene informatie over de uitvoering, zoals de begintijd, de uitvoerings-id, de experiment-id, enzovoort:

run_start_time = finished_mlflow_run.info.start_time
run_experiment_id = finished_mlflow_run.info.experiment_id
run_id = finished_mlflow_run.info.run_id

Uitvoeringsartefacten weergeven

Gebruik MlFlowClient.list_artifacts om de artefacten van een uitvoering weer te geven:

client.list_artifacts(finished_mlflow_run.info.run_id)

Als u een artefact wilt downloaden, gebruikt u mlflow.artifacts.download_artifacts:

mlflow.artifacts.download_artifacts(run_id=finished_mlflow_run.info.run_id, artifact_path="Azure.png")

Delen via

Logboekregistratie migreren van SDK v1 naar SDK v2

Waarom MLflow?

Voorbereiden voor migratie naar MLflow

Verbinding maken met uw werkruimte

Experimenten en uitvoeringen

Vergelijking van logboekregistratie-API

Een geheel getal of metrische floatgegevens registreren

Een booleaanse metrische waarde vastleggen

Een metrische tekenreeks registreren

Een afbeelding vastleggen in een PNG- of JPEG-bestand

Een matplotlib.pyplot registreren

Een lijst met metrische gegevens registreren

Een rij met metrische gegevens registreren

Een tabel registreren

Een nauwkeurigheidstabel vastleggen

Een verwarringsmatrix registreren

Logboekvoorspellingen

Logboekresiduen

Uitvoeringsinformatie en -gegevens weergeven

Uitvoeringsartefacten weergeven

Volgende stappen

Feedback

Aanvullende resources