Migrowanie rejestrowania z zestawu SDK w wersji 1 do zestawu SDK w wersji 2

Artykuł
12/20/2024

Usługa Azure Machine Learning używa rozwiązania MLflow Tracking do rejestrowania metryk i magazynu artefaktów dla eksperymentów niezależnie od tego, czy eksperymenty zostały utworzone za pomocą zestawu SDK języka Python usługi Azure Machine Learning, interfejsu wiersza polecenia usługi Azure Machine Learning, czy usługi Azure Machine Learning Studio. Zalecamy używanie biblioteki MLflow do śledzenia eksperymentów.

Jeśli uaktualniasz zestaw SDK w wersji 1 do zestawu SDK w wersji 2, skorzystaj z informacji w tej sekcji, aby poznać odpowiedniki biblioteki MLflow interfejsów API rejestrowania zestawu SDK w wersji 1.

Dlaczego MLflow?

MLflow, z ponad 13 milionami miesięcznych pobrań, stał się standardową platformą kompleksowej metodyki MLOps, umożliwiając zespołom wszystkich rozmiarów śledzenie, udostępnianie, pakowanie i wdrażanie dowolnego modelu na potrzeby wnioskowania wsadowego lub w czasie rzeczywistym. Usługa Azure Machine Learning integruje się z rozwiązaniem MLflow, co umożliwia kodowi szkoleniowemu osiągnięcie prawdziwej przenośności i bezproblemowej integracji z innymi platformami, ponieważ nie zawiera żadnych instrukcji specyficznych dla usługi Azure Machine Learning.

Przygotowanie do migracji do platformy MLflow

Aby korzystać ze śledzenia MLflow, należy zainstalować pakiet mlflow zestawu MLflow SDK i wtyczkę usługi Azure Machine Learning dla biblioteki MLflow azureml-mlflow. Wszystkie środowiska usługi Azure Machine Learning mają te pakiety już dostępne, ale należy je uwzględnić w przypadku tworzenia własnego środowiska.

pip install mlflow azureml-mlflow

Nawiązywanie połączenia z obszarem roboczym

Usługa Azure Machine Learning umożliwia użytkownikom śledzenie zadań szkoleniowych uruchomionych w obszarze roboczym lub zdalne uruchamianie (śledzenie eksperymentów uruchomionych poza usługą Azure Machine Learning). W przypadku przeprowadzania śledzenia zdalnego należy wskazać obszar roboczy, z którym chcesz połączyć rozwiązanie MLflow.

Obliczenia w usłudze Azure Machine Learning
Zdalne obliczenia

Masz już połączenie z obszarem roboczym podczas uruchamiania w usłudze Azure Machine Learning Compute.

Konfigurowanie identyfikatora URI śledzenia

Pobierz identyfikator URI śledzenia dla obszaru roboczego:
DOTYCZY: Rozszerzenie interfejsu wiersza polecenia platformy Azure ml w wersji 2 (bieżąca)
1. Zaloguj się i skonfiguruj obszar roboczy:
```
az account set --subscription <subscription-ID>
az configure --defaults workspace=<workspace-name> group=<resource-group-name> location=<location> 
```
2. Pobierz identyfikator URI śledzenia przy użyciu az ml workspace polecenia :
```
az ml workspace show --query mlflow_tracking_uri
```
DOTYCZY: Zestaw PYTHON SDK azure-ai-ml w wersji 2 (bieżąca)

Aby uzyskać identyfikator URI śledzenia MLflow usługi Azure Machine Learning, możesz użyć zestawu SDK usługi Azure Machine Learning w wersji 2 dla języka Python . Upewnij się, że azure-ai-ml biblioteka jest zainstalowana w wystąpieniu obliczeniowym. Następnie użyj następującego kodu, aby uzyskać unikatowy identyfikator URI śledzenia MLFLow skojarzony z obszarem roboczym.
1. Użyj wystąpienia MLClient , aby zalogować się do obszaru roboczego. Istnieją dwie opcje logowania:
  - Najprostszym sposobem jest użycie pliku konfiguracji obszaru roboczego:
    
    from azure.ai.ml import MLClient from azure.identity import DefaultAzureCredential ml_client = MLClient.from_config(credential=DefaultAzureCredential())
    
    Napiwek
    
    Plik konfiguracji obszaru roboczego można pobrać, wykonując następujące czynności:
    
    Przejdź do usługi Azure Machine Learning Studio.
    
    W prawym górnym rogu wybierz nazwę obszaru roboczego.
    
    W oknie Katalog + subskrypcja i obszar roboczy wybierz pozycję Pobierz plik konfiguracji.
    
    Zapisz plik config.json w katalogu, w którym pracujesz.
  - Alternatywnie możesz użyć identyfikatora subskrypcji, nazwy grupy zasobów i nazwy obszaru roboczego, aby się zalogować:
    
    from azure.ai.ml import MLClient from azure.identity import DefaultAzureCredential # Enter information about your Azure Machine Learning workspace. subscription_id = "<subscription-ID>" resource_group = "<resource-group-name>" workspace_name = "<workspace-name>" ml_client = MLClient(credential=DefaultAzureCredential(), subscription_id=subscription_id, resource_group_name=resource_group, workspace_name=workspace_name)
    
    Ważne
    
    Metoda DefaultAzureCredential próbuje ściągnąć poświadczenia z dostępnego kontekstu. Możesz jednak określić poświadczenia w inny sposób, na przykład za pomocą przeglądarki internetowej w interaktywny sposób. W takich przypadkach można użyć InteractiveBrowserCredential lub innej metody dostępnej w pakiecie azure.identity .
2. Pobierz identyfikator URI śledzenia usługi Azure Machine Learning:
```
mlflow_tracking_uri = ml_client.workspaces.get(ml_client.workspace_name).mlflow_tracking_uri
```
Użyj usługi Azure Machine Learning Studio, aby uzyskać identyfikator URI śledzenia:
1. Otwórz program Azure Machine Learning Studio i użyj swoich poświadczeń, aby się zalogować.
2. W prawym górnym rogu wybierz nazwę obszaru roboczego.
3. W oknie Katalog + subskrypcja i obszar roboczy wybierz pozycję Wyświetl wszystkie właściwości w witrynie Azure Portal. Strona zasobu dla obszaru roboczego zostanie otwarta w witrynie Azure Portal.
4. W obszarze Podstawy skopiuj wartość identyfikatora URI śledzenia MLflow.
Identyfikator URI śledzenia usługi Azure Machine Learning można utworzyć ręcznie. Potrzebny jest identyfikator subskrypcji, region, w którym wdrożono obszar roboczy, nazwę grupy zasobów i nazwę obszaru roboczego. Aby uzyskać identyfikator URI, wprowadź te wartości w następującym kodzie:

Ostrzeżenie

Jeśli używasz obszaru roboczego z obsługą linków prywatnych, punkt końcowy platformy MLflow używa również łącza prywatnego do komunikowania się z usługą Azure Machine Learning. W związku z tym identyfikator URI śledzenia używa formatu innego niż w tym artykule. W takim przypadku musisz użyć zestawu SDK usługi Azure Machine Learning dla języka Python lub interfejsu wiersza polecenia usługi Azure Machine Learning w wersji 2, aby uzyskać identyfikator URI śledzenia.
```
region = "<region>"
subscription_id = "<subscription-ID>"
resource_group = "<resource-group-name>"
workspace_name = "<workspace-name>"

mlflow_tracking_uri = f"azureml://{region}.api.azureml.ms/mlflow/v1.0/subscriptions/{subscription_id}/resourceGroups/{resource_group}/providers/Microsoft.MachineLearningServices/workspaces/{workspace_name}"
```
Skonfiguruj identyfikator URI śledzenia:
- MLflow SDK
- Zmienne środowiskowe
set_tracking_uri() Użyj metody , aby ustawić identyfikator URI śledzenia MLflow na identyfikator URI śledzenia obszaru roboczego.
```
import mlflow

mlflow.set_tracking_uri(mlflow_tracking_uri)
```
W wystąpieniu obliczeniowym użyj następującego kodu, aby ustawić zmienną MLFLOW_TRACKING_URI środowiskową MLflow na identyfikator URI śledzenia obszaru roboczego. To przypisanie sprawia, że wszystkie interakcje z platformą MLflow w tym wystąpieniu obliczeniowym domyślnie wskazują usługę Azure Machine Learning. Aby uzyskać więcej informacji, zobacz Funkcje rejestrowania.
```
MLFLOW_TRACKING_URI=$(az ml workspace show --query mlflow_tracking_uri | sed 's/"//g') 
```
Napiwek

Niektóre scenariusze obejmują pracę w środowisku udostępnionym, na przykład w klastrze usługi Azure Databricks lub klastrze usługi Azure Synapse Analytics. W takich przypadkach warto ustawić zmienną MLFLOW_TRACKING_URI środowiskową na poziomie klastra, a nie dla każdej sesji. Ustawienie zmiennej na poziomie klastra automatycznie konfiguruje identyfikator URI śledzenia MLflow, aby wskazywał usługę Azure Machine Learning dla wszystkich sesji w klastrze.

Konfiguruj uwierzytelnianie

Po skonfigurowaniu śledzenia należy również skonfigurować sposób uwierzytelniania w skojarzonym obszarze roboczym. Domyślnie wtyczka usługi Azure Machine Learning dla platformy MLflow wykonuje uwierzytelnianie interakcyjne, otwierając domyślną przeglądarkę, aby wyświetlić monit o poświadczenia. Zobacz Konfigurowanie platformy MLflow dla usługi Azure Machine Learning: Konfigurowanie uwierzytelniania, aby uzyskać więcej sposobów konfigurowania uwierzytelniania dla platformy MLflow w obszarach roboczych usługi Azure Machine Learning.

W przypadku zadań interaktywnych, w których istnieje użytkownik połączony z sesją, można polegać na uwierzytelnianiu interakcyjnym. Nie są wymagane żadne dalsze działania.

Ostrzeżenie

Uwierzytelnianie interakcyjne przeglądarki blokuje wykonywanie kodu po wyświetleniu monitu o podanie poświadczeń. Takie podejście nie jest odpowiednie do uwierzytelniania w środowiskach nienadzorowanych, takich jak zadania szkoleniowe. Zalecamy skonfigurowanie innego trybu uwierzytelniania w tych środowiskach.

W przypadku scenariuszy wymagających nienadzorowanego wykonania należy skonfigurować jednostkę usługi do komunikowania się z usługą Azure Machine Learning. Aby uzyskać informacje na temat tworzenia jednostki usługi, zobacz Konfigurowanie jednostki usługi.

Użyj identyfikatora dzierżawy, identyfikatora klienta i wpisu tajnego klienta jednostki usługi w następującym kodzie:

MLflow SDK
Zmienne środowiskowe

import os

os.environ["AZURE_TENANT_ID"] = "<Azure-tenant-ID>"
os.environ["AZURE_CLIENT_ID"] = "<Azure-client-ID>"
os.environ["AZURE_CLIENT_SECRET"] = "<Azure-client-secret>"

export AZURE_TENANT_ID="<Azure-tenant-ID>"
export AZURE_CLIENT_ID="<Azure-client-ID>"
export AZURE_CLIENT_SECRET="<Azure-client-secret>"

Napiwek

Podczas pracy w środowiskach udostępnionych zalecamy skonfigurowanie tych zmiennych środowiskowych na poziomie obliczeniowym. Najlepszym rozwiązaniem jest zarządzanie nimi jako wpisami tajnymi w wystąpieniu usługi Azure Key Vault.

Na przykład w konfiguracji klastra usługi Azure Databricks można użyć wpisów tajnych w zmiennych środowiskowych w następujący sposób: AZURE_CLIENT_SECRET={{secrets/<scope-name>/<secret-name>}}. Aby uzyskać więcej informacji na temat implementowania tego podejścia w usłudze Azure Databricks, zobacz Odwołanie do wpisu tajnego w zmiennej środowiskowej lub zapoznaj się z dokumentacją platformy.