Wykonywanie bezpiecznego wdrażania nowych wdrożeń na potrzeby wnioskowania w czasie rzeczywistym

Artykuł
09/02/2024

DOTYCZY: Rozszerzenie interfejsu wiersza polecenia platformy Azure w wersji 2 (current)Zestaw PYTHON SDK azure-ai-ml v2 (bieżąca)

W tym artykule dowiesz się, jak wdrożyć nową wersję modelu uczenia maszynowego w środowisku produkcyjnym bez powodowania zakłóceń. W celu wprowadzenia nowej wersji usługi internetowej do produkcji użyjesz strategii wdrażania niebieskiego zielonego (znanej również jako strategia bezpiecznego wdrażania). Ta strategia umożliwi wdrożenie nowej wersji usługi internetowej w małym podzestawie użytkowników lub żądań przed całkowitym wdrożeniem tej wersji.

W tym artykule założono, że używasz punktów końcowych online, czyli punktów końcowych używanych do wnioskowania online (w czasie rzeczywistym). Istnieją dwa typy punktów końcowych online: zarządzane punkty końcowe online i punkty końcowe online platformy Kubernetes. Aby uzyskać więcej informacji na temat punktów końcowych i różnic między zarządzanymi punktami końcowymi online i punktami końcowymi online platformy Kubernetes, zobacz Co to są punkty końcowe usługi Azure Machine Learning?.

Główny przykład w tym artykule używa zarządzanych punktów końcowych online do wdrożenia. Aby zamiast tego użyć punktów końcowych platformy Kubernetes, zapoznaj się z uwagami w tym dokumencie, które są wbudowane z dyskusją na temat zarządzanego punktu końcowego online.

Z tego artykułu dowiesz się, jak wykonywać następujące elementy:

Definiowanie punktu końcowego online przy użyciu wdrożenia o nazwie "niebieski" w celu obsługi wersji 1 modelu
Skalowanie niebieskiego wdrożenia w celu obsługi większej liczby żądań
Wdróż wersję 2 modelu (nazywane wdrożeniem zielonym) w punkcie końcowym, ale wyślij wdrożenie bez ruchu na żywo
Testowanie zielonego wdrożenia w izolacji
Dublowanie procentowego ruchu na żywo do zielonego wdrożenia w celu zweryfikowania go
Wysyłanie małego procentu ruchu na żywo do zielonego wdrożenia
Wysyłanie całego ruchu na żywo do zielonego wdrożenia
Usuwanie nieużywanego teraz wdrożenia w wersji 1 niebieskiego

Wymagania wstępne

Przed wykonaniem kroków opisanych w tym artykule upewnij się, że masz następujące wymagania wstępne:

Interfejs wiersza polecenia platformy ml Azure i rozszerzenie interfejsu wiersza polecenia platformy Azure. Aby uzyskać więcej informacji, zobacz Instalowanie, konfigurowanie i używanie interfejsu wiersza polecenia (wersja 2).

Ważne

W przykładach interfejsu wiersza polecenia w tym artykule założono, że używasz powłoki Bash (lub zgodnej). Na przykład z systemu Linux lub Podsystem Windows dla systemu Linux.
Obszar roboczy usługi Azure Machine Learning. Jeśli go nie masz, wykonaj kroki opisane w temacie Instalowanie, konfigurowanie i używanie interfejsu wiersza polecenia (wersja 2), aby go utworzyć.

Kontrola dostępu na podstawie ról platformy Azure (Azure RBAC): jest używana do udzielania dostępu do operacji w usłudze Azure Machine Learning. Aby wykonać kroki opisane w tym artykule, konto użytkownika musi mieć przypisaną rolę właściciela lub współautora dla obszaru roboczego usługi Azure Machine Learning lub rolę niestandardową zezwalającą na Microsoft.MachineLearningServices/workspaces/onlineEndpoints/*korzystanie z usługi . Aby uzyskać więcej informacji, zobacz Zarządzanie dostępem do obszaru roboczego usługi Azure Machine Learning.
(Opcjonalnie) Aby wdrożyć lokalnie, należy zainstalować aparat platformy Docker na komputerze lokalnym. Zdecydowanie zalecamy tę opcję, więc łatwiej jest debugować problemy.

DOTYCZY: Zestaw PYTHON SDK azure-ai-ml w wersji 2 (bieżąca)

Przed wykonaniem kroków opisanych w tym artykule upewnij się, że masz następujące wymagania wstępne:

Obszar roboczy usługi Azure Machine Learning. Jeśli go nie masz, wykonaj kroki opisane w artykule Szybki start: tworzenie zasobów obszaru roboczego, aby je utworzyć.
Aby zainstalować zestaw PYTHON SDK w wersji 2, użyj następującego polecenia:
```
pip install azure-ai-ml azure-identity
```
Aby zaktualizować istniejącą instalację zestawu SDK do najnowszej wersji, użyj następującego polecenia:
```
pip install --upgrade azure-ai-ml azure-identity
```
Aby uzyskać więcej informacji, zobacz Instalowanie zestawu PYTHON SDK w wersji 2 dla usługi Azure Machine Learning.

Kontrola dostępu na podstawie ról platformy Azure (Azure RBAC): jest używana do udzielania dostępu do operacji w usłudze Azure Machine Learning. Aby wykonać kroki opisane w tym artykule, konto użytkownika musi mieć przypisaną rolę właściciela lub współautora dla obszaru roboczego usługi Azure Machine Learning lub rolę niestandardową zezwalającą na Microsoft.MachineLearningServices/workspaces/onlineEndpoints/*korzystanie z usługi . Aby uzyskać więcej informacji, zobacz Zarządzanie dostępem do obszaru roboczego usługi Azure Machine Learning.
(Opcjonalnie) Aby wdrożyć lokalnie, należy zainstalować aparat platformy Docker na komputerze lokalnym. Zdecydowanie zalecamy tę opcję, więc łatwiej jest debugować problemy.

Przed wykonaniem kroków opisanych w tym artykule upewnij się, że masz następujące wymagania wstępne:

Subskrypcja platformy Azure. Jeśli nie masz subskrypcji platformy Azure, przed rozpoczęciem utwórz bezpłatne konto. Wypróbuj bezpłatną lub płatną wersję usługi Azure Machine Learning.
Obszar roboczy usługi Azure Machine Learning i wystąpienie obliczeniowe. Jeśli nie masz tych zasobów, wykonaj kroki opisane w artykule Szybki start: tworzenie zasobów obszaru roboczego, aby je utworzyć.
Kontrola dostępu na podstawie ról platformy Azure (Azure RBAC): jest używana do udzielania dostępu do operacji w usłudze Azure Machine Learning. Aby wykonać kroki opisane w tym artykule, konto użytkownika musi mieć przypisaną rolę właściciela lub współautora dla obszaru roboczego usługi Azure Machine Learning lub rolę niestandardową zezwalającą na Microsoft.MachineLearningServices/workspaces/onlineEndpoints/*korzystanie z usługi . Aby uzyskać więcej informacji, zobacz Zarządzanie dostępem do obszaru roboczego usługi Azure Machine Learning.

Przygotowywanie systemu

Ustawianie zmiennych środowiskowych

Jeśli nie ustawiono jeszcze ustawień domyślnych dla interfejsu wiersza polecenia platformy Azure, zapisz ustawienia domyślne. Aby uniknąć wielokrotnego przekazywania wartości dla subskrypcji, obszaru roboczego i grupy zasobów, uruchom następujący kod:

az account set --subscription <subscription id>
az configure --defaults workspace=<Azure Machine Learning workspace name> group=<resource group>

Klonowanie repozytorium przykładów

Aby skorzystać z tego artykułu, najpierw sklonuj repozytorium przykładów (azureml-examples). Następnie przejdź do katalogu repozytorium cli/ :

git clone --depth 1 https://github.com/Azure/azureml-examples
cd azureml-examples
cd cli

Napiwek

Użyj polecenia --depth 1 , aby sklonować tylko najnowsze zatwierdzenie do repozytorium. Skraca to czas na ukończenie operacji.

Polecenia w tym samouczku znajdują się w pliku deploy-safe-rollout-online-endpoints.sh w cli katalogu, a pliki konfiguracji YAML znajdują się w podkatalogu endpoints/online/managed/sample/ .

Uwaga

Pliki konfiguracji YAML dla punktów końcowych online platformy Kubernetes znajdują się w podkatalogu endpoints/online/kubernetes/ .

Klonowanie repozytorium przykładów

Aby uruchomić przykłady trenowania, najpierw sklonuj repozytorium przykładów (azureml-examples). Następnie przejdź do azureml-examples/sdk/python/endpoints/online/managed katalogu:

git clone --depth 1 https://github.com/Azure/azureml-examples
cd azureml-examples/sdk/python/endpoints/online/managed

Napiwek

Użyj polecenia --depth 1 , aby sklonować tylko najnowsze zatwierdzenie do repozytorium. Skraca to czas na ukończenie operacji.

Informacje przedstawione w tym artykule są oparte na notesie online-endpoints-safe-rollout.ipynb . Zawiera on tę samą zawartość co ten artykuł, chociaż kolejność kodów jest nieco inna.

Uwaga

Kroki punktu końcowego usługi Kubernetes online są oparte na notesie kubernetes-online-endpoints-safe-rollout.ipynb .

Nawiązywanie połączenia z obszarem roboczym usługi Azure Machine Learning

Obszar roboczy to zasób najwyższego poziomu dla usługi Azure Machine Learning, który zapewnia scentralizowane miejsce do pracy ze wszystkimi artefaktami tworzonymi podczas korzystania z usługi Azure Machine Learning. W tej sekcji połączymy się z obszarem roboczym, w którym będziesz wykonywać zadania wdrażania. Aby kontynuować, otwórz online-endpoints-safe-rollout.ipynb notes.

Zaimportuj wymagane biblioteki:

# import required libraries
from azure.ai.ml import MLClient
from azure.ai.ml.entities import (
    ManagedOnlineEndpoint,
    ManagedOnlineDeployment,
    Model,
    Environment,
    CodeConfiguration,
)
from azure.identity import DefaultAzureCredential

Uwaga

Jeśli używasz punktu końcowego online platformy Kubernetes, zaimportuj azure.ai.ml.entities klasę KubernetesOnlineEndpoint i KubernetesOnlineDeployment z biblioteki.

Konfigurowanie szczegółów obszaru roboczego i uzyskiwanie dojścia do obszaru roboczego:

Aby nawiązać połączenie z obszarem roboczym, potrzebujemy parametrów identyfikatora — subskrypcji, grupy zasobów i nazwy obszaru roboczego. Użyjemy tych szczegółów w MLClient sekcji z azure.ai.ml , aby uzyskać dojście do wymaganego obszaru roboczego usługi Azure Machine Learning. W tym przykładzie użyto domyślnego uwierzytelniania platformy Azure.
```
# enter details of your AML workspace
subscription_id = "<SUBSCRIPTION_ID>"
resource_group = "<RESOURCE_GROUP>"
workspace = "<AML_WORKSPACE_NAME>"
```
```
# get a handle to the workspace
ml_client = MLClient(
    DefaultAzureCredential(), subscription_id, resource_group, workspace
)
```

Jeśli na komputerze lokalnym zainstalowano usługę Git, możesz wykonać instrukcje klonowania repozytorium przykładów. W przeciwnym razie postępuj zgodnie z instrukcjami, aby pobrać pliki z repozytorium przykładów.

Klonowanie repozytorium przykładów

Aby skorzystać z tego artykułu, najpierw sklonuj repozytorium przykładów (azureml-examples), a następnie przejdź do azureml-examples/cli/endpoints/online/model-1 katalogu.

git clone --depth 1 https://github.com/Azure/azureml-examples
cd azureml-examples/cli/endpoints/online/model-1

Napiwek

Użyj --depth 1 polecenia , aby sklonować tylko najnowsze zatwierdzenie do repozytorium, co skraca czas na ukończenie operacji.

Pobieranie plików z repozytorium przykładów

Jeśli sklonujesz repozytorium przykładów, maszyna lokalna ma już kopie plików w tym przykładzie i możesz przejść do następnej sekcji. Jeśli nie sklonujesz repozytorium, możesz pobrać je na komputer lokalny.

Przejdź do https://github.com/Azure/azureml-examples/.
Przejdź do <> przycisku Kod na stronie, a następnie wybierz pozycję Pobierz plik ZIP z karty Lokalne .
Znajdź folder /cli/endpoints/online/model-1/model modelu i skrypt /cli/endpoints/online/model-1/onlinescoring/score.py oceniania dla pierwszego modelu model-1.
Znajdź folder /cli/endpoints/online/model-2/model modelu i skrypt /cli/endpoints/online/model-2/onlinescoring/score.py oceniania dla drugiego modelu model-2.

Definiowanie punktu końcowego i wdrożenia

Punkty końcowe online są używane do wnioskowania w trybie online (w czasie rzeczywistym). Punkty końcowe online zawierają wdrożenia, które są gotowe do odbierania danych od klientów i wysyłają odpowiedzi z powrotem w czasie rzeczywistym.

Definiowanie punktu końcowego

W poniższej tabeli wymieniono atrybuty klucza do określenia podczas definiowania punktu końcowego.

Atrybut	Opis
Nazwa/nazwisko	Wymagany. Nazwa punktu końcowego. Musi być unikatowa w regionie świadczenia usługi Azure. Aby uzyskać więcej informacji na temat reguł nazewnictwa, zobacz Limity punktów końcowych.
Tryb uwierzytelniania	Metoda uwierzytelniania punktu końcowego. Wybierz uwierzytelnianie oparte na kluczach i uwierzytelnianie `key` `aml_token`oparte na tokenach usługi Azure Machine Learning. Klucz nie wygasa, ale token wygasa. Aby uzyskać więcej informacji na temat uwierzytelniania, zobacz Uwierzytelnianie w punkcie końcowym online.
opis	Opis punktu końcowego.
Tagi	Słownik tagów dla punktu końcowego.
Ruch	Reguły dotyczące kierowania ruchu między wdrożeniami. Reprezentuje ruch jako słownik par klucz-wartość, gdzie klucz reprezentuje nazwę wdrożenia i wartość reprezentuje procent ruchu do tego wdrożenia. Ruch można ustawić tylko wtedy, gdy wdrożenia w punkcie końcowym zostały utworzone. Możesz również zaktualizować ruch dla punktu końcowego online po utworzeniu wdrożeń. Aby uzyskać więcej informacji na temat korzystania z dublowanego ruchu, zobacz Przydziel niewielki procent ruchu na żywo do nowego wdrożenia.
Ruch dublowania	Procent ruchu na żywo do dublowania do wdrożenia. Aby uzyskać więcej informacji na temat korzystania z dublowanego ruchu, zobacz Testowanie wdrożenia za pomocą dublowanego ruchu.

Aby wyświetlić pełną listę atrybutów, które można określić podczas tworzenia punktu końcowego, zobacz Interfejs wiersza polecenia (wersja 2) online schemat YAML lub zestaw SDK (wersja 2) ManagedOnlineEndpoint Class ( Klasa ManagedOnlineEndpoint).

Definiowanie wdrożenia

Wdrożenie to zestaw zasobów wymaganych do hostowania modelu, który wykonuje rzeczywiste wnioskowanie. W poniższej tabeli opisano kluczowe atrybuty, które należy określić podczas definiowania wdrożenia.

Atrybut	Opis
Nazwa/nazwisko	Wymagany. Nazwa wdrożenia.
Nazwa punktu końcowego	Wymagany. Nazwa punktu końcowego do utworzenia wdrożenia w obszarze.
Model	Model do użycia na potrzeby wdrożenia. Ta wartość może być odwołaniem do istniejącego modelu w wersji w obszarze roboczym lub specyfikacji wbudowanego modelu. W tym przykładzie mamy model scikit-learn, który wykonuje regresję.
Ścieżka kodu	Ścieżka do katalogu w lokalnym środowisku projektowym zawierającym cały kod źródłowy języka Python do oceniania modelu. Można użyć katalogów i pakietów zagnieżdżonych.
Skrypt oceniania	Kod języka Python, który wykonuje model na danym żądaniu wejściowym. Ta wartość może być ścieżką względną do pliku oceniania w katalogu kodu źródłowego. Skrypt oceniania odbiera dane przesłane do wdrożonej usługi internetowej i przekazuje je do modelu. Następnie skrypt wykonuje model i zwraca jego odpowiedź na klienta. Skrypt oceniania jest specyficzny dla modelu i musi zrozumieć dane oczekiwane przez model jako dane wejściowe i zwracane jako dane wyjściowe. W tym przykładzie mamy plik score.py . Ten kod w języku Python musi mieć `init()` funkcję i `run()` funkcję. Funkcja `init()` zostanie wywołana po utworzeniu lub zaktualizowaniu modelu (można jej użyć do buforowania modelu w pamięci, na przykład). Funkcja `run()` jest wywoływana przy każdym wywołaniu punktu końcowego w celu wykonania rzeczywistego oceniania i przewidywania.
Środowisko	Wymagany. Środowisko do hostowania modelu i kodu. Ta wartość może być odwołaniem do istniejącego środowiska w wersji w obszarze roboczym lub specyfikacji środowiska wbudowanego. Środowisko może być obrazem platformy Docker z zależnościami Conda, plikiem Dockerfile lub zarejestrowanym środowiskiem.
Typ wystąpienia	Wymagany. Rozmiar maszyny wirtualnej do użycia na potrzeby wdrożenia. Aby uzyskać listę obsługiwanych rozmiarów, zobacz Lista jednostek SKU zarządzanych punktów końcowych online.
Liczba wystąpień	Wymagany. Liczba wystąpień do użycia na potrzeby wdrożenia. W oparciu o oczekiwaną wartość obciążenia. W przypadku wysokiej dostępności zalecamy ustawienie wartości na wartość co najmniej `3`. Firma Microsoft zastrzega sobie dodatkowe 20% na potrzeby przeprowadzania uaktualnień. Aby uzyskać więcej informacji, zobacz limity punktów końcowych online.

Aby wyświetlić pełną listę atrybutów, które można określić podczas tworzenia wdrożenia, zobacz Interfejs wiersza polecenia (wersja 2) zarządzanego wdrożenia w trybie online schematu YAML lub zestawu SDK (wersja 2) ManagedOnlineDeployment Class ( Klasa managedOnlineDeployment).

Tworzenie punktu końcowego online

Najpierw ustaw nazwę punktu końcowego, a następnie skonfiguruj go. W tym artykule użyjesz pliku endpoints/online/managed/sample/endpoint.yml , aby skonfigurować punkt końcowy. Poniższy fragment kodu przedstawia zawartość pliku:

$schema: https://azuremlschemas.azureedge.net/latest/managedOnlineEndpoint.schema.json
name: my-endpoint
auth_mode: key

Dokumentacja formatu YAML punktu końcowego została opisana w poniższej tabeli. Aby dowiedzieć się, jak określić te atrybuty, zobacz dokumentację YAML punktu końcowego online. Aby uzyskać informacje o limitach związanych z zarządzanymi punktami końcowymi online, zobacz limity dla punktów końcowych online.

Key	opis
`$schema`	(Opcjonalnie) Schemat YAML. Aby wyświetlić wszystkie dostępne opcje w pliku YAML, możesz wyświetlić schemat w poprzednim fragmencie kodu w przeglądarce.
`name`	Nazwa punktu końcowego.
`auth_mode`	Służy `key` do uwierzytelniania opartego na kluczach. Służy `aml_token` do uwierzytelniania opartego na tokenach usługi Azure Machine Learning. Aby uzyskać najnowszy token, użyj `az ml online-endpoint get-credentials` polecenia .

Aby utworzyć punkt końcowy online:

Ustaw nazwę punktu końcowego:

W przypadku systemu Unix uruchom to polecenie (zastąp YOUR_ENDPOINT_NAME element unikatową nazwą):
```
export ENDPOINT_NAME="<YOUR_ENDPOINT_NAME>"
```
Ważne

Nazwy punktów końcowych muszą być unikatowe w regionie świadczenia usługi Azure. Na przykład w regionie świadczenia usługi Azure westus2 może istnieć tylko jeden punkt końcowy o nazwie my-endpoint.
Utwórz punkt końcowy w chmurze:

Uruchom następujący kod, aby użyć endpoint.yml pliku do skonfigurowania punktu końcowego:
```
az ml online-endpoint create --name $ENDPOINT_NAME -f endpoints/online/managed/sample/endpoint.yml
```

Tworzenie wdrożenia "niebieskiego"

W tym artykule użyjesz pliku endpoints/online/managed/sample/blue-deployment.yml , aby skonfigurować kluczowe aspekty wdrożenia. Poniższy fragment kodu przedstawia zawartość pliku:

$schema: https://azuremlschemas.azureedge.net/latest/managedOnlineDeployment.schema.json
name: blue
endpoint_name: my-endpoint
model:
  path: ../../model-1/model/
code_configuration:
  code: ../../model-1/onlinescoring/
  scoring_script: score.py
environment: 
  conda_file: ../../model-1/environment/conda.yaml
  image: mcr.microsoft.com/azureml/openmpi4.1.0-ubuntu20.04:latest
instance_type: Standard_DS3_v2
instance_count: 1

Aby utworzyć wdrożenie o nazwie blue dla punktu końcowego, uruchom następujące polecenie, aby użyć pliku do skonfigurowania blue-deployment.yml

az ml online-deployment create --name blue --endpoint-name $ENDPOINT_NAME -f endpoints/online/managed/sample/blue-deployment.yml --all-traffic

Ważne

Flaga --all-traffic w obiekcie az ml online-deployment create przydziela 100% ruchu punktu końcowego do nowo utworzonego niebieskiego wdrożenia.

blue-deployment.yaml W pliku określamy path wbudowany element (gdzie mają być przekazywane pliki). Interfejs wiersza polecenia automatycznie przekazuje pliki i rejestruje model i środowisko. Najlepszym rozwiązaniem dla środowiska produkcyjnego jest zarejestrowanie modelu i środowiska oraz określenie zarejestrowanej nazwy i wersji oddzielnie w języku YAML. Użyj formularza model: azureml:my-model:1 lub environment: azureml:my-env:1.

W celu rejestracji można wyodrębnić definicje YAML plików model YAML i environment do oddzielnych plików YAML oraz użyć poleceń az ml model create i az ml environment create. Aby dowiedzieć się więcej o tych poleceniach, uruchom az ml model create -h polecenie i az ml environment create -h.

Aby uzyskać więcej informacji na temat rejestrowania modelu jako zasobu, zobacz Rejestrowanie modelu jako zasobu w usłudze Machine Learning przy użyciu interfejsu wiersza polecenia. Aby uzyskać więcej informacji na temat tworzenia środowiska, zobacz Zarządzanie środowiskami usługi Azure Machine Learning przy użyciu interfejsu wiersza polecenia i zestawu SDK (wersja 2).

Tworzenie punktu końcowego online

Aby utworzyć zarządzany punkt końcowy online, użyj ManagedOnlineEndpoint klasy . Ta klasa umożliwia użytkownikom konfigurowanie kluczowych aspektów punktu końcowego.

Konfigurowanie punktu końcowego:

# Creating a unique endpoint name with current datetime to avoid conflicts
import random

online_endpoint_name = "endpt-moe-" + str(random.randint(0, 10000))

# create an online endpoint
endpoint = ManagedOnlineEndpoint(
    name=online_endpoint_name,
    description="this is a sample online endpoint",
    auth_mode="key",
    tags={"foo": "bar"},
)

Uwaga

Aby utworzyć punkt końcowy online platformy Kubernetes, użyj KubernetesOnlineEndpoint klasy .

Utwórz punkt końcowy:

ml_client.online_endpoints.begin_create_or_update(endpoint).result()

Tworzenie wdrożenia "niebieskiego"

Aby utworzyć wdrożenie zarządzanego punktu końcowego online, użyj ManagedOnlineDeployment klasy . Ta klasa umożliwia użytkownikom konfigurowanie kluczowych aspektów wdrożenia. W poniższej tabeli opisano atrybuty elementu deployment:

Konfigurowanie niebieskiego wdrożenia:
```
# create blue deployment
model = Model(path="../model-1/model/sklearn_regression_model.pkl")
env = Environment(
    conda_file="../model-1/environment/conda.yaml",
    image="mcr.microsoft.com/azureml/openmpi4.1.0-ubuntu20.04",
)

blue_deployment = ManagedOnlineDeployment(
    name="blue",
    endpoint_name=online_endpoint_name,
    model=model,
    environment=env,
    code_configuration=CodeConfiguration(
        code="../model-1/onlinescoring", scoring_script="score.py"
    ),
    instance_type="Standard_DS3_v2",
    instance_count=1,
)
```
W tym przykładzie path określamy wbudowany element (gdzie mają być przekazywane pliki). Zestaw SDK automatycznie przekazuje pliki i rejestruje model i środowisko. Najlepszym rozwiązaniem w środowisku produkcyjnym jest zarejestrowanie modelu i środowiska oraz określenie zarejestrowanej nazwy i wersji oddzielnie w kodach.

Aby uzyskać więcej informacji na temat rejestrowania modelu jako zasobu, zobacz Rejestrowanie modelu jako zasobu w usłudze Machine Learning przy użyciu zestawu SDK.

Aby uzyskać więcej informacji na temat tworzenia środowiska, zobacz Zarządzanie środowiskami usługi Azure Machine Learning przy użyciu interfejsu wiersza polecenia i zestawu SDK (wersja 2).

Uwaga

Aby utworzyć wdrożenie dla punktu końcowego online platformy Kubernetes, użyj KubernetesOnlineDeployment klasy .

Utwórz wdrożenie:

ml_client.online_deployments.begin_create_or_update(blue_deployment).result()

# blue deployment takes 100 traffic
endpoint.traffic = {"blue": 100}
ml_client.online_endpoints.begin_create_or_update(endpoint).result()

Podczas tworzenia zarządzanego punktu końcowego online w usłudze Azure Machine Learning Studio należy zdefiniować początkowe wdrożenie punktu końcowego. Zanim będzie można zdefiniować wdrożenie, musisz mieć zarejestrowany model w obszarze roboczym. Zacznijmy od zarejestrowania modelu do użycia na potrzeby wdrożenia.

Rejestrowanie modelu

Rejestracja modelu jest jednostką logiczną w obszarze roboczym. Ta jednostka może zawierać jeden plik modelu lub katalog wielu plików. Najlepszym rozwiązaniem dla środowiska produkcyjnego jest zarejestrowanie modelu i środowiska. Podczas tworzenia punktu końcowego i wdrożenia w tym artykule przyjęto założenie, że zarejestrowano folder modelu zawierający model.

Aby zarejestrować przykładowy model, wykonaj następujące kroki:

Przejdź do usługi Azure Machine Learning Studio.
Na lewym pasku nawigacyjnym wybierz stronę Modele .
Wybierz pozycję Zarejestruj, a następnie wybierz pozycję Z plików lokalnych.
Wybierz nieokreślony typ dla typu modelu.
Wybierz pozycję Przeglądaj, a następnie wybierz pozycję Przeglądaj folder.
\azureml-examples\cli\endpoints\online\model-1\model Wybierz folder z lokalnej kopii sklonowanego lub pobranego wcześniej repozytorium. Po wyświetleniu monitu wybierz pozycję Przekaż i poczekaj na zakończenie przekazywania.
Po zakończeniu przekazywania folderu wybierz pozycję Dalej .
Wprowadź przyjazną nazwę modelu. W krokach w tym artykule założono, że model nosi nazwę model-1.
Wybierz przycisk Dalej, a następnie zarejestruj się, aby ukończyć rejestrację.
Powtórz poprzednie kroki, aby zarejestrować element model-2 z \azureml-examples\cli\endpoints\online\model-2\model folderu w lokalnej kopii sklonowanego lub pobranego wcześniej repozytorium.

Aby uzyskać więcej informacji na temat pracy z zarejestrowanymi modelami, zobacz Rejestrowanie modeli i praca z nimi.

Aby uzyskać informacje na temat tworzenia środowiska w programie Studio, zobacz Tworzenie środowiska.

Tworzenie zarządzanego punktu końcowego online i wdrożenia "niebieskiego"

Użyj usługi Azure Machine Learning Studio, aby utworzyć zarządzany punkt końcowy online bezpośrednio w przeglądarce. Podczas tworzenia zarządzanego punktu końcowego online w programie Studio należy zdefiniować początkowe wdrożenie. Nie można utworzyć pustego zarządzanego punktu końcowego online.

Jednym ze sposobów utworzenia zarządzanego punktu końcowego online w programie Studio jest strona Modele . Ta metoda umożliwia również łatwe dodawanie modelu do istniejącego zarządzanego wdrożenia online. Aby wdrożyć model o nazwie model-1 zarejestrowanej wcześniej w sekcji Rejestrowanie modelu :

Przejdź do usługi Azure Machine Learning Studio.
Na lewym pasku nawigacyjnym wybierz stronę Modele .
Wybierz model o nazwie model-1 , sprawdzając okrąg obok jego nazwy.
Wybierz pozycję Wdróż>punkt końcowy w czasie rzeczywistym.

Ta akcja powoduje otwarcie okna, w którym można określić szczegóły dotyczące punktu końcowego.
Wprowadź nazwę punktu końcowego.
Zachowaj domyślne opcje: Zarządzane dla typu obliczeniowego i uwierzytelniania opartego na kluczach dla typu uwierzytelniania.
Wybierz pozycję Dalej, dopóki nie zostanie wyświetlona strona "Wdrożenie". W tym miejscu wykonaj następujące zadania:
- Nadaj wdrożeniu nazwę "niebieski".
- Zaznacz pole wyboru Włącz diagnostykę usługi Application Insights i zbieranie danych, aby umożliwić wyświetlanie grafów działań punktu końcowego w studio później.
Wybierz pozycję Dalej , aby przejść do strony "Środowisko". W tym miejscu wykonaj następujące kroki:
- W polu "Wybierz plik oceniania i zależności" przejrzyj i wybierz \azureml-examples\cli\endpoints\online\model-1\onlinescoring\score.py plik z sklonowanego lub pobranego wcześniej repozytorium.
- Zacznij wpisywać w sklearn polu wyszukiwania powyżej listy środowisk i wybierz środowisko wyselekcjonowane AzureML-sklearn-0.24 .
Wybierz pozycję Dalej , aby przejść do strony "Obliczenia". W tym miejscu zachowaj wybór domyślny dla maszyny wirtualnej "Standard_DS3_v2" i zmień liczbę wystąpień na 1.
Wybierz pozycję Dalej, aby zaakceptować domyślną alokację ruchu (100%) do niebieskiego wdrożenia.
Przejrzyj ustawienia wdrożenia i wybierz przycisk Utwórz .

Alternatywnie możesz utworzyć zarządzany punkt końcowy online na stronie Punkty końcowe w programie Studio.

Przejdź do usługi Azure Machine Learning Studio.
Na lewym pasku nawigacyjnym wybierz stronę Punkty końcowe .
Wybierz + Utwórz.

Ta akcja spowoduje otwarcie okna umożliwiającego określenie szczegółów dotyczących punktu końcowego i wdrożenia. Wprowadź ustawienia punktu końcowego i wdrożenia zgodnie z opisem w poprzednich krokach 5–11, akceptując wartości domyślne do momentu wyświetlenia monitu o utworzenie wdrożenia.

Potwierdzanie istniejącego wdrożenia

Jednym ze sposobów potwierdzenia istniejącego wdrożenia jest wywołanie punktu końcowego, aby mógł ocenić model dla danego żądania wejściowego. Podczas wywoływania punktu końcowego za pośrednictwem interfejsu wiersza polecenia lub zestawu SDK języka Python możesz określić nazwę wdrożenia, które będzie odbierać ruch przychodzący.

Uwaga

W przeciwieństwie do interfejsu wiersza polecenia lub zestawu SDK języka Python program Azure Machine Learning Studio wymaga określenia wdrożenia podczas wywoływania punktu końcowego.

Wywoływanie punktu końcowego z nazwą wdrożenia

Jeśli wywołasz punkt końcowy z nazwą wdrożenia, które będzie odbierać ruch, usługa Azure Machine Learning będzie kierować ruch punktu końcowego bezpośrednio do określonego wdrożenia i zwracać jego dane wyjściowe. Możesz użyć opcji interfejsu --deployment-name wiersza polecenia w wersji 2 lub deployment_name opcji zestawu SDK w wersji 2, aby określić wdrożenie.

Wywoływanie punktu końcowego bez określania wdrożenia

Jeśli wywołasz punkt końcowy bez określenia wdrożenia, które będzie odbierać ruch, usługa Azure Machine Learning będzie kierować ruch przychodzący punktu końcowego do wdrożeń w punkcie końcowym na podstawie ustawień kontroli ruchu.

Ustawienia kontroli ruchu przydzielają określone wartości procentowe ruchu przychodzącego do każdego wdrożenia w punkcie końcowym. Jeśli na przykład reguły ruchu określają, że określone wdrożenie w punkcie końcowym będzie odbierać ruch przychodzący 40% czasu, usługa Azure Machine Learning będzie kierować 40% ruchu punktu końcowego do tego wdrożenia.

Stan istniejącego punktu końcowego i wdrożenia można wyświetlić, uruchamiając polecenie:

az ml online-endpoint show --name $ENDPOINT_NAME 

az ml online-deployment show --name blue --endpoint $ENDPOINT_NAME

Powinien zostać wyświetlony punkt końcowy zidentyfikowany przez $ENDPOINT_NAME element i wdrożenie o nazwie blue.

Testowanie punktu końcowego przy użyciu przykładowych danych

Punkt końcowy można wywołać za pomocą invoke polecenia . Wyślemy przykładowe żądanie przy użyciu pliku json .

az ml online-endpoint invoke --name $ENDPOINT_NAME --request-file endpoints/online/model-1/sample-request.json

Sprawdź stan, aby sprawdzić, czy model został wdrożony bez błędu:

ml_client.online_endpoints.get(name=online_endpoint_name)

Testowanie punktu końcowego przy użyciu przykładowych danych

Przy użyciu utworzonego MLClient wcześniej dojścia do punktu końcowego uzyskamy dojście. Punkt końcowy można wywołać przy użyciu invoke polecenia z następującymi parametrami:

endpoint_name - Nazwa punktu końcowego
request_file - Plik z danymi żądania
deployment_name - Nazwa określonego wdrożenia do testowania w punkcie końcowym

Wyślemy przykładowe żądanie przy użyciu pliku json .

# test the blue deployment with some sample data
ml_client.online_endpoints.invoke(
    endpoint_name=online_endpoint_name,
    deployment_name="blue",
    request_file="../model-1/sample-request.json",
)

Skalowanie istniejącego wdrożenia w celu obsługi większej liczby ruchu

We wdrożeniu opisanym w artykule Wdrażanie i ocenianie modelu uczenia maszynowego przy użyciu punktu końcowego online należy ustawić instance_count wartość na wartość 1 w pliku yaml wdrożenia. Skalowanie w poziomie można skalować w update poziomie przy użyciu polecenia :

az ml online-deployment update --name blue --endpoint-name $ENDPOINT_NAME --set instance_count=2

Uwaga

Zwróć uwagę, że w powyższym poleceniu użyjemy --set polecenia , aby zastąpić konfigurację wdrożenia. Alternatywnie możesz zaktualizować plik yaml i przekazać go jako dane wejściowe do update polecenia przy użyciu danych wejściowych --file .

Korzystając z utworzonego MLClient wcześniej pliku, uzyskamy dojście do wdrożenia. Wdrożenie można skalować, zwiększając lub zmniejszając wartość instance_count.

# scale the deployment
blue_deployment = ml_client.online_deployments.get(
    name="blue", endpoint_name=online_endpoint_name
)
blue_deployment.instance_count = 2
ml_client.online_deployments.begin_create_or_update(blue_deployment).result()

Pobieranie szczegółów punktu końcowego

# Get the details for online endpoint
endpoint = ml_client.online_endpoints.get(name=online_endpoint_name)

# existing traffic details
print(endpoint.traffic)

# Get the scoring URI
print(endpoint.scoring_uri)

Wdrażanie nowego modelu, ale wysyłanie go jeszcze nie ma ruchu

Utwórz nowe wdrożenie o nazwie green:

az ml online-deployment create --name green --endpoint-name $ENDPOINT_NAME -f endpoints/online/managed/sample/green-deployment.yml

Ponieważ nie przydzieliliśmy jawnie żadnego ruchu do greenusługi , ma on przydzielony zerowy ruch. Możesz sprawdzić, czy używasz polecenia :

az ml online-endpoint show -n $ENDPOINT_NAME --query traffic

Testowanie nowego wdrożenia

Mimo że green przydzielono 0% ruchu, można wywołać go bezpośrednio, określając --deployment nazwę:

az ml online-endpoint invoke --name $ENDPOINT_NAME --deployment-name green --request-file endpoints/online/model-2/sample-request.json

Jeśli chcesz używać klienta REST do bezpośredniego wywoływania wdrożenia bez przechodzenia przez reguły ruchu, ustaw następujący nagłówek HTTP: azureml-model-deployment: <deployment-name>. Poniższy fragment kodu używa metody curl do bezpośredniego wywoływania wdrożenia. Fragment kodu powinien działać w środowiskach unix/WSL:

# get the scoring uri
SCORING_URI=$(az ml online-endpoint show -n $ENDPOINT_NAME -o tsv --query scoring_uri)
# use curl to invoke the endpoint
curl --request POST "$SCORING_URI" --header "Authorization: Bearer $ENDPOINT_KEY" --header 'Content-Type: application/json' --header "azureml-model-deployment: green" --data @endpoints/online/model-2/sample-request.json

Utwórz nowe wdrożenie dla zarządzanego punktu końcowego online i nadaj wdrożeniu greennazwę :

# create green deployment
model2 = Model(path="../model-2/model/sklearn_regression_model.pkl")
env2 = Environment(
    conda_file="../model-2/environment/conda.yaml",
    image="mcr.microsoft.com/azureml/openmpi4.1.0-ubuntu20.04",
)

green_deployment = ManagedOnlineDeployment(
    name="green",
    endpoint_name=online_endpoint_name,
    model=model2,
    environment=env2,
    code_configuration=CodeConfiguration(
        code="../model-2/onlinescoring", scoring_script="score.py"
    ),
    instance_type="Standard_DS3_v2",
    instance_count=1,
)

# use MLClient to create green deployment
ml_client.online_deployments.begin_create_or_update(green_deployment).result()

Uwaga

Jeśli tworzysz wdrożenie dla punktu końcowego usługi Kubernetes w trybie online, użyj KubernetesOnlineDeployment klasy i określ typ wystąpienia Kubernetes w klastrze Kubernetes.

Testowanie nowego wdrożenia

Mimo że green przydzielono 0% ruchu, nadal można wywołać punkt końcowy i wdrożenie przy użyciu pliku json .

ml_client.online_endpoints.invoke(
    endpoint_name=online_endpoint_name,
    deployment_name="green",
    request_file="../model-2/sample-request.json",
)

Utwórz nowe wdrożenie, aby dodać do zarządzanego punktu końcowego online i nadaj mu nazwę .green

Na stronie Szczegóły punktu końcowego

Wybierz przycisk + Dodaj wdrożenie na stronie "Szczegóły" punktu końcowego.
Wybierz pozycję Wdróż model.
Wybierz pozycję Dalej, aby przejść do strony "Model" i wybrać model-2.
Wybierz pozycję Dalej , aby przejść do strony "Wdrożenie" i wykonać następujące zadania:
1. Nadaj wdrożeniu nazwę "green".
2. Włącz diagnostykę i zbieranie danych usługi Application Insights.
Wybierz pozycję Dalej , aby przejść do strony "Środowisko". W tym miejscu wykonaj następujące kroki:
- W polu "Wybierz plik oceniania i zależności" przejrzyj i wybierz \azureml-examples\cli\endpoints\online\model-2\onlinescoring\score.py plik z sklonowanego lub pobranego wcześniej repozytorium.
- Zacznij wpisywać w sklearn polu wyszukiwania powyżej listy środowisk i wybierz środowisko wyselekcjonowane AzureML-sklearn-0.24 .
Wybierz pozycję Dalej , aby przejść do strony "Obliczenia". W tym miejscu zachowaj wybór domyślny dla maszyny wirtualnej "Standard_DS3_v2" i zmień liczbę wystąpień na 1.
Wybierz przycisk Dalej , aby przejść do strony "Ruch". W tym miejscu zachowaj domyślną alokację ruchu do wdrożeń (100% ruchu do "niebieskiego" i 0% ruchu na "zielony").
Wybierz przycisk Dalej , aby przejrzeć ustawienia wdrożenia.
Wybierz pozycję Utwórz , aby utworzyć wdrożenie.

Alternatywnie możesz użyć strony Modele , aby dodać wdrożenie:

Na lewym pasku nawigacyjnym wybierz stronę Modele .
Wybierz model, sprawdzając okrąg obok nazwy modelu.
Wybierz pozycję Wdróż>punkt końcowy w czasie rzeczywistym.
Wybierz wdrożenie w istniejącym zarządzanym punkcie końcowym online.
Wykonaj poprzednie kroki od 3 do 9, aby zakończyć tworzenie zielonego wdrożenia.

Uwaga

Podczas dodawania nowego wdrożenia do punktu końcowego można dostosować równowagę ruchu między wdrożeniami na stronie "Ruch". Na tym etapie należy jednak zachować domyślną alokację ruchu do wdrożeń (100% ruchu do "niebieskiego" i 0% ruchu do "zielony").

Testowanie nowego wdrożenia

Mimo że green przydzielono 0% ruchu, nadal można wywołać punkt końcowy i wdrożenie. Użyj karty Test na stronie szczegółów punktu końcowego, aby przetestować zarządzane wdrożenie online. Wprowadź przykładowe dane wejściowe i wyświetl wyniki.

Wybierz kartę Test na stronie szczegółów punktu końcowego.
Wybierz zielone wdrożenie z menu rozwijanego.
Skopiuj przykładowe dane wejściowe z pliku json .
Wklej przykładowe dane wejściowe w polu testowym.
Kliknij przycisk Testuj.

Testowanie wdrożenia przy użyciu ruchu dublowanego

Po przetestowaniu green wdrożenia można zdublować (lub skopiować) procent ruchu na żywo. Dublowanie ruchu (nazywane również cieniowaniem) nie zmienia wyników zwracanych do klientów — żądania nadal przepływają 100% do blue wdrożenia. Zdublowany procent ruchu jest kopiowany i przesyłany do green wdrożenia, dzięki czemu można zbierać metryki i rejestrowanie bez wpływu na klientów. Dublowanie jest przydatne, gdy chcesz zweryfikować nowe wdrożenie bez wpływu na klientów. Na przykład można użyć dublowania, aby sprawdzić, czy opóźnienie mieści się w dopuszczalnych granicach lub czy nie ma żadnych błędów HTTP. Testowanie nowego wdrożenia przy użyciu funkcji dublowania ruchu/cieniowania jest również nazywane testowaniem w tle. Wdrożenie odbierające ruch dublowany (w tym przypadku green wdrożenie) może być również nazywane wdrożeniem w tle.

Dublowanie ma następujące ograniczenia:

Dublowanie jest obsługiwane w przypadku interfejsu wiersza polecenia (wersja 2.4.0 lub nowsza) oraz zestawu SDK języka Python (wersja 2) (wersja 1.0.0 lub nowsza). Jeśli używasz starszej wersji interfejsu wiersza polecenia/zestawu SDK do aktualizowania punktu końcowego, utracisz ustawienie ruchu dublowanego.
Dublowanie nie jest obecnie obsługiwane w przypadku punktów końcowych online platformy Kubernetes.
Ruch można dublować tylko do jednego wdrożenia w punkcie końcowym.
Maksymalny procent ruchu, który można dublować, wynosi 50%. Ten limit polega na zmniejszeniu wpływu na limit przydziału przepustowości punktu końcowego (domyślnie 5 MB/s) — przepustowość punktu końcowego jest ograniczana w przypadku przekroczenia przydzielonego limitu przydziału. Aby uzyskać informacje na temat monitorowania ograniczania przepustowości, zobacz Monitorowanie zarządzanych punktów końcowych online.

Zwróć również uwagę na następujące zachowania:

Wdrożenie można skonfigurować tak, aby odbierało tylko ruch na żywo lub ruch dublowany, a nie oba.
Podczas wywoływania punktu końcowego można określić nazwę dowolnego z jego wdrożeń — nawet wdrożenia w tle — aby zwrócić przewidywanie.
Po wywołaniu punktu końcowego z nazwą wdrożenia, które będzie odbierać ruch przychodzący, usługa Azure Machine Learning nie będzie dublować ruchu do wdrożenia w tle. Usługa Azure Machine Learning dubluje ruch do wdrożenia w tle z ruchu wysyłanego do punktu końcowego, gdy nie określisz wdrożenia.

Teraz ustawmy zielone wdrożenie tak, aby odbierało 10% ruchu dublowanego. Klienci nadal będą otrzymywać przewidywania tylko z niebieskiego wdrożenia.

Diagram przedstawiający 10% ruchu dublowanego do jednego wdrożenia.

Następujące polecenie dubluje 10% ruchu do green wdrożenia:

az ml online-endpoint update --name $ENDPOINT_NAME --mirror-traffic "green=10"

Ruch dublowany można przetestować, wywołując punkt końcowy kilka razy bez określania wdrożenia w celu odbierania ruchu przychodzącego:

for i in {1..20} ; do
    az ml online-endpoint invoke --name $ENDPOINT_NAME --request-file endpoints/online/model-1/sample-request.json
done

Możesz potwierdzić, że określony procent ruchu został wysłany do green wdrożenia, wyświetlając dzienniki z wdrożenia:

az ml online-deployment get-logs --name blue --endpoint $ENDPOINT_NAME

Po przetestowaniu można ustawić ruch dublowania na zero, aby wyłączyć dublowanie:

az ml online-endpoint update --name $ENDPOINT_NAME --mirror-traffic "green=0"

Następujące polecenie dubluje 10% ruchu do green wdrożenia:

endpoint.mirror_traffic = {"green": 10}
ml_client.begin_create_or_update(endpoint).result()

Ruch dublowany można przetestować, wywołując punkt końcowy kilka razy bez określania wdrożenia w celu odbierania ruchu przychodzącego:

# You can test mirror traffic by invoking the endpoint several times
for i in range(20):
    ml_client.online_endpoints.invoke(
        endpoint_name=online_endpoint_name,
        request_file="../model-1/sample-request.json",
    )

Możesz potwierdzić, że określony procent ruchu został wysłany do green wdrożenia, wyświetlając dzienniki z wdrożenia:

ml_client.online_deployments.get_logs(
    name="green", endpoint_name=online_endpoint_name, lines=50
)

Po przetestowaniu można ustawić ruch dublowania na zero, aby wyłączyć dublowanie:

endpoint.mirror_traffic = {"green": 0}
ml_client.begin_create_or_update(endpoint).result()

Aby zdublować 10% ruchu do green wdrożenia:

Na stronie Szczegóły punktu końcowego wybierz pozycję Aktualizuj ruch.
Przesuń przycisk , aby włączyć ruch dublowany.
Wybierz zielone wdrożenie w menu rozwijanym "Nazwa wdrożenia".
Zachowaj domyślną alokację ruchu na 10%.
Wybierz Aktualizuj.

Strona szczegółów punktu końcowego zawiera teraz dublowaną alokację green ruchu w wysokości 10% do wdrożenia.

Aby przetestować ruch dublowany, zobacz karty interfejsu wiersza polecenia platformy Azure lub języka Python, aby wywołać punkt końcowy kilka razy. Upewnij się, że określony procent ruchu został wysłany do green wdrożenia, widząc dzienniki z wdrożenia. Dostęp do dzienników wdrażania można uzyskać na karcie Dzienniki wdrażania punktu końcowego. Możesz również użyć metryk i dzienników, aby monitorować wydajność dublowanego ruchu. Aby uzyskać więcej informacji, zobacz Monitorowanie punktów końcowych online.

Po przetestowaniu można wyłączyć dublowanie:

Na stronie Szczegóły punktu końcowego wybierz pozycję Aktualizuj ruch.
Przesuń przycisk obok pozycji Włącz ruch dublowany ponownie, aby wyłączyć ruch dublowany.
Wybierz Aktualizuj.

Przydzielanie niewielkiego procentu ruchu na żywo do nowego wdrożenia

Po przetestowaniu green wdrożenia przydziel do niego niewielki procent ruchu:

az ml online-endpoint update --name $ENDPOINT_NAME --traffic "blue=90 green=10"

Po przetestowaniu green wdrożenia przydziel do niego niewielki procent ruchu:

endpoint.traffic = {"blue": 90, "green": 10}
ml_client.begin_create_or_update(endpoint).result()

Napiwek

Łączna wartość procentowa ruchu musi wynosić 0% (aby wyłączyć ruch) lub 100% (aby włączyć ruch).

green Teraz wdrożenie odbiera 10% całego ruchu na żywo. Klienci otrzymają przewidywania zarówno z wdrożeń, jak blue i green .

Diagram przedstawiający podział ruchu między wdrożeniami.

Wysyłanie całego ruchu do nowego wdrożenia

Po pełnym zadowoleniu green z wdrożenia przełącz cały ruch do niego.

az ml online-endpoint update --name $ENDPOINT_NAME --traffic "blue=0 green=100"

Po pełnym zadowoleniu green z wdrożenia przełącz cały ruch do niego.

endpoint.traffic = {"blue": 0, "green": 100}
ml_client.begin_create_or_update(endpoint).result()

Usuwanie starego wdrożenia

Wykonaj poniższe kroki, aby usunąć pojedyncze wdrożenie z zarządzanego punktu końcowego online. Usunięcie pojedynczego wdrożenia ma wpływ na inne wdrożenia w zarządzanym punkcie końcowym online:

az ml online-deployment delete --name blue --endpoint $ENDPOINT_NAME --yes --no-wait

ml_client.online_deployments.begin_delete(
    name="blue", endpoint_name=online_endpoint_name
).wait()

Usuwanie punktu końcowego i wdrożenia

Jeśli nie zamierzasz używać punktu końcowego i wdrożenia, usuń je. Usunięcie punktu końcowego spowoduje również usunięcie wszystkich jego podstawowych wdrożeń.

az ml online-endpoint delete --name $ENDPOINT_NAME --yes --no-wait

Jeśli nie zamierzasz używać punktu końcowego i wdrożenia, usuń je. Usunięcie punktu końcowego spowoduje również usunięcie wszystkich jego podstawowych wdrożeń.

ml_client.online_endpoints.begin_delete(name=online_endpoint_name)

Udostępnij za pośrednictwem

Wykonywanie bezpiecznego wdrażania nowych wdrożeń na potrzeby wnioskowania w czasie rzeczywistym

Wymagania wstępne

Przygotowywanie systemu

Ustawianie zmiennych środowiskowych

Klonowanie repozytorium przykładów

Klonowanie repozytorium przykładów

Nawiązywanie połączenia z obszarem roboczym usługi Azure Machine Learning

Klonowanie repozytorium przykładów

Pobieranie plików z repozytorium przykładów

Definiowanie punktu końcowego i wdrożenia

Definiowanie punktu końcowego

Definiowanie wdrożenia

Tworzenie punktu końcowego online

Tworzenie wdrożenia "niebieskiego"

Tworzenie punktu końcowego online

Tworzenie wdrożenia "niebieskiego"

Rejestrowanie modelu

Tworzenie zarządzanego punktu końcowego online i wdrożenia "niebieskiego"

Potwierdzanie istniejącego wdrożenia

Wywoływanie punktu końcowego z nazwą wdrożenia

Wywoływanie punktu końcowego bez określania wdrożenia

Testowanie punktu końcowego przy użyciu przykładowych danych

Testowanie punktu końcowego przy użyciu przykładowych danych

Wyświetlanie zarządzanych punktów końcowych online

Testowanie punktu końcowego przy użyciu przykładowych danych

Skalowanie istniejącego wdrożenia w celu obsługi większej liczby ruchu

Pobieranie szczegółów punktu końcowego

Wdrażanie nowego modelu, ale wysyłanie go jeszcze nie ma ruchu

Testowanie nowego wdrożenia

Testowanie nowego wdrożenia

Testowanie nowego wdrożenia

Testowanie wdrożenia przy użyciu ruchu dublowanego

Przydzielanie niewielkiego procentu ruchu na żywo do nowego wdrożenia

Wysyłanie całego ruchu do nowego wdrożenia

Usuwanie starego wdrożenia

Usuwanie punktu końcowego i wdrożenia

Opinia

Dodatkowe zasoby

Udostępnij za pośrednictwem

Wykonywanie bezpiecznego wdrażania nowych wdrożeń na potrzeby wnioskowania w czasie rzeczywistym

Wymagania wstępne

Przygotowywanie systemu

Ustawianie zmiennych środowiskowych

Klonowanie repozytorium przykładów

Definiowanie punktu końcowego i wdrożenia

Definiowanie punktu końcowego

Definiowanie wdrożenia

Tworzenie punktu końcowego online

Tworzenie wdrożenia "niebieskiego"

Potwierdzanie istniejącego wdrożenia

Wywoływanie punktu końcowego z nazwą wdrożenia

Wywoływanie punktu końcowego bez określania wdrożenia

Testowanie punktu końcowego przy użyciu przykładowych danych

Skalowanie istniejącego wdrożenia w celu obsługi większej liczby ruchu

Wdrażanie nowego modelu, ale wysyłanie go jeszcze nie ma ruchu

Testowanie nowego wdrożenia

Testowanie wdrożenia przy użyciu ruchu dublowanego

Przydzielanie niewielkiego procentu ruchu na żywo do nowego wdrożenia

Wysyłanie całego ruchu do nowego wdrożenia

Usuwanie starego wdrożenia

Usuwanie punktu końcowego i wdrożenia

Powiązana zawartość

Opinia

Dodatkowe zasoby