AksWebservice Klasa
Reprezentuje model uczenia maszynowego wdrożony jako punkt końcowy usługi internetowej w Azure Kubernetes Service.
Wdrożona usługa jest tworzona na podstawie modelu, skryptu i skojarzonych plików. Wynikowa usługa internetowa to punkt końcowy HTTP o zrównoważonym obciążeniu z interfejsem API REST. Dane można wysyłać do tego interfejsu API i otrzymywać przewidywania zwrócone przez model.
Usługa AksWebservice wdraża pojedynczą usługę w jednym punkcie końcowym. Aby wdrożyć wiele usług w jednym punkcie końcowym, użyj AksEndpoint klasy .
Aby uzyskać więcej informacji, zobacz Wdrażanie modelu w klastrze Azure Kubernetes Service.
Zainicjuj wystąpienie usługi internetowej.
Konstruktor usługi internetowej pobiera reprezentację w chmurze obiektu usługi internetowej skojarzonego z podanym obszarem roboczym. Zwróci wystąpienie klasy podrzędnej odpowiadające określonemu typowi pobranego obiektu usługi sieci Web.
- Dziedziczenie
-
AksWebservice
Konstruktor
AksWebservice(workspace, name)
Parametry
Nazwa | Opis |
---|---|
workspace
Wymagane
|
Obiekt obszaru roboczego zawierający obiekt usługi sieci Web do pobrania. |
name
Wymagane
|
Nazwa obiektu webservice do pobrania. |
Uwagi
Zalecanym wzorcem wdrażania jest utworzenie obiektu konfiguracji wdrożenia za deploy_configuration
pomocą metody , a następnie użycie go z deploy
metodą Model klasy, jak pokazano poniżej.
# Set the web service configuration (using default here)
aks_config = AksWebservice.deploy_configuration()
# # Enable token auth and disable (key) auth on the webservice
# aks_config = AksWebservice.deploy_configuration(token_auth_enabled=True, auth_enabled=False)
Pełna próbka jest dostępna w witrynie https://github.com/Azure/MachineLearningNotebooks/blob/master/how-to-use-azureml/deployment/production-deploy-to-aks/production-deploy-to-aks.ipynb
Istnieje wiele sposobów wdrażania modelu jako usługi internetowej, w tym następujących elementów:
deploy
Model metoda dla modeli już zarejestrowanych w obszarze roboczym.deploy_from_image
Webservicemetoda .deploy_from_model
Webservice metoda dla modeli już zarejestrowanych w obszarze roboczym. Ta metoda spowoduje utworzenie obrazu.deploy
Webservicemetoda , która zarejestruje model i utworzy obraz.
Aby uzyskać informacje na temat pracy z usługami internetowymi, zobacz
Korzystanie z modelu usługi Azure Machine Learning wdrożonego jako usługa internetowa
Monitorowanie i zbieranie danych z punktów końcowych usługi internetowej ML
Sekcja Zmienne zawiera listę atrybutów lokalnej reprezentacji obiektu cloud AksWebservice. Te zmienne powinny być traktowane jako tylko do odczytu. Zmiana ich wartości nie zostanie odzwierciedlona w odpowiednim obiekcie chmury.
Zmienne
Nazwa | Opis |
---|---|
enable_app_insights
|
Określa, czy rejestrowanie w usłudze AppInsights jest włączone dla usługi internetowej. |
autoscaler
|
Obiekt autoskalatora dla usługi internetowej. |
compute_name
|
Nazwa obiektu ComputeTarget, w ramach którego wdrożono usługę internetową. |
container_resource_requirements
|
Wymagania dotyczące zasobów kontenera dla usługi internetowej. |
liveness_probe_requirements
|
Wymagania sondy utrzymania dla usługi internetowej. |
data_collection
|
Obiekt DataCollection dla usługi sieci Web. |
max_concurrent_requests_per_container
|
Maksymalna liczba współbieżnych żądań na kontener dla usługi internetowej. |
max_request_wait_time
|
Maksymalny czas oczekiwania żądania dla usługi internetowej (w milisekundach). |
num_replicas
|
Liczba replik usługi sieci Web. Każda replika odpowiada zasobnikowi usługi AKS. |
scoring_timeout_ms
|
Limit czasu oceniania dla usługi internetowej w milisekundach. |
azureml.core.webservice.AksWebservice.scoring_uri
|
Punkt końcowy oceniania dla usługi internetowej |
is_default
|
Jeśli usługa sieci Web jest domyślną wersją nadrzędnego punktu końcowego AksEndpoint. |
traffic_percentile
|
Jaki procent ruchu ma być kierowany do usługi internetowej w nadrzędnym elemencie AksEndpoint. |
version_type
|
Typ wersji usługi internetowej w nadrzędnym AksEndpoint. |
token_auth_enabled
|
Określa, czy dla usługi sieci Web jest włączone uwierzytelnianie tokenu. |
environment
|
Obiekt Environment, który został użyty do utworzenia usługi sieci Web. |
azureml.core.webservice.AksWebservice.models
|
Lista modeli wdrożonych w usłudze internetowej. |
deployment_status
|
Stan wdrożenia usługi sieci Web. |
namespace
|
Przestrzeń nazw usługi AKS usługi internetowej. |
azureml.core.webservice.AksWebservice.swagger_uri
|
Punkt końcowy struktury Swagger dla usługi internetowej. |
Metody
add_properties |
Dodaj pary wartości klucza do słownika właściwości tej usługi sieci Web. |
add_tags |
Dodaj pary klucz-wartość do słownika tagów tej usługi sieci Web. Wywołuje element WebserviceException. |
deploy_configuration |
Utwórz obiekt konfiguracji na potrzeby wdrażania w docelowym obiekcie obliczeniowym usługi AKS. |
get_access_token |
Pobierz token uwierzytelniania dla tej usługi sieci Web. |
get_token |
PRZESTARZAŁE. Zamiast tego użyj Pobierz token uwierzytelniania dla tej usługi sieci Web. |
remove_tags |
Usuń określone klucze ze słownika tagów tej usługi sieci Web. |
run |
Wywołaj tę usługę sieci Web przy użyciu podanych danych wejściowych. |
serialize |
Przekonwertuj tę usługę internetową na słownik serializacji JSON. |
update |
Zaktualizuj usługę internetową przy użyciu podanych właściwości. Wartości pozostawione jako Brak pozostaną niezmienione w tej usłudze sieci Web. |
add_properties
Dodaj pary wartości klucza do słownika właściwości tej usługi sieci Web.
add_properties(properties)
Parametry
Nazwa | Opis |
---|---|
properties
Wymagane
|
Słownik właściwości do dodania. |
add_tags
Dodaj pary klucz-wartość do słownika tagów tej usługi sieci Web.
Wywołuje element WebserviceException.
add_tags(tags)
Parametry
Nazwa | Opis |
---|---|
tags
Wymagane
|
Słownik tagów do dodania. |
Wyjątki
Typ | Opis |
---|---|
deploy_configuration
Utwórz obiekt konfiguracji na potrzeby wdrażania w docelowym obiekcie obliczeniowym usługi AKS.
static deploy_configuration(autoscale_enabled=None, autoscale_min_replicas=None, autoscale_max_replicas=None, autoscale_refresh_seconds=None, autoscale_target_utilization=None, collect_model_data=None, auth_enabled=None, cpu_cores=None, memory_gb=None, enable_app_insights=None, scoring_timeout_ms=None, replica_max_concurrent_requests=None, max_request_wait_time=None, num_replicas=None, primary_key=None, secondary_key=None, tags=None, properties=None, description=None, gpu_cores=None, period_seconds=None, initial_delay_seconds=None, timeout_seconds=None, success_threshold=None, failure_threshold=None, namespace=None, token_auth_enabled=None, compute_target_name=None, cpu_cores_limit=None, memory_gb_limit=None, blobfuse_enabled=None)
Parametry
Nazwa | Opis |
---|---|
autoscale_enabled
|
Określa, czy włączyć skalowanie automatyczne dla tej usługi sieci Web. Wartość domyślna to True, jeśli num_replicas to Brak. Domyślna wartość: None
|
autoscale_min_replicas
|
Minimalna liczba kontenerów do użycia podczas skalowania automatycznego tej usługi sieci Web. Wartość domyślna to 1. Domyślna wartość: None
|
autoscale_max_replicas
|
Maksymalna liczba kontenerów do użycia podczas skalowania automatycznego tej usługi sieci Web. Wartość domyślna to 10. Domyślna wartość: None
|
autoscale_refresh_seconds
|
Jak często autoskalator powinien próbować skalować tę usługę internetową. Wartość domyślna to 1. Domyślna wartość: None
|
autoscale_target_utilization
|
Docelowe wykorzystanie (w procentach na 100) autoskalator powinien podjąć próbę utrzymania dla tej usługi sieci Web. Wartość domyślna to 70. Domyślna wartość: None
|
collect_model_data
|
Określa, czy włączyć zbieranie danych modelu dla tej usługi sieci Web. Wartość domyślna to False. Domyślna wartość: None
|
auth_enabled
|
Określa, czy włączyć uwierzytelnianie klucza dla tej usługi sieci Web. Wartość domyślna to True. Domyślna wartość: None
|
cpu_cores
|
Liczba rdzeni procesora cpu do przydzielenia dla tej usługi sieci Web. Może to być liczba dziesiętna. Wartość domyślna to 0.1. Odpowiada żądaniu rdzenia zasobnika, a nie limitowi w Azure Kubernetes Service. Domyślna wartość: None
|
memory_gb
|
Ilość pamięci (w GB) do przydzielenia dla tej usługi sieci Web. Może to być liczba dziesiętna. Wartość domyślna to 0,5. Odpowiada żądaniu pamięci zasobnika, a nie limitowi w Azure Kubernetes Service. Domyślna wartość: None
|
enable_app_insights
|
Czy włączyć rejestrowanie usługi Application Insights dla tej usługi sieci Web. Wartość domyślna to False. Domyślna wartość: None
|
scoring_timeout_ms
|
Limit czasu wymuszany dla wywołań oceniania do tej usługi sieci Web. Wartość domyślna to 60000. Domyślna wartość: None
|
replica_max_concurrent_requests
|
Maksymalna liczba współbieżnych żądań na replikę w celu zezwolenia na tę usługę sieci Web. Wartość domyślna to 1. Nie zmieniaj tego ustawienia z wartości domyślnej 1, chyba że zostanie to poinstruowane przez pomoc techniczną firmy Microsoft lub członka zespołu usługi Azure Machine Learning. Domyślna wartość: None
|
max_request_wait_time
|
Maksymalny czas oczekiwania żądania pozostanie w kolejce (w milisekundach) przed zwróceniem błędu 503. Wartość domyślna to 500. Domyślna wartość: None
|
num_replicas
|
Liczba kontenerów do przydzielenia dla tej usługi sieci Web. Nie, jeśli ten parametr nie jest ustawiony, autoskalator jest domyślnie włączony. Domyślna wartość: None
|
primary_key
|
Podstawowy klucz uwierzytelniania do użycia dla tej usługi sieci Web. Domyślna wartość: None
|
secondary_key
|
Pomocniczy klucz uwierzytelniania do użycia dla tej usługi sieci Web. Domyślna wartość: None
|
tags
|
Słownik tagów wartości klucza, aby nadać tej usłudze sieci Web. Domyślna wartość: None
|
properties
|
Słownik właściwości wartości klucza, aby nadać tej usłudze sieci Web. Tych właściwości nie można zmienić po wdrożeniu, jednak można dodać nowe pary wartości klucza. Domyślna wartość: None
|
description
|
Opis umożliwiający nadanie tej usłudze sieci Web. Domyślna wartość: None
|
gpu_cores
|
Liczba rdzeni procesora GPU do przydzielenia dla tej usługi sieci Web. Wartość domyślna to 0. Domyślna wartość: None
|
period_seconds
|
Jak często (w sekundach) wykonać sondę liveness. Wartość domyślna to 10 sekund. Wartość minimalna to 1. Domyślna wartość: None
|
initial_delay_seconds
|
Liczba sekund po uruchomieniu kontenera przed zainicjowaniem sond dynamicznych. Wartość domyślna to 310. Domyślna wartość: None
|
timeout_seconds
|
Liczba sekund, po których upłynął limit czasu sondy utrzymania. Wartość domyślna to 2 sekundy. Wartość minimalna to 1. Domyślna wartość: None
|
success_threshold
|
Minimalna liczba kolejnych sukcesów dla sondy utrzymania, która ma zostać uznana za pomyślną po niepowieść. Wartość domyślna to 1. Wartość minimalna to 1. Domyślna wartość: None
|
failure_threshold
|
Po uruchomieniu zasobnika i niepowodzeniu sondy aktualności platforma Kubernetes spróbuje użyć czasu niepowodzeniaThreshold przed rezygnacją. Wartość domyślna to 3. Wartość minimalna to 1. Domyślna wartość: None
|
namespace
|
Przestrzeń nazw Kubernetes, w której ma zostać wdrożona ta usługa internetowa: maksymalnie 63 małe litery alfanumeryczne ('a'-'z', '0'-'9') i znaki łącznika ('-'). Pierwsze i ostatnie znaki nie mogą być łącznikami. Domyślna wartość: None
|
token_auth_enabled
|
Określa, czy włączyć uwierzytelnianie tokenu dla tej usługi sieci Web. Jeśli ta opcja jest włączona, użytkownicy mogą uzyskiwać dostęp do tej usługi internetowej, pobierając token dostępu przy użyciu poświadczeń usługi Azure Active Directory. Wartość domyślna to False. Domyślna wartość: None
|
compute_target_name
|
Nazwa docelowego obiektu obliczeniowego do wdrożenia w Domyślna wartość: None
|
cpu_cores_limit
|
Maksymalna liczba rdzeni procesora CPU, z których może korzystać ta usługa sieci Web. Może to być liczba dziesiętna. Domyślna wartość: None
|
memory_gb_limit
|
Maksymalna ilość pamięci (w GB) dozwolonej przez tę usługę sieci Web. Może to być liczba dziesiętna. Domyślna wartość: None
|
blobfuse_enabled
|
Czy włączyć system blobfuse na potrzeby pobierania modelu dla tej usługi sieci Web. Wartość domyślna to True Domyślna wartość: None
|
Zwraca
Typ | Opis |
---|---|
Obiekt konfiguracji do użycia podczas wdrażania usługi AksWebservice. |
Wyjątki
Typ | Opis |
---|---|
get_access_token
Pobierz token uwierzytelniania dla tej usługi sieci Web.
get_access_token()
Zwraca
Typ | Opis |
---|---|
Obiekt opisujący token uwierzytelniania dla tej usługi sieci Web. |
Wyjątki
Typ | Opis |
---|---|
get_token
PRZESTARZAŁE. Zamiast tego użyj get_access_token
metody .
Pobierz token uwierzytelniania dla tej usługi sieci Web.
get_token()
Zwraca
Typ | Opis |
---|---|
Token uwierzytelniania dla tej usługi internetowej i czas jego odświeżania. |
Wyjątki
Typ | Opis |
---|---|
remove_tags
Usuń określone klucze ze słownika tagów tej usługi sieci Web.
remove_tags(tags)
Parametry
Nazwa | Opis |
---|---|
tags
Wymagane
|
Lista kluczy do usunięcia |
run
Wywołaj tę usługę sieci Web przy użyciu podanych danych wejściowych.
run(input_data)
Parametry
Nazwa | Opis |
---|---|
input_data
Wymagane
|
<xref:varies>
Dane wejściowe wywołujące usługę internetową za pomocą polecenia |
Zwraca
Typ | Opis |
---|---|
Wynik wywoływania usługi sieci Web |
Wyjątki
Typ | Opis |
---|---|
serialize
Przekonwertuj tę usługę internetową na słownik serializacji JSON.
serialize()
Zwraca
Typ | Opis |
---|---|
Reprezentacja JSON tej usługi internetowej. |
update
Zaktualizuj usługę internetową przy użyciu podanych właściwości.
Wartości pozostawione jako Brak pozostaną niezmienione w tej usłudze sieci Web.
update(image=None, autoscale_enabled=None, autoscale_min_replicas=None, autoscale_max_replicas=None, autoscale_refresh_seconds=None, autoscale_target_utilization=None, collect_model_data=None, auth_enabled=None, cpu_cores=None, memory_gb=None, enable_app_insights=None, scoring_timeout_ms=None, replica_max_concurrent_requests=None, max_request_wait_time=None, num_replicas=None, tags=None, properties=None, description=None, models=None, inference_config=None, gpu_cores=None, period_seconds=None, initial_delay_seconds=None, timeout_seconds=None, success_threshold=None, failure_threshold=None, namespace=None, token_auth_enabled=None, cpu_cores_limit=None, memory_gb_limit=None, **kwargs)
Parametry
Nazwa | Opis |
---|---|
image
|
Nowy obraz do wdrożenia w usłudze internetowej Domyślna wartość: None
|
autoscale_enabled
|
Włączanie lub wyłączanie autoskalowania tej usługi sieci Web Domyślna wartość: None
|
autoscale_min_replicas
|
Minimalna liczba kontenerów do użycia podczas skalowania automatycznego tej usługi sieci Web Domyślna wartość: None
|
autoscale_max_replicas
|
Maksymalna liczba kontenerów do użycia podczas skalowania automatycznego tej usługi sieci Web Domyślna wartość: None
|
autoscale_refresh_seconds
|
Jak często autoskalator powinien próbować skalować tę usługę sieci Web Domyślna wartość: None
|
autoscale_target_utilization
|
Wykorzystanie docelowe (w procentach na 100) autoskalator powinien podjąć próbę zachowania dla tej usługi sieci Web Domyślna wartość: None
|
collect_model_data
|
Włączanie lub wyłączanie zbierania danych modelu dla tej usługi sieci Web Domyślna wartość: None
|
auth_enabled
|
Czy włączyć uwierzytelnianie dla tej usługi sieci Web Domyślna wartość: None
|
cpu_cores
|
Liczba rdzeni procesora cpu do przydzielenia dla tej usługi sieci Web. Może to być liczba dziesiętna Domyślna wartość: None
|
memory_gb
|
Ilość pamięci (w GB) do przydzielenia dla tej usługi sieci Web. Może to być liczba dziesiętna Domyślna wartość: None
|
enable_app_insights
|
Czy włączyć rejestrowanie usługi Application Insights dla tej usługi sieci Web Domyślna wartość: None
|
scoring_timeout_ms
|
Limit czasu wymuszany dla wywołań oceniania do tej usługi sieci Web Domyślna wartość: None
|
replica_max_concurrent_requests
|
Maksymalna liczba współbieżnych żądań na replikę w celu zezwolenia na tę usługę sieci Web. Domyślna wartość: None
|
max_request_wait_time
|
Maksymalny czas, przez jaki żądanie pozostanie w kolejce (w milisekundach) przed zwróceniem błędu 503 Domyślna wartość: None
|
num_replicas
|
Liczba kontenerów do przydzielenia dla tej usługi sieci Web Domyślna wartość: None
|
tags
|
Słownik tagów wartości klucza, aby nadać tej usłudze sieci Web. Zastąpi istniejące tagi. Domyślna wartość: None
|
properties
|
Słownik właściwości wartości klucza do dodania do istniejącego słownika właściwości Domyślna wartość: None
|
description
|
Opis umożliwiający nadanie tej usłudze sieci Web Domyślna wartość: None
|
models
|
Lista obiektów modelu do spakowania za pomocą zaktualizowanej usługi Domyślna wartość: None
|
inference_config
|
Obiekt InferenceConfig używany do dostarczania wymaganych właściwości wdrożenia modelu. Domyślna wartość: None
|
gpu_cores
|
Liczba rdzeni procesora GPU do przydzielenia dla tej usługi sieci Web Domyślna wartość: None
|
period_seconds
|
Jak często (w sekundach) wykonać sondę liveness. Wartość domyślna to 10 sekund. Wartość minimalna to 1. Domyślna wartość: None
|
initial_delay_seconds
|
Liczba sekund po uruchomieniu kontenera przed zainicjowaniem sond żywotności. Domyślna wartość: None
|
timeout_seconds
|
Liczba sekund, po których upłynął limit czasu sondy utrzymania. Wartość domyślna to 1 sekunda. Wartość minimalna to 1. Domyślna wartość: None
|
success_threshold
|
Minimalna liczba kolejnych sukcesów sondy utrzymania, która ma zostać uznana za pomyślną po niepowieść. Wartość domyślna to 1. Wartość minimalna to 1. Domyślna wartość: None
|
failure_threshold
|
Po uruchomieniu zasobnika i niepowodzeniu sondy aktualności platforma Kubernetes spróbuje użyć czasu niepowodzeniaThreshold przed rezygnacją. Wartość domyślna to 3. Wartość minimalna to 1. Domyślna wartość: None
|
namespace
|
Przestrzeń nazw Kubernetes, w której ma zostać wdrożona ta usługa internetowa: maksymalnie 63 małe litery alfanumeryczne ('a'-'z', '0'-'9') i znaki łącznika ('-'). Pierwsze i ostatnie znaki nie mogą być łącznikami. Domyślna wartość: None
|
token_auth_enabled
|
Określa, czy włączyć uwierzytelnianie tokenu dla tej usługi sieci Web. Jeśli ta opcja jest włączona, użytkownicy mogą uzyskiwać dostęp do tej usługi internetowej, pobierając token dostępu przy użyciu poświadczeń usługi Azure Active Directory. Wartość domyślna to Fałsz Domyślna wartość: None
|
cpu_cores_limit
|
Maksymalna liczba rdzeni procesora CPU, z których może korzystać ta usługa sieci Web. Może to być liczba dziesiętna. Domyślna wartość: None
|
memory_gb_limit
|
Maksymalna ilość pamięci (w GB) dozwolonej przez tę usługę sieci Web. Może to być liczba dziesiętna. Domyślna wartość: None
|
kwargs
Wymagane
|
<xref:varies>
dołączanie parametrów do obsługi migrowania usługi internetowej AKS do punktu końcowego i wdrożenia online platformy Kubernetes. is_migration=True| False, compute_target=. |
Wyjątki
Typ | Opis |
---|---|