Udostępnij za pośrednictwem


AksEndpointDeploymentConfiguration Klasa

Uwaga

Jest to klasa eksperymentalna i może ulec zmianie w dowolnym momencie. Aby uzyskać więcej informacji, zobacz https://aka.ms/azuremlexperimental.

Reprezentuje informacje o konfiguracji wdrożenia dla usługi wdrożonej na Azure Kubernetes Service.

Utwórz obiekt AksEndpointDeploymentConfiguration przy użyciu deploy_configuration metody AksEndpoint klasy .

Inicjowanie obiektu konfiguracji na potrzeby wdrażania punktu końcowego w docelowym obiekcie obliczeniowym usługi AKS.

Dziedziczenie
AksEndpointDeploymentConfiguration

Konstruktor

AksEndpointDeploymentConfiguration(autoscale_enabled, autoscale_min_replicas, autoscale_max_replicas, autoscale_refresh_seconds, autoscale_target_utilization, collect_model_data, auth_enabled, cpu_cores, memory_gb, enable_app_insights, scoring_timeout_ms, replica_max_concurrent_requests, max_request_wait_time, num_replicas, primary_key, secondary_key, tags, properties, description, gpu_cores, period_seconds, initial_delay_seconds, timeout_seconds, success_threshold, failure_threshold, namespace, token_auth_enabled, version_name, traffic_percentile, compute_target_name, cpu_cores_limit, memory_gb_limit)

Parametry

Nazwa Opis
autoscale_enabled
Wymagane

Czy włączyć skalowanie automatyczne dla tej usługi sieci Web. Wartość domyślna to True, jeśli num_replicas ma wartość None.

autoscale_min_replicas
Wymagane
int

Minimalna liczba kontenerów do użycia podczas skalowania automatycznego tej usługi sieci Web. Wartość domyślna to 1.

autoscale_max_replicas
Wymagane
int

Maksymalna liczba kontenerów do użycia podczas automatycznego skalowania tej usługi sieci Web. Wartość domyślna to 10.

autoscale_refresh_seconds
Wymagane
int

Jak często autoskalator powinien próbować skalować tę usługę internetową. Wartość domyślna to 1.

autoscale_target_utilization
Wymagane
int

Użycie docelowe (w procentach na 100) autoskalator powinien podjąć próbę utrzymania dla tej usługi sieci Web. Wartość domyślna to 70.

collect_model_data
Wymagane

Czy włączyć zbieranie danych modelu dla tej usługi sieci Web. Wartość domyślna to False.

auth_enabled
Wymagane

Niezależnie od tego, czy włączyć uwierzytelnianie dla tej usługi sieci Web. Wartość domyślna to True.

cpu_cores
Wymagane

Liczba rdzeni procesora, które mają być przydzielane dla tej usługi sieci Web. Może to być liczba dziesiętna. Wartość domyślna to 0.1

memory_gb
Wymagane

Ilość pamięci (w GB), która ma być przydzielana dla tej usługi sieci Web. Może to być liczba dziesiętna. Wartość domyślna to 0,5

enable_app_insights
Wymagane

Czy włączyć rejestrowanie usługi Application Insights dla tej usługi sieci Web. Wartość domyślna to False.

scoring_timeout_ms
Wymagane
int

Limit czasu wymuszania wywołań oceniania dla tej usługi sieci Web. Wartość domyślna to 60000.

replica_max_concurrent_requests
Wymagane
int

Liczba maksymalnie współbieżnych żądań na replikę, która umożliwia korzystanie z tej usługi sieci Web. Wartość domyślna to 1. Nie zmieniaj tego ustawienia z wartości domyślnej 1, chyba że zostanie poinstruowany przez pomoc techniczną firmy Microsoft lub członek zespołu usługi Azure Machine Learning.

max_request_wait_time
Wymagane
int

Maksymalny czas, przez jaki żądanie pozostanie w kolejce (w milisekundach) przed zwróceniem błędu 503. Wartość domyślna to 500.

num_replicas
Wymagane
int

Liczba kontenerów do przydzielenia dla tej usługi sieci Web. Nie ma wartości domyślnej, jeśli ten parametr nie jest ustawiony, autoskalator jest domyślnie włączony.

primary_key
Wymagane
str

Podstawowy klucz uwierzytelniania do użycia dla tej usługi sieci Web

secondary_key
Wymagane
str

Pomocniczy klucz uwierzytelniania do użycia dla tej usługi sieci Web

tags
Wymagane

Słownik tagów wartości klucza, aby nadać tej usłudze sieci Web

properties
Wymagane

Słownik właściwości wartości klucza, aby nadać tej usłudze sieci Web. Nie można zmienić tych właściwości po wdrożeniu, jednak można dodać nowe pary wartości klucza.

description
Wymagane
str

Opis, który ma nadać tej usłudze sieci Web.

gpu_cores
Wymagane
int

Liczba rdzeni procesora GPU do przydzielenia dla tej usługi sieci Web. Wartość domyślna to 0.

period_seconds
Wymagane
int

Jak często (w sekundach) wykonać sondę liveness. Wartość domyślna to 10 sekund. Wartość minimalna to 1.

initial_delay_seconds
Wymagane
int

Liczba sekund po uruchomieniu kontenera przed zainicjowanymi sondami liveness. Wartość domyślna to 310.

timeout_seconds
Wymagane
int

Liczba sekund, po których upłynął limit czasu sondy liveness. Wartość domyślna to 2 sekundy. Wartość minimalna to 1.

success_threshold
Wymagane
int

Minimalna liczba kolejnych sukcesów dla sondy liveness, która ma zostać uznana za pomyślną po nieudanej awarii. Wartość domyślna to 1. Wartość minimalna to 1.

failure_threshold
Wymagane
int

Gdy zasobnik zostanie uruchomiony, a sonda liveness zakończy się niepowodzeniem, platforma Kubernetes spróbuje failureThreshold kilka razy przed rezygnacją. Wartość domyślna to 3. Wartość minimalna to 1.

namespace
Wymagane
str

Przestrzeń nazw platformy Kubernetes, w której ma zostać wdrożona ta usługa sieci Web: do 63 małych liter alfanumeryczne ('a'-'z', '0'-'9') i łącznika ('-'). Pierwsze i ostatnie znaki nie mogą być łącznikami.

token_auth_enabled
Wymagane

Niezależnie od tego, czy włączyć uwierzytelnianie usługi Azure Active Directory dla tej usługi sieci Web. Jeśli ta opcja jest włączona, użytkownicy mogą uzyskiwać dostęp do tej usługi sieci Web, pobierając token dostępu przy użyciu poświadczeń usługi Azure Active Directory. Wartość domyślna to False.

version_name
Wymagane
str

Nazwa wersji w punkcie końcowym.

traffic_percentile
Wymagane

Ilość ruchu, który jest pobierana przez wersję w punkcie końcowym.

cpu_cores_limit
Wymagane

Maksymalna liczba rdzeni procesora cpu, z których może korzystać ta usługa sieci Web. Może to być liczba dziesiętna.

memory_gb_limit
Wymagane

Maksymalna ilość pamięci (w GB) dozwolonej przez tę usługę sieci Web. Może to być liczba dziesiętna.

autoscale_enabled
Wymagane

Czy włączyć skalowanie automatyczne dla tej usługi sieci Web. Wartość domyślna to True, jeśli num_replicas ma wartość None.

autoscale_min_replicas
Wymagane
int

Minimalna liczba kontenerów do użycia podczas skalowania automatycznego tej usługi sieci Web. Wartość domyślna to 1.

autoscale_max_replicas
Wymagane
int

Maksymalna liczba kontenerów do użycia podczas automatycznego skalowania tej usługi sieci Web. Wartość domyślna to 10.

autoscale_refresh_seconds
Wymagane
int

Jak często autoskalator powinien próbować skalować tę usługę internetową. Wartość domyślna to 1.

autoscale_target_utilization
Wymagane
int

Użycie docelowe (w procentach na 100) autoskalator powinien podjąć próbę utrzymania dla tej usługi sieci Web. Wartość domyślna to 70.

collect_model_data
Wymagane

Czy włączyć zbieranie danych modelu dla tej usługi sieci Web. Wartość domyślna to False.

auth_enabled
Wymagane

Niezależnie od tego, czy włączyć uwierzytelnianie dla tej usługi sieci Web. Wartość domyślna to True.

cpu_cores
Wymagane

Liczba rdzeni procesora, które mają być przydzielane dla tej usługi sieci Web. Może to być liczba dziesiętna. Wartość domyślna to 0.1

memory_gb
Wymagane

Ilość pamięci (w GB) do przydzielenia dla tej usługi sieci Web. Może to być liczba dziesiętna. Wartość domyślna to 0,5

enable_app_insights
Wymagane

Czy włączyć rejestrowanie usługi Application Insights dla tej usługi sieci Web. Wartość domyślna to False.

scoring_timeout_ms
Wymagane
int

Limit czasu wymuszany dla wywołań oceniania do tej usługi sieci Web. Wartość domyślna to 60000.

replica_max_concurrent_requests
Wymagane
int

Maksymalna liczba współbieżnych żądań na replikę w celu zezwolenia na tę usługę sieci Web. Wartość domyślna to 1. Nie zmieniaj tego ustawienia z wartości domyślnej 1, chyba że zostanie to poinstruowane przez pomoc techniczną firmy Microsoft lub członka zespołu usługi Azure Machine Learning.

max_request_wait_time
Wymagane
int

Maksymalny czas oczekiwania żądania pozostanie w kolejce (w milisekundach) przed zwróceniem błędu 503. Wartość domyślna to 500.

num_replicas
Wymagane
int

Liczba kontenerów do przydzielenia dla tej usługi sieci Web. Nie, jeśli ten parametr nie jest ustawiony, autoskalator jest domyślnie włączony.

primary_key
Wymagane
str

Podstawowy klucz uwierzytelniania do użycia dla tej usługi sieci Web

secondary_key
Wymagane
str

Pomocniczy klucz uwierzytelniania do użycia dla tej usługi sieci Web

tags
Wymagane

Słownik tagów wartości klucza, aby nadać tej usłudze sieci Web

properties
Wymagane

Słownik właściwości wartości klucza, aby nadać tej usłudze sieci Web. Tych właściwości nie można zmienić po wdrożeniu, jednak można dodać nowe pary wartości klucza.

description
Wymagane
str

Opis umożliwiający nadanie tej usłudze sieci Web.

gpu_cores
Wymagane
int

Liczba rdzeni procesora GPU do przydzielenia dla tej usługi sieci Web. Wartość domyślna to 0.

period_seconds
Wymagane
int

Jak często (w sekundach) wykonać sondę liveness. Wartość domyślna to 10 sekund. Wartość minimalna to 1.

initial_delay_seconds
Wymagane
int

Liczba sekund po uruchomieniu kontenera przed zainicjowaniem sond dynamicznych. Wartość domyślna to 310.

timeout_seconds
Wymagane
int

Liczba sekund, po których upłynął limit czasu sondy utrzymania. Wartość domyślna to 2 sekundy. Wartość minimalna to 1.

success_threshold
Wymagane
int

Minimalna liczba kolejnych sukcesów dla sondy utrzymania, która ma zostać uznana za pomyślną po niepowieść. Wartość domyślna to 1. Wartość minimalna to 1.

failure_threshold
Wymagane
int

Gdy zasobnik zostanie uruchomiony, a sonda aktualności zakończy się niepowodzeniem, platforma Kubernetes spróbuje kilka razy failureThreshold przed rezygnacją. Wartość domyślna to 3. Wartość minimalna to 1.

namespace
Wymagane
str

Przestrzeń nazw Kubernetes, w której ma zostać wdrożona ta usługa internetowa: maksymalnie 63 małe litery alfanumeryczne ('a'-'z', '0'-'9') i znaki łącznika ('-'). Pierwsze i ostatnie znaki nie mogą być łącznikami.

token_auth_enabled
Wymagane

Czy włączyć uwierzytelnianie usługi Azure Active Directory dla tej usługi internetowej. Jeśli ta opcja jest włączona, użytkownicy mogą uzyskiwać dostęp do tej usługi internetowej, pobierając token dostępu przy użyciu poświadczeń usługi Azure Active Directory. Wartość domyślna to False.

version_name
Wymagane
str

Nazwa wersji w punkcie końcowym.

traffic_percentile
Wymagane

Ilość ruchu, który jest pobierana przez wersję w punkcie końcowym.

compute_target_name
Wymagane
str

Nazwa docelowego obiektu obliczeniowego do wdrożenia w

cpu_cores_limit
Wymagane

Maksymalna liczba rdzeni procesora cpu, z których może korzystać ta usługa sieci Web. Może to być liczba dziesiętna.

memory_gb_limit
Wymagane

Maksymalna ilość pamięci (w GB) dozwolonej przez tę usługę sieci Web. Może to być liczba dziesiętna.

Zmienne

Nazwa Opis
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.autoscale_enabled

Określa, czy włączyć skalowanie automatyczne dla tej usługi sieci Web. Wartość domyślna to True, jeśli num_replicas ma wartość None.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.autoscale_min_replicas

Minimalna liczba kontenerów do użycia podczas skalowania automatycznego tej usługi sieci Web. Wartość domyślna to 1.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.autoscale_max_replicas

Maksymalna liczba kontenerów do użycia podczas skalowania automatycznego tej usługi sieci Web. Wartość domyślna to 10.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.autoscale_refresh_seconds

Jak często autoskalator powinien próbować skalować tę usługę internetową. Wartość domyślna to 1.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.autoscale_target_utilization

Docelowe wykorzystanie (w procentach na 100) autoskalator powinien podjąć próbę utrzymania dla tej usługi sieci Web. Wartość domyślna to 70.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.collect_model_data

Określa, czy włączyć zbieranie danych modelu dla tej usługi sieci Web. Wartość domyślna to False.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.auth_enabled

Określa, czy włączyć uwierzytelnianie dla tej usługi sieci Web. Wartość domyślna to True.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.cpu_cores

Liczba rdzeni procesora cpu do przydzielenia dla tej usługi sieci Web. Może to być liczba dziesiętna. Wartość domyślna to 0.1

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.memory_gb

Ilość pamięci (w GB) do przydzielenia dla tej usługi sieci Web. Może to być liczba dziesiętna. Wartość domyślna to 0,5

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.enable_app_insights

Czy włączyć rejestrowanie usługi Application Insights dla tej usługi sieci Web. Wartość domyślna to False.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.scoring_timeout_ms

Limit czasu wymuszany dla wywołań oceniania do tej usługi sieci Web. Wartość domyślna to 60000.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.replica_max_concurrent_requests

Maksymalna liczba współbieżnych żądań na replikę w celu zezwolenia na tę usługę sieci Web. Wartość domyślna to 1. Nie zmieniaj tego ustawienia z wartości domyślnej 1, chyba że zostanie to poinstruowane przez pomoc techniczną firmy Microsoft lub członka zespołu usługi Azure Machine Learning.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.max_request_wait_time

Maksymalny czas oczekiwania żądania pozostanie w kolejce (w milisekundach) przed zwróceniem błędu 503. Wartość domyślna to 500.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.num_replicas

Liczba kontenerów do przydzielenia dla tej usługi sieci Web. Nie, jeśli ten parametr nie jest ustawiony, autoskalator jest domyślnie włączony.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.primary_key

Podstawowy klucz uwierzytelniania do użycia dla tej usługi sieci Web

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.secondary_key

Pomocniczy klucz uwierzytelniania do użycia dla tej usługi sieci Web

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.tags

Słownik tagów wartości klucza, aby nadać tej usłudze sieci Web

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.properties

Słownik właściwości wartości klucza, aby nadać tej usłudze sieci Web. Tych właściwości nie można zmienić po wdrożeniu, jednak można dodać nowe pary wartości klucza.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.description

Opis umożliwiający nadanie tej usłudze sieci Web.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.gpu_cores

Liczba rdzeni procesora GPU do przydzielenia dla tej usługi sieci Web. Wartość domyślna to 0.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.period_seconds

Jak często (w sekundach) wykonać sondę liveness. Wartość domyślna to 10 sekund. Wartość minimalna to 1.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.initial_delay_seconds

Liczba sekund po uruchomieniu kontenera przed zainicjowaniem sond dynamicznych. Wartość domyślna to 310.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.timeout_seconds

Liczba sekund, po których upłynął limit czasu sondy liveness. Wartość domyślna to 2 sekundy. Wartość minimalna to 1.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.success_threshold

Minimalna liczba kolejnych sukcesów dla sondy liveness, która ma zostać uznana za pomyślną po nieudanej awarii. Wartość domyślna to 1. Wartość minimalna to 1.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.failure_threshold

Gdy zasobnik zostanie uruchomiony, a sonda liveness zakończy się niepowodzeniem, platforma Kubernetes spróbuje failureThreshold kilka razy przed rezygnacją. Wartość domyślna to 3. Wartość minimalna to 1.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.namespace

Przestrzeń nazw platformy Kubernetes, w której ma zostać wdrożona ta usługa sieci Web: do 63 małych liter alfanumeryczne ('a'-'z', '0'-'9') i łącznika ('-'). Pierwsze i ostatnie znaki nie mogą być łącznikami.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.token_auth_enabled

Niezależnie od tego, czy włączyć uwierzytelnianie usługi Azure Active Directory dla tej usługi sieci Web. Jeśli ta opcja jest włączona, użytkownicy mogą uzyskiwać dostęp do tej usługi sieci Web, pobierając token dostępu przy użyciu poświadczeń usługi Azure Active Directory. Wartość domyślna to False.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.version_name

Nazwa wersji w punkcie końcowym.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.traffic_percentile

Ilość ruchu, który jest pobierana przez wersję w punkcie końcowym.

Metody

validate_endpoint_configuration

Sprawdź, czy określone wartości konfiguracji są prawidłowe.

Jeśli walidacja nie powiedzie się, wywoła wyjątek WebserviceException.

validate_endpoint_configuration

Sprawdź, czy określone wartości konfiguracji są prawidłowe.

Jeśli walidacja nie powiedzie się, wywoła wyjątek WebserviceException.

validate_endpoint_configuration()

Wyjątki

Typ Opis