AksEndpointDeploymentConfiguration Klasa
Uwaga
Jest to klasa eksperymentalna i może ulec zmianie w dowolnym momencie. Aby uzyskać więcej informacji, zobacz https://aka.ms/azuremlexperimental.
Reprezentuje informacje o konfiguracji wdrożenia dla usługi wdrożonej na Azure Kubernetes Service.
Utwórz obiekt AksEndpointDeploymentConfiguration przy użyciu deploy_configuration
metody AksEndpoint klasy .
Inicjowanie obiektu konfiguracji na potrzeby wdrażania punktu końcowego w docelowym obiekcie obliczeniowym usługi AKS.
- Dziedziczenie
-
AksEndpointDeploymentConfiguration
Konstruktor
AksEndpointDeploymentConfiguration(autoscale_enabled, autoscale_min_replicas, autoscale_max_replicas, autoscale_refresh_seconds, autoscale_target_utilization, collect_model_data, auth_enabled, cpu_cores, memory_gb, enable_app_insights, scoring_timeout_ms, replica_max_concurrent_requests, max_request_wait_time, num_replicas, primary_key, secondary_key, tags, properties, description, gpu_cores, period_seconds, initial_delay_seconds, timeout_seconds, success_threshold, failure_threshold, namespace, token_auth_enabled, version_name, traffic_percentile, compute_target_name, cpu_cores_limit, memory_gb_limit)
Parametry
Nazwa | Opis |
---|---|
autoscale_enabled
Wymagane
|
Czy włączyć skalowanie automatyczne dla tej usługi sieci Web.
Wartość domyślna to True, jeśli |
autoscale_min_replicas
Wymagane
|
Minimalna liczba kontenerów do użycia podczas skalowania automatycznego tej usługi sieci Web. Wartość domyślna to 1. |
autoscale_max_replicas
Wymagane
|
Maksymalna liczba kontenerów do użycia podczas automatycznego skalowania tej usługi sieci Web. Wartość domyślna to 10. |
autoscale_refresh_seconds
Wymagane
|
Jak często autoskalator powinien próbować skalować tę usługę internetową. Wartość domyślna to 1. |
autoscale_target_utilization
Wymagane
|
Użycie docelowe (w procentach na 100) autoskalator powinien podjąć próbę utrzymania dla tej usługi sieci Web. Wartość domyślna to 70. |
collect_model_data
Wymagane
|
Czy włączyć zbieranie danych modelu dla tej usługi sieci Web. Wartość domyślna to False. |
auth_enabled
Wymagane
|
Niezależnie od tego, czy włączyć uwierzytelnianie dla tej usługi sieci Web. Wartość domyślna to True. |
cpu_cores
Wymagane
|
Liczba rdzeni procesora, które mają być przydzielane dla tej usługi sieci Web. Może to być liczba dziesiętna. Wartość domyślna to 0.1 |
memory_gb
Wymagane
|
Ilość pamięci (w GB), która ma być przydzielana dla tej usługi sieci Web. Może to być liczba dziesiętna. Wartość domyślna to 0,5 |
enable_app_insights
Wymagane
|
Czy włączyć rejestrowanie usługi Application Insights dla tej usługi sieci Web. Wartość domyślna to False. |
scoring_timeout_ms
Wymagane
|
Limit czasu wymuszania wywołań oceniania dla tej usługi sieci Web. Wartość domyślna to 60000. |
replica_max_concurrent_requests
Wymagane
|
Liczba maksymalnie współbieżnych żądań na replikę, która umożliwia korzystanie z tej usługi sieci Web. Wartość domyślna to 1. Nie zmieniaj tego ustawienia z wartości domyślnej 1, chyba że zostanie poinstruowany przez pomoc techniczną firmy Microsoft lub członek zespołu usługi Azure Machine Learning. |
max_request_wait_time
Wymagane
|
Maksymalny czas, przez jaki żądanie pozostanie w kolejce (w milisekundach) przed zwróceniem błędu 503. Wartość domyślna to 500. |
num_replicas
Wymagane
|
Liczba kontenerów do przydzielenia dla tej usługi sieci Web. Nie ma wartości domyślnej, jeśli ten parametr nie jest ustawiony, autoskalator jest domyślnie włączony. |
primary_key
Wymagane
|
Podstawowy klucz uwierzytelniania do użycia dla tej usługi sieci Web |
secondary_key
Wymagane
|
Pomocniczy klucz uwierzytelniania do użycia dla tej usługi sieci Web |
tags
Wymagane
|
Słownik tagów wartości klucza, aby nadać tej usłudze sieci Web |
properties
Wymagane
|
Słownik właściwości wartości klucza, aby nadać tej usłudze sieci Web. Nie można zmienić tych właściwości po wdrożeniu, jednak można dodać nowe pary wartości klucza. |
description
Wymagane
|
Opis, który ma nadać tej usłudze sieci Web. |
gpu_cores
Wymagane
|
Liczba rdzeni procesora GPU do przydzielenia dla tej usługi sieci Web. Wartość domyślna to 0. |
period_seconds
Wymagane
|
Jak często (w sekundach) wykonać sondę liveness. Wartość domyślna to 10 sekund. Wartość minimalna to 1. |
initial_delay_seconds
Wymagane
|
Liczba sekund po uruchomieniu kontenera przed zainicjowanymi sondami liveness. Wartość domyślna to 310. |
timeout_seconds
Wymagane
|
Liczba sekund, po których upłynął limit czasu sondy liveness. Wartość domyślna to 2 sekundy. Wartość minimalna to 1. |
success_threshold
Wymagane
|
Minimalna liczba kolejnych sukcesów dla sondy liveness, która ma zostać uznana za pomyślną po nieudanej awarii. Wartość domyślna to 1. Wartość minimalna to 1. |
failure_threshold
Wymagane
|
Gdy zasobnik zostanie uruchomiony, a sonda liveness zakończy się niepowodzeniem, platforma Kubernetes spróbuje |
namespace
Wymagane
|
Przestrzeń nazw platformy Kubernetes, w której ma zostać wdrożona ta usługa sieci Web: do 63 małych liter alfanumeryczne ('a'-'z', '0'-'9') i łącznika ('-'). Pierwsze i ostatnie znaki nie mogą być łącznikami. |
token_auth_enabled
Wymagane
|
Niezależnie od tego, czy włączyć uwierzytelnianie usługi Azure Active Directory dla tej usługi sieci Web. Jeśli ta opcja jest włączona, użytkownicy mogą uzyskiwać dostęp do tej usługi sieci Web, pobierając token dostępu przy użyciu poświadczeń usługi Azure Active Directory. Wartość domyślna to False. |
version_name
Wymagane
|
Nazwa wersji w punkcie końcowym. |
traffic_percentile
Wymagane
|
Ilość ruchu, który jest pobierana przez wersję w punkcie końcowym. |
cpu_cores_limit
Wymagane
|
Maksymalna liczba rdzeni procesora cpu, z których może korzystać ta usługa sieci Web. Może to być liczba dziesiętna. |
memory_gb_limit
Wymagane
|
Maksymalna ilość pamięci (w GB) dozwolonej przez tę usługę sieci Web. Może to być liczba dziesiętna. |
autoscale_enabled
Wymagane
|
Czy włączyć skalowanie automatyczne dla tej usługi sieci Web.
Wartość domyślna to True, jeśli |
autoscale_min_replicas
Wymagane
|
Minimalna liczba kontenerów do użycia podczas skalowania automatycznego tej usługi sieci Web. Wartość domyślna to 1. |
autoscale_max_replicas
Wymagane
|
Maksymalna liczba kontenerów do użycia podczas automatycznego skalowania tej usługi sieci Web. Wartość domyślna to 10. |
autoscale_refresh_seconds
Wymagane
|
Jak często autoskalator powinien próbować skalować tę usługę internetową. Wartość domyślna to 1. |
autoscale_target_utilization
Wymagane
|
Użycie docelowe (w procentach na 100) autoskalator powinien podjąć próbę utrzymania dla tej usługi sieci Web. Wartość domyślna to 70. |
collect_model_data
Wymagane
|
Czy włączyć zbieranie danych modelu dla tej usługi sieci Web. Wartość domyślna to False. |
auth_enabled
Wymagane
|
Niezależnie od tego, czy włączyć uwierzytelnianie dla tej usługi sieci Web. Wartość domyślna to True. |
cpu_cores
Wymagane
|
Liczba rdzeni procesora, które mają być przydzielane dla tej usługi sieci Web. Może to być liczba dziesiętna. Wartość domyślna to 0.1 |
memory_gb
Wymagane
|
Ilość pamięci (w GB) do przydzielenia dla tej usługi sieci Web. Może to być liczba dziesiętna. Wartość domyślna to 0,5 |
enable_app_insights
Wymagane
|
Czy włączyć rejestrowanie usługi Application Insights dla tej usługi sieci Web. Wartość domyślna to False. |
scoring_timeout_ms
Wymagane
|
Limit czasu wymuszany dla wywołań oceniania do tej usługi sieci Web. Wartość domyślna to 60000. |
replica_max_concurrent_requests
Wymagane
|
Maksymalna liczba współbieżnych żądań na replikę w celu zezwolenia na tę usługę sieci Web. Wartość domyślna to 1. Nie zmieniaj tego ustawienia z wartości domyślnej 1, chyba że zostanie to poinstruowane przez pomoc techniczną firmy Microsoft lub członka zespołu usługi Azure Machine Learning. |
max_request_wait_time
Wymagane
|
Maksymalny czas oczekiwania żądania pozostanie w kolejce (w milisekundach) przed zwróceniem błędu 503. Wartość domyślna to 500. |
num_replicas
Wymagane
|
Liczba kontenerów do przydzielenia dla tej usługi sieci Web. Nie, jeśli ten parametr nie jest ustawiony, autoskalator jest domyślnie włączony. |
primary_key
Wymagane
|
Podstawowy klucz uwierzytelniania do użycia dla tej usługi sieci Web |
secondary_key
Wymagane
|
Pomocniczy klucz uwierzytelniania do użycia dla tej usługi sieci Web |
tags
Wymagane
|
Słownik tagów wartości klucza, aby nadać tej usłudze sieci Web |
properties
Wymagane
|
Słownik właściwości wartości klucza, aby nadać tej usłudze sieci Web. Tych właściwości nie można zmienić po wdrożeniu, jednak można dodać nowe pary wartości klucza. |
description
Wymagane
|
Opis umożliwiający nadanie tej usłudze sieci Web. |
gpu_cores
Wymagane
|
Liczba rdzeni procesora GPU do przydzielenia dla tej usługi sieci Web. Wartość domyślna to 0. |
period_seconds
Wymagane
|
Jak często (w sekundach) wykonać sondę liveness. Wartość domyślna to 10 sekund. Wartość minimalna to 1. |
initial_delay_seconds
Wymagane
|
Liczba sekund po uruchomieniu kontenera przed zainicjowaniem sond dynamicznych. Wartość domyślna to 310. |
timeout_seconds
Wymagane
|
Liczba sekund, po których upłynął limit czasu sondy utrzymania. Wartość domyślna to 2 sekundy. Wartość minimalna to 1. |
success_threshold
Wymagane
|
Minimalna liczba kolejnych sukcesów dla sondy utrzymania, która ma zostać uznana za pomyślną po niepowieść. Wartość domyślna to 1. Wartość minimalna to 1. |
failure_threshold
Wymagane
|
Gdy zasobnik zostanie uruchomiony, a sonda aktualności zakończy się niepowodzeniem, platforma Kubernetes spróbuje kilka razy |
namespace
Wymagane
|
Przestrzeń nazw Kubernetes, w której ma zostać wdrożona ta usługa internetowa: maksymalnie 63 małe litery alfanumeryczne ('a'-'z', '0'-'9') i znaki łącznika ('-'). Pierwsze i ostatnie znaki nie mogą być łącznikami. |
token_auth_enabled
Wymagane
|
Czy włączyć uwierzytelnianie usługi Azure Active Directory dla tej usługi internetowej. Jeśli ta opcja jest włączona, użytkownicy mogą uzyskiwać dostęp do tej usługi internetowej, pobierając token dostępu przy użyciu poświadczeń usługi Azure Active Directory. Wartość domyślna to False. |
version_name
Wymagane
|
Nazwa wersji w punkcie końcowym. |
traffic_percentile
Wymagane
|
Ilość ruchu, który jest pobierana przez wersję w punkcie końcowym. |
compute_target_name
Wymagane
|
Nazwa docelowego obiektu obliczeniowego do wdrożenia w |
cpu_cores_limit
Wymagane
|
Maksymalna liczba rdzeni procesora cpu, z których może korzystać ta usługa sieci Web. Może to być liczba dziesiętna. |
memory_gb_limit
Wymagane
|
Maksymalna ilość pamięci (w GB) dozwolonej przez tę usługę sieci Web. Może to być liczba dziesiętna. |
Zmienne
Nazwa | Opis |
---|---|
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.autoscale_enabled
|
Określa, czy włączyć skalowanie automatyczne dla tej usługi sieci Web. Wartość domyślna to True, jeśli |
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.autoscale_min_replicas
|
Minimalna liczba kontenerów do użycia podczas skalowania automatycznego tej usługi sieci Web. Wartość domyślna to 1. |
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.autoscale_max_replicas
|
Maksymalna liczba kontenerów do użycia podczas skalowania automatycznego tej usługi sieci Web. Wartość domyślna to 10. |
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.autoscale_refresh_seconds
|
Jak często autoskalator powinien próbować skalować tę usługę internetową. Wartość domyślna to 1. |
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.autoscale_target_utilization
|
Docelowe wykorzystanie (w procentach na 100) autoskalator powinien podjąć próbę utrzymania dla tej usługi sieci Web. Wartość domyślna to 70. |
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.collect_model_data
|
Określa, czy włączyć zbieranie danych modelu dla tej usługi sieci Web. Wartość domyślna to False. |
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.auth_enabled
|
Określa, czy włączyć uwierzytelnianie dla tej usługi sieci Web. Wartość domyślna to True. |
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.cpu_cores
|
Liczba rdzeni procesora cpu do przydzielenia dla tej usługi sieci Web. Może to być liczba dziesiętna. Wartość domyślna to 0.1 |
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.memory_gb
|
Ilość pamięci (w GB) do przydzielenia dla tej usługi sieci Web. Może to być liczba dziesiętna. Wartość domyślna to 0,5 |
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.enable_app_insights
|
Czy włączyć rejestrowanie usługi Application Insights dla tej usługi sieci Web. Wartość domyślna to False. |
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.scoring_timeout_ms
|
Limit czasu wymuszany dla wywołań oceniania do tej usługi sieci Web. Wartość domyślna to 60000. |
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.replica_max_concurrent_requests
|
Maksymalna liczba współbieżnych żądań na replikę w celu zezwolenia na tę usługę sieci Web. Wartość domyślna to 1. Nie zmieniaj tego ustawienia z wartości domyślnej 1, chyba że zostanie to poinstruowane przez pomoc techniczną firmy Microsoft lub członka zespołu usługi Azure Machine Learning. |
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.max_request_wait_time
|
Maksymalny czas oczekiwania żądania pozostanie w kolejce (w milisekundach) przed zwróceniem błędu 503. Wartość domyślna to 500. |
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.num_replicas
|
Liczba kontenerów do przydzielenia dla tej usługi sieci Web. Nie, jeśli ten parametr nie jest ustawiony, autoskalator jest domyślnie włączony. |
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.primary_key
|
Podstawowy klucz uwierzytelniania do użycia dla tej usługi sieci Web |
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.secondary_key
|
Pomocniczy klucz uwierzytelniania do użycia dla tej usługi sieci Web |
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.tags
|
Słownik tagów wartości klucza, aby nadać tej usłudze sieci Web |
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.properties
|
Słownik właściwości wartości klucza, aby nadać tej usłudze sieci Web. Tych właściwości nie można zmienić po wdrożeniu, jednak można dodać nowe pary wartości klucza. |
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.description
|
Opis umożliwiający nadanie tej usłudze sieci Web. |
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.gpu_cores
|
Liczba rdzeni procesora GPU do przydzielenia dla tej usługi sieci Web. Wartość domyślna to 0. |
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.period_seconds
|
Jak często (w sekundach) wykonać sondę liveness. Wartość domyślna to 10 sekund. Wartość minimalna to 1. |
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.initial_delay_seconds
|
Liczba sekund po uruchomieniu kontenera przed zainicjowaniem sond dynamicznych. Wartość domyślna to 310. |
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.timeout_seconds
|
Liczba sekund, po których upłynął limit czasu sondy liveness. Wartość domyślna to 2 sekundy. Wartość minimalna to 1. |
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.success_threshold
|
Minimalna liczba kolejnych sukcesów dla sondy liveness, która ma zostać uznana za pomyślną po nieudanej awarii. Wartość domyślna to 1. Wartość minimalna to 1. |
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.failure_threshold
|
Gdy zasobnik zostanie uruchomiony, a sonda liveness zakończy się niepowodzeniem, platforma Kubernetes spróbuje |
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.namespace
|
Przestrzeń nazw platformy Kubernetes, w której ma zostać wdrożona ta usługa sieci Web: do 63 małych liter alfanumeryczne ('a'-'z', '0'-'9') i łącznika ('-'). Pierwsze i ostatnie znaki nie mogą być łącznikami. |
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.token_auth_enabled
|
Niezależnie od tego, czy włączyć uwierzytelnianie usługi Azure Active Directory dla tej usługi sieci Web. Jeśli ta opcja jest włączona, użytkownicy mogą uzyskiwać dostęp do tej usługi sieci Web, pobierając token dostępu przy użyciu poświadczeń usługi Azure Active Directory. Wartość domyślna to False. |
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.version_name
|
Nazwa wersji w punkcie końcowym. |
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.traffic_percentile
|
Ilość ruchu, który jest pobierana przez wersję w punkcie końcowym. |
Metody
validate_endpoint_configuration |
Sprawdź, czy określone wartości konfiguracji są prawidłowe. Jeśli walidacja nie powiedzie się, wywoła wyjątek WebserviceException. |
validate_endpoint_configuration
Sprawdź, czy określone wartości konfiguracji są prawidłowe.
Jeśli walidacja nie powiedzie się, wywoła wyjątek WebserviceException.
validate_endpoint_configuration()
Wyjątki
Typ | Opis |
---|---|