AksServiceDeploymentConfiguration Klasa
Reprezentuje informacje o konfiguracji wdrożenia dla usługi wdrożonej na Azure Kubernetes Service.
Utwórz obiekt AksServiceDeploymentConfiguration przy użyciu deploy_configuration
metody AksWebservice klasy .
Zainicjuj obiekt konfiguracji do wdrożenia w docelowym obiekcie obliczeniowym usługi AKS.
- Dziedziczenie
-
AksServiceDeploymentConfiguration
Konstruktor
AksServiceDeploymentConfiguration(autoscale_enabled, autoscale_min_replicas, autoscale_max_replicas, autoscale_refresh_seconds, autoscale_target_utilization, collect_model_data, auth_enabled, cpu_cores, memory_gb, enable_app_insights, scoring_timeout_ms, replica_max_concurrent_requests, max_request_wait_time, num_replicas, primary_key, secondary_key, tags, properties, description, gpu_cores, period_seconds, initial_delay_seconds, timeout_seconds, success_threshold, failure_threshold, namespace, token_auth_enabled, compute_target_name, cpu_cores_limit, memory_gb_limit, blobfuse_enabled=None)
Parametry
Nazwa | Opis |
---|---|
cpu_cores_limit
Wymagane
|
Maksymalna liczba rdzeni procesora CPU, z których może korzystać ta usługa sieci Web. Może to być liczba dziesiętna. |
memory_gb_limit
Wymagane
|
Maksymalna ilość pamięci (w GB) dozwolonej przez tę usługę sieci Web. Może to być liczba dziesiętna. |
autoscale_enabled
Wymagane
|
Wskazuje, czy włączyć skalowanie automatyczne dla tej usługi sieci Web.
Wartość domyślna to True, jeśli |
autoscale_min_replicas
Wymagane
|
Minimalna liczba kontenerów do użycia podczas skalowania automatycznego tej usługi sieci Web. Wartość domyślna to 1. |
autoscale_max_replicas
Wymagane
|
Maksymalna liczba kontenerów do użycia podczas skalowania automatycznego tej usługi sieci Web. Wartość domyślna to 10 |
autoscale_refresh_seconds
Wymagane
|
Jak często autoskalator powinien próbować skalować tę usługę internetową. Wartość domyślna to 1. |
autoscale_target_utilization
Wymagane
|
Docelowe wykorzystanie (w procentach na 100) autoskalator powinien podjąć próbę utrzymania dla tej usługi sieci Web. Wartość domyślna to 70. |
collect_model_data
Wymagane
|
Określa, czy włączyć zbieranie danych modelu dla tej usługi sieci Web. Wartość domyślna to False. |
auth_enabled
Wymagane
|
Określa, czy włączyć uwierzytelnianie dla tej usługi sieci Web. Wartość domyślna to True. |
cpu_cores
Wymagane
|
Liczba rdzeni procesora CPU do przydzielenia dla tej usługi sieci Web. Może to być liczba dziesiętna. Wartość domyślna to 0.1 |
memory_gb
Wymagane
|
Ilość pamięci (w GB) do przydzielenia dla tej usługi sieci Web. Może to być liczba dziesiętna. Wartość domyślna to 0,5 |
enable_app_insights
Wymagane
|
Czy włączyć rejestrowanie usługi Application Insights dla tej usługi sieci Web. Wartość domyślna to Fałsz |
scoring_timeout_ms
Wymagane
|
Limit czasu wymuszany dla wywołań oceniania do tej usługi sieci Web. Wartość domyślna to 60000. |
replica_max_concurrent_requests
Wymagane
|
Maksymalna liczba współbieżnych żądań na replikę w celu zezwolenia na tę usługę sieci Web. Wartość domyślna to 1. Nie zmieniaj tego ustawienia z wartości domyślnej 1, chyba że zostanie to poinstruowane przez pomoc techniczną firmy Microsoft lub członka zespołu usługi Azure Machine Learning. |
max_request_wait_time
Wymagane
|
Maksymalny czas oczekiwania żądania pozostanie w kolejce (w milisekundach) przed zwróceniem błędu 503. Wartość domyślna to 500. |
num_replicas
Wymagane
|
Liczba kontenerów do przydzielenia dla tej usługi sieci Web. Nie, jeśli ten parametr nie jest ustawiony, autoskalator jest domyślnie włączony. |
primary_key
Wymagane
|
Podstawowy klucz uwierzytelniania do użycia dla tej usługi sieci Web. |
secondary_key
Wymagane
|
Pomocniczy klucz uwierzytelniania do użycia dla tej usługi sieci Web. |
tags
Wymagane
|
Słownik tagów wartości klucza, aby nadać tej usłudze sieci Web. |
properties
Wymagane
|
Słownik właściwości wartości klucza, aby nadać tej usłudze sieci Web. Tych właściwości nie można zmienić po wdrożeniu, jednak można dodać nowe pary wartości klucza. |
description
Wymagane
|
Opis umożliwiający nadanie tej usłudze sieci Web. |
gpu_cores
Wymagane
|
Liczba rdzeni procesora GPU do przydzielenia dla tej usługi sieci Web. Wartość domyślna to 0. |
period_seconds
Wymagane
|
Jak często (w sekundach) wykonać sondę liveness. Wartość domyślna to 10 sekund. Wartość minimalna to 1. |
initial_delay_seconds
Wymagane
|
Liczba sekund po uruchomieniu kontenera przed zainicjowaniem sond żywotności. Wartość domyślna to 310. |
timeout_seconds
Wymagane
|
Liczba sekund, po których upłynął limit czasu sondy utrzymania. Wartość domyślna to 2 sekundy. Wartość minimalna to 1. |
success_threshold
Wymagane
|
Minimalna liczba kolejnych sukcesów sondy utrzymania, która ma zostać uznana za pomyślną po niepowieść. Wartość domyślna to 1. Wartość minimalna to 1. |
failure_threshold
Wymagane
|
Gdy zasobnik zostanie uruchomiony, a sonda aktualności zakończy się niepowodzeniem, platforma Kubernetes spróbuje kilka razy |
namespace
Wymagane
|
Przestrzeń nazw Kubernetes, w której ma zostać wdrożona ta usługa internetowa: maksymalnie 63 małe litery alfanumeryczne ('a'-'z', '0'-'9') i znaki łącznika ('-'). Pierwsze i ostatnie znaki nie mogą być łącznikami. |
token_auth_enabled
Wymagane
|
Czy włączyć uwierzytelnianie usługi Azure Active Directory dla tej usługi internetowej. Jeśli ta opcja jest włączona, użytkownicy mogą uzyskiwać dostęp do tej usługi internetowej, pobierając token dostępu przy użyciu poświadczeń usługi Azure Active Directory. Wartość domyślna to False. |
cpu_cores_limit
Wymagane
|
Maksymalna liczba rdzeni procesora CPU, z których może korzystać ta usługa sieci Web. Może to być liczba dziesiętna. |
memory_gb_limit
Wymagane
|
Maksymalna ilość pamięci (w GB) dozwolonej przez tę usługę sieci Web. Może to być liczba dziesiętna. |
blobfuse_enabled
|
Czy włączyć system blobfuse na potrzeby pobierania modelu dla tej usługi sieci Web. Wartość domyślna to True Domyślna wartość: None
|
autoscale_enabled
Wymagane
|
Wskazuje, czy włączyć skalowanie automatyczne dla tej usługi sieci Web.
Wartość domyślna to True, jeśli |
autoscale_min_replicas
Wymagane
|
Minimalna liczba kontenerów do użycia podczas skalowania automatycznego tej usługi sieci Web. Wartość domyślna to 1. |
autoscale_max_replicas
Wymagane
|
Maksymalna liczba kontenerów do użycia podczas skalowania automatycznego tej usługi sieci Web. Wartość domyślna to 10 |
autoscale_refresh_seconds
Wymagane
|
Jak często autoskalator powinien próbować skalować tę usługę internetową. Wartość domyślna to 1. |
autoscale_target_utilization
Wymagane
|
Docelowe wykorzystanie (w procentach na 100) autoskalator powinien podjąć próbę utrzymania dla tej usługi sieci Web. Wartość domyślna to 70. |
collect_model_data
Wymagane
|
Określa, czy włączyć zbieranie danych modelu dla tej usługi sieci Web. Wartość domyślna to False. |
auth_enabled
Wymagane
|
Określa, czy włączyć uwierzytelnianie dla tej usługi sieci Web. Wartość domyślna to True. |
cpu_cores
Wymagane
|
Liczba rdzeni procesora CPU do przydzielenia dla tej usługi sieci Web. Może to być liczba dziesiętna. Wartość domyślna to 0.1 |
memory_gb
Wymagane
|
Ilość pamięci (w GB), która ma być przydzielana dla tej usługi sieci Web. Może to być liczba dziesiętna. Wartość domyślna to 0,5 |
enable_app_insights
Wymagane
|
Czy włączyć rejestrowanie usługi Application Insights dla tej usługi sieci Web. Wartości domyślne to False |
scoring_timeout_ms
Wymagane
|
Limit czasu wymuszania wywołań oceniania dla tej usługi sieci Web. Wartość domyślna to 60000. |
replica_max_concurrent_requests
Wymagane
|
Liczba maksymalnie współbieżnych żądań na replikę, która umożliwia korzystanie z tej usługi sieci Web. Wartość domyślna to 1. Nie zmieniaj tego ustawienia z wartości domyślnej 1, chyba że zostanie poinstruowany przez pomoc techniczną firmy Microsoft lub członek zespołu usługi Azure Machine Learning. |
max_request_wait_time
Wymagane
|
Maksymalny czas, przez jaki żądanie pozostanie w kolejce (w milisekundach) przed zwróceniem błędu 503. Wartość domyślna to 500. |
num_replicas
Wymagane
|
Liczba kontenerów do przydzielenia dla tej usługi sieci Web. Nie ma wartości domyślnej, jeśli ten parametr nie jest ustawiony, autoskalator jest domyślnie włączony. |
primary_key
Wymagane
|
Podstawowy klucz uwierzytelniania do użycia dla tej usługi sieci Web. |
secondary_key
Wymagane
|
Pomocniczy klucz uwierzytelniania do użycia dla tej usługi sieci Web. |
tags
Wymagane
|
Słownik tagów wartości klucza, aby nadać tej usłudze sieci Web. |
properties
Wymagane
|
Słownik właściwości wartości klucza, aby nadać tej usłudze sieci Web. Nie można zmienić tych właściwości po wdrożeniu, jednak można dodać nowe pary wartości klucza. |
description
Wymagane
|
Opis, który ma nadać tej usłudze sieci Web. |
gpu_cores
Wymagane
|
Liczba rdzeni procesora GPU do przydzielenia dla tej usługi sieci Web. Wartość domyślna to 0. |
period_seconds
Wymagane
|
Jak często (w sekundach) wykonać sondę liveness. Wartość domyślna to 10 sekund. Wartość minimalna to 1. |
initial_delay_seconds
Wymagane
|
Liczba sekund po uruchomieniu kontenera przed zainicjowanymi sondami aktualności. Wartość domyślna to 310. |
timeout_seconds
Wymagane
|
Liczba sekund, po których upłynął limit czasu sondy liveness. Wartość domyślna to 2 sekundy. Wartość minimalna to 1. |
success_threshold
Wymagane
|
Minimalna liczba kolejnych sukcesów dla sondy liveness, która ma zostać uznana za pomyślną po nieudanej awarii. Wartość domyślna to 1. Wartość minimalna to 1. |
failure_threshold
Wymagane
|
Gdy zasobnik zostanie uruchomiony, a sonda liveness zakończy się niepowodzeniem, platforma Kubernetes spróbuje |
namespace
Wymagane
|
Przestrzeń nazw platformy Kubernetes, w której ma zostać wdrożona ta usługa sieci Web: do 63 małych liter alfanumeryczne ('a'-'z', '0'-'9') i łącznika ('-'). Pierwsze i ostatnie znaki nie mogą być łącznikami. |
token_auth_enabled
Wymagane
|
Niezależnie od tego, czy włączyć uwierzytelnianie usługi Azure Active Directory dla tej usługi sieci Web. Jeśli ta opcja jest włączona, użytkownicy mogą uzyskiwać dostęp do tej usługi sieci Web, pobierając token dostępu przy użyciu poświadczeń usługi Azure Active Directory. Wartość domyślna to False. |
compute_target_name
Wymagane
|
Nazwa docelowego obiektu obliczeniowego do wdrożenia |
cpu_cores_limit
Wymagane
|
Maksymalna liczba rdzeni procesora cpu, z których może korzystać ta usługa sieci Web. Może to być liczba dziesiętna. |
memory_gb_limit
Wymagane
|
Maksymalna ilość pamięci (w GB) dozwolonej przez tę usługę sieci Web. Może to być liczba dziesiętna. |
blobfuse_enabled
Wymagane
|
Czy włączyć blobfuse na potrzeby pobierania modelu dla tej usługi sieci Web. Wartość domyślna to True |
Zmienne
Nazwa | Opis |
---|---|
autoscale_enabled
|
Wskazuje, czy włączyć skalowanie automatyczne dla tej usługi sieci Web.
Wartość domyślna to True, jeśli |
autoscale_min_replicas
|
Minimalna liczba kontenerów do użycia podczas skalowania automatycznego tej usługi sieci Web. Wartość domyślna to 1. |
autoscale_max_replicas
|
Maksymalna liczba kontenerów do użycia podczas automatycznego skalowania tej usługi sieci Web. Wartość domyślna to 10 |
autoscale_refresh_seconds
|
Jak często autoskalator powinien próbować skalować tę usługę internetową. Wartość domyślna to 1. |
autoscale_target_utilization
|
Użycie docelowe (w procentach na 100) autoskalator powinien podjąć próbę utrzymania dla tej usługi sieci Web. Wartość domyślna to 70. |
collect_model_data
|
Czy włączyć zbieranie danych modelu dla tej usługi sieci Web. Wartość domyślna to False. |
auth_enabled
|
Niezależnie od tego, czy włączyć uwierzytelnianie dla tej usługi sieci Web. Wartość domyślna to True. |
cpu_cores
|
Liczba rdzeni procesora CPU do przydzielenia dla tej usługi sieci Web. Może to być liczba dziesiętna. Wartość domyślna to 0.1 |
memory_gb
|
Ilość pamięci (w GB), która ma być przydzielana dla tej usługi sieci Web. Może to być liczba dziesiętna. Wartość domyślna to 0,5 |
enable_app_insights
|
Czy włączyć rejestrowanie usługi Application Insights dla tej usługi sieci Web. Wartości domyślne to False |
scoring_timeout_ms
|
Limit czasu wymuszania wywołań oceniania dla tej usługi sieci Web. Wartość domyślna to 60000. |
replica_max_concurrent_requests
|
Liczba maksymalnie współbieżnych żądań na replikę, która umożliwia korzystanie z tej usługi sieci Web. Wartość domyślna to 1. Nie zmieniaj tego ustawienia z wartości domyślnej 1, chyba że zostanie poinstruowany przez pomoc techniczną firmy Microsoft lub członek zespołu usługi Azure Machine Learning. |
max_request_wait_time
|
Maksymalny czas, przez jaki żądanie pozostanie w kolejce (w milisekundach) przed zwróceniem błędu 503. Wartość domyślna to 500. |
num_replicas
|
Liczba kontenerów do przydzielenia dla tej usługi sieci Web. Nie ma wartości domyślnej, jeśli ten parametr nie jest ustawiony, autoskalator jest domyślnie włączony. |
primary_key
|
Podstawowy klucz uwierzytelniania do użycia dla tej usługi sieci Web. |
secondary_key
|
Pomocniczy klucz uwierzytelniania do użycia dla tej usługi sieci Web. |
azureml.core.webservice.AksServiceDeploymentConfiguration.tags
|
Słownik tagów wartości klucza, aby nadać tej usłudze sieci Web. |
azureml.core.webservice.AksServiceDeploymentConfiguration.properties
|
Słownik właściwości wartości klucza, aby nadać tej usłudze sieci Web. Nie można zmienić tych właściwości po wdrożeniu, jednak można dodać nowe pary wartości klucza. |
azureml.core.webservice.AksServiceDeploymentConfiguration.description
|
Opis, który ma nadać tej usłudze sieci Web. |
gpu_cores
|
Liczba rdzeni procesora GPU do przydzielenia dla tej usługi sieci Web. Wartość domyślna to 0. |
period_seconds
|
Jak często (w sekundach) wykonać sondę liveness. Wartość domyślna to 10 sekund. Wartość minimalna to 1. |
initial_delay_seconds
|
Liczba sekund po uruchomieniu kontenera przed zainicjowanymi sondami aktualności. Wartość domyślna to 310. |
timeout_seconds
|
Liczba sekund, po których upłynął limit czasu sondy liveness. Wartość domyślna to 2 sekundy. Wartość minimalna to 1. |
success_threshold
|
Minimalna liczba kolejnych sukcesów dla sondy liveness, która ma zostać uznana za pomyślną po nieudanej awarii. Wartość domyślna to 1. Wartość minimalna to 1. |
failure_threshold
|
Gdy zasobnik zostanie uruchomiony, a sonda aktualności zakończy się niepowodzeniem, platforma Kubernetes spróbuje kilka razy |
azureml.core.webservice.AksServiceDeploymentConfiguration.namespace
|
Przestrzeń nazw Kubernetes, w której ma zostać wdrożona ta usługa internetowa: maksymalnie 63 małe litery alfanumeryczne ('a'-'z', '0'-'9') i znaki łącznika ('-'). Pierwsze i ostatnie znaki nie mogą być łącznikami. |
token_auth_enabled
|
Czy włączyć uwierzytelnianie usługi Azure Active Directory dla tej usługi internetowej. Jeśli ta opcja jest włączona, użytkownicy mogą uzyskiwać dostęp do tej usługi internetowej, pobierając token dostępu przy użyciu poświadczeń usługi Azure Active Directory. Wartość domyślna to False. |
Metody
print_deploy_configuration |
Wydrukuj konfigurację wdrożenia. |
validate_configuration |
Sprawdź, czy określone wartości konfiguracji są prawidłowe. Jeśli walidacja nie powiedzie się, zgłosi wyjątek WebserviceException. |
print_deploy_configuration
Wydrukuj konfigurację wdrożenia.
print_deploy_configuration()
validate_configuration
Sprawdź, czy określone wartości konfiguracji są prawidłowe.
Jeśli walidacja nie powiedzie się, zgłosi wyjątek WebserviceException.
validate_configuration()
Wyjątki
Typ | Opis |
---|---|