AksEndpointDeploymentConfiguration Třída
Poznámka
Toto je experimentální třída, která se může kdykoli změnit. Další informace najdete tady: https://aka.ms/azuremlexperimental.
Představuje informace o konfiguraci nasazení pro službu nasazenou na Azure Kubernetes Service.
Vytvořte objekt AksEndpointDeploymentConfiguration pomocí deploy_configuration
metody AksEndpoint třídy.
Inicializace objektu konfigurace pro nasazení koncového bodu do cílového výpočetního objektu AKS
- Dědičnost
-
AksEndpointDeploymentConfiguration
Konstruktor
AksEndpointDeploymentConfiguration(autoscale_enabled, autoscale_min_replicas, autoscale_max_replicas, autoscale_refresh_seconds, autoscale_target_utilization, collect_model_data, auth_enabled, cpu_cores, memory_gb, enable_app_insights, scoring_timeout_ms, replica_max_concurrent_requests, max_request_wait_time, num_replicas, primary_key, secondary_key, tags, properties, description, gpu_cores, period_seconds, initial_delay_seconds, timeout_seconds, success_threshold, failure_threshold, namespace, token_auth_enabled, version_name, traffic_percentile, compute_target_name, cpu_cores_limit, memory_gb_limit)
Parametry
Name | Description |
---|---|
autoscale_enabled
Vyžadováno
|
Určuje, jestli se má povolit automatické škálování pro tuto webovou službu.
Výchozí hodnota je Pravda, pokud |
autoscale_min_replicas
Vyžadováno
|
Minimální počet kontejnerů, které se mají použít při automatickém škálování této webové služby. Výchozí hodnota je 1. |
autoscale_max_replicas
Vyžadováno
|
Maximální počet kontejnerů, které se mají použít při automatickém škálování této webové služby. Výchozí hodnota je 10. |
autoscale_refresh_seconds
Vyžadováno
|
Jak často se má automatické škálování pokoušet o škálování této webové služby. Výchozí hodnota je 1. |
autoscale_target_utilization
Vyžadováno
|
Cílové využití (v procentech ze 100), které by se automatické škálování mělo pokusit zachovat pro tuto webovou službu. Výchozí hodnota je 70. |
collect_model_data
Vyžadováno
|
Určuje, jestli se má povolit shromažďování dat modelu pro tuto webovou službu. Výchozí hodnota je False. |
auth_enabled
Vyžadováno
|
Určuje, jestli se má povolit ověřování pro tuto webovou službu. Výchozí hodnota je True. |
cpu_cores
Vyžadováno
|
Počet jader procesoru, která se mají přidělit pro tuto webovou službu. Může být desetinná čárka. Výchozí hodnota je 0,1. |
memory_gb
Vyžadováno
|
Velikost paměti (v GB), která se má přidělit této webové službě. Může být desetinná čárka. Výchozí hodnota je 0,5. |
enable_app_insights
Vyžadováno
|
Jestli chcete povolit protokolování Application Insights pro tuto webovou službu. Výchozí hodnota je False. |
scoring_timeout_ms
Vyžadováno
|
Časový limit pro vynucení bodování volání této webové služby Výchozí hodnota je 60000. |
replica_max_concurrent_requests
Vyžadováno
|
Maximální počet souběžných požadavků na repliku, které mají být pro tuto webovou službu povoleny. Výchozí hodnota je 1. Toto nastavení neměňte z výchozí hodnoty 1, pokud vám k tomu nedá pokyn technická podpora Microsoftu nebo člen týmu Azure Machine Learning. |
max_request_wait_time
Vyžadováno
|
Maximální doba, po kterou požadavek zůstane ve frontě (v milisekundách) před vrácením chyby 503. Výchozí hodnota je 500. |
num_replicas
Vyžadováno
|
Počet kontejnerů, které mají být přiděleny pro tuto webovou službu. Žádné výchozí nastavení. Pokud tento parametr není nastavený, je automatické škálování ve výchozím nastavení povolené. |
primary_key
Vyžadováno
|
Primární ověřovací klíč pro tuto webovou službu |
secondary_key
Vyžadováno
|
Sekundární ověřovací klíč pro tuto webovou službu |
tags
Vyžadováno
|
Slovník značek klíčové hodnoty pro tuto webovou službu |
properties
Vyžadováno
|
Slovník vlastností klíčové hodnoty pro tuto webovou službu. Tyto vlastnosti nelze po nasazení změnit, je však možné přidat nové páry hodnot klíčů. |
description
Vyžadováno
|
Popis pro tuto webovou službu. |
gpu_cores
Vyžadováno
|
Počet jader GPU, která se mají přidělit pro tuto webovou službu. Výchozí hodnota je 0. |
period_seconds
Vyžadováno
|
Jak často (v sekundách) se má provádět sonda aktivity. Výchozí hodnota je 10 sekund. Minimální hodnota je 1. |
initial_delay_seconds
Vyžadováno
|
Počet sekund po spuštění kontejneru, než se spustí sondy aktivity. Výchozí hodnota je 310. |
timeout_seconds
Vyžadováno
|
Počet sekund, po jejichž uplynutí vyprší časový limit sondy aktivity. Výchozí hodnota je 2 sekundy. Minimální hodnota je 1. |
success_threshold
Vyžadováno
|
Minimální počet po sobě jdoucích úspěchů sondy aktivity, který se má po selhání považovat za úspěšný. Výchozí hodnota je 1. Minimální hodnota je 1. |
failure_threshold
Vyžadováno
|
Když se pod spustí a sonda aktivity selže, Kubernetes zkusí |
namespace
Vyžadováno
|
Obor názvů Kubernetes, do kterého se má tato webová služba nasadit: až 63 znaků malých alfanumerických znaků (a-z, 0-9) a spojovníku (-). První a poslední znaky nesmí být pomlčky. |
token_auth_enabled
Vyžadováno
|
Určuje, jestli se má pro tuto webovou službu povolit ověřování Azure Active Directory. Pokud je tato možnost povolená, můžou uživatelé přistupovat k této webové službě načtením přístupových tokenů pomocí svých přihlašovacích údajů Azure Active Directory. Výchozí hodnota je False. |
version_name
Vyžadováno
|
Název verze v koncovém bodu. |
traffic_percentile
Vyžadováno
|
Objem provozu, který verze přijímá v koncovém bodu. |
cpu_cores_limit
Vyžadováno
|
Maximální počet jader procesoru, které může tato webová služba používat. Může být desetinná čárka. |
memory_gb_limit
Vyžadováno
|
Maximální velikost paměti (v GB), kterou může tato webová služba používat. Může být desetinná čárka. |
autoscale_enabled
Vyžadováno
|
Určuje, jestli se má povolit automatické škálování pro tuto webovou službu.
Výchozí hodnota je Pravda, pokud |
autoscale_min_replicas
Vyžadováno
|
Minimální počet kontejnerů, které se mají použít při automatickém škálování této webové služby. Výchozí hodnota je 1. |
autoscale_max_replicas
Vyžadováno
|
Maximální počet kontejnerů, které se mají použít při automatickém škálování této webové služby. Výchozí hodnota je 10. |
autoscale_refresh_seconds
Vyžadováno
|
Jak často se má automatické škálování pokoušet o škálování této webové služby. Výchozí hodnota je 1. |
autoscale_target_utilization
Vyžadováno
|
Cílové využití (v procentech ze 100), které by se automatické škálování mělo pokusit zachovat pro tuto webovou službu. Výchozí hodnota je 70. |
collect_model_data
Vyžadováno
|
Určuje, jestli se má povolit shromažďování dat modelu pro tuto webovou službu. Výchozí hodnota je False. |
auth_enabled
Vyžadováno
|
Určuje, jestli se má povolit ověřování pro tuto webovou službu. Výchozí hodnota je True. |
cpu_cores
Vyžadováno
|
Počet jader procesoru, která se mají přidělit pro tuto webovou službu. Může být desetinná čárka. Výchozí hodnota je 0.1. |
memory_gb
Vyžadováno
|
Velikost paměti (v GB), která se má přidělit této webové službě. Může to být desetinná čárka. Výchozí hodnota je 0,5. |
enable_app_insights
Vyžadováno
|
Jestli chcete povolit protokolování Application Insights pro tuto webovou službu. Výchozí hodnota je False. |
scoring_timeout_ms
Vyžadováno
|
Časový limit, který se má vynutit pro vyhodnocování volání této webové služby. Výchozí hodnota je 60000. |
replica_max_concurrent_requests
Vyžadováno
|
Maximální počet souběžných požadavků na repliku, které jsou pro tuto webovou službu povolené. Výchozí hodnota je 1. Toto nastavení neměňte z výchozí hodnoty 1, pokud vám to nepovolí technická podpora Microsoftu nebo člen týmu Služby Azure Machine Learning. |
max_request_wait_time
Vyžadováno
|
Maximální doba, po kterou požadavek zůstane ve frontě (v milisekundách) před vrácením chyby 503. Výchozí hodnota je 500. |
num_replicas
Vyžadováno
|
Počet kontejnerů, které se mají přidělit pro tuto webovou službu. Není výchozí. Pokud tento parametr není nastavený, je automatické škálování ve výchozím nastavení povolené. |
primary_key
Vyžadováno
|
Primární ověřovací klíč, který se má použít pro tuto webovou službu |
secondary_key
Vyžadováno
|
Sekundární ověřovací klíč, který se má použít pro tuto webovou službu |
tags
Vyžadováno
|
Slovník značek klíčových hodnot pro tuto webovou službu |
properties
Vyžadováno
|
Slovník vlastností klíčové hodnoty pro tuto webovou službu. Tyto vlastnosti nelze po nasazení změnit, je však možné přidat nové páry hodnot klíčů. |
description
Vyžadováno
|
Popis pro tuto webovou službu. |
gpu_cores
Vyžadováno
|
Počet jader GPU, která se mají přidělit pro tuto webovou službu. Výchozí hodnota je 0. |
period_seconds
Vyžadováno
|
Jak často (v sekundách) se má sonda aktivity provádět. Výchozí hodnota je 10 sekund. Minimální hodnota je 1. |
initial_delay_seconds
Vyžadováno
|
Počet sekund po spuštění kontejneru, než se zahájí sondy aktivity. Výchozí hodnota je 310. |
timeout_seconds
Vyžadováno
|
Počet sekund, po jejichž uplynutí vyprší časový limit sondy aktivity. Výchozí hodnota je 2 sekundy. Minimální hodnota je 1. |
success_threshold
Vyžadováno
|
Minimální po sobě jdoucí úspěch sondy živosti, která se má po neúspěchu považovat za úspěšnou. Výchozí hodnota je 1. Minimální hodnota je 1. |
failure_threshold
Vyžadováno
|
Když se pod spustí a sonda živosti selže, Kubernetes zkusí |
namespace
Vyžadováno
|
Obor názvů Kubernetes, ve kterém se má tato webová služba nasadit: až 63 alfanumerických znaků s malými písmeny ("a"-"z", "0"-"9") a pomlček (-). První a poslední znak nesmí být pomlčky. |
token_auth_enabled
Vyžadováno
|
Jestli se má pro tuto webovou službu povolit ověřování Azure Active Directory. Pokud je tato možnost povolená, uživatelé můžou k této webové službě přistupovat tak, že načítají přístupový token pomocí svých přihlašovacích údajů Azure Active Directory. Výchozí hodnota je False. |
version_name
Vyžadováno
|
Název verze v koncovém bodu. |
traffic_percentile
Vyžadováno
|
Objem provozu, který verze přijímá v koncovém bodu. |
compute_target_name
Vyžadováno
|
Název cílového výpočetního prostředí, do které se má nasadit |
cpu_cores_limit
Vyžadováno
|
Maximální počet jader procesoru, která může tato webová služba používat. Může to být desetinná čárka. |
memory_gb_limit
Vyžadováno
|
Maximální velikost paměti (v GB) může tato webová služba používat. Může to být desetinná čárka. |
Proměnné
Name | Description |
---|---|
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.autoscale_enabled
|
Zda se má povolit automatické škálování pro tuto webovou službu. Výchozí hodnota je Pravda, pokud |
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.autoscale_min_replicas
|
Minimální počet kontejnerů, které se mají použít při automatickém škálování této webové služby. Výchozí hodnota je 1. |
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.autoscale_max_replicas
|
Maximální počet kontejnerů, které se mají použít při automatickém škálování této webové služby. Výchozí hodnota je 10. |
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.autoscale_refresh_seconds
|
Jak často se má automatické škálování pokoušet škálovat tuto webovou službu. Výchozí hodnota je 1. |
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.autoscale_target_utilization
|
Cílové využití (v procentech ze 100) by se automatické škálování mělo pokusit zachovat pro tuto webovou službu. Výchozí hodnota je 70. |
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.collect_model_data
|
Zda se má povolit shromažďování dat modelu pro tuto webovou službu. Výchozí hodnota je False. |
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.auth_enabled
|
Zda se má povolit ověřování pro tuto webovou službu. Výchozí hodnota je Pravda. |
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.cpu_cores
|
Počet jader procesoru, která se mají přidělit pro tuto webovou službu. Může to být desetinná čárka. Výchozí hodnota je 0.1. |
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.memory_gb
|
Velikost paměti (v GB), která se má přidělit této webové službě. Může to být desetinná čárka. Výchozí hodnota je 0,5. |
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.enable_app_insights
|
Jestli chcete povolit protokolování Application Insights pro tuto webovou službu. Výchozí hodnota je False. |
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.scoring_timeout_ms
|
Časový limit, který se má vynutit pro vyhodnocování volání této webové služby. Výchozí hodnota je 60000. |
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.replica_max_concurrent_requests
|
Maximální počet souběžných požadavků na repliku, které jsou pro tuto webovou službu povolené. Výchozí hodnota je 1. Toto nastavení neměňte z výchozí hodnoty 1, pokud vám to nepovolí technická podpora Microsoftu nebo člen týmu Služby Azure Machine Learning. |
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.max_request_wait_time
|
Maximální doba, po kterou požadavek zůstane ve frontě (v milisekundách) před vrácením chyby 503. Výchozí hodnota je 500. |
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.num_replicas
|
Počet kontejnerů, které se mají přidělit pro tuto webovou službu. Není výchozí. Pokud tento parametr není nastavený, je automatické škálování ve výchozím nastavení povolené. |
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.primary_key
|
Primární ověřovací klíč, který se má použít pro tuto webovou službu |
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.secondary_key
|
Sekundární ověřovací klíč, který se má použít pro tuto webovou službu |
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.tags
|
Slovník značek klíčových hodnot pro tuto webovou službu |
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.properties
|
Slovník vlastností klíčové hodnoty pro tuto webovou službu. Tyto vlastnosti nelze po nasazení změnit, je však možné přidat nové páry hodnot klíčů. |
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.description
|
Popis pro tuto webovou službu. |
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.gpu_cores
|
Počet jader GPU, která se mají přidělit pro tuto webovou službu. Výchozí hodnota je 0. |
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.period_seconds
|
Jak často (v sekundách) se má sonda aktivity provádět. Výchozí hodnota je 10 sekund. Minimální hodnota je 1. |
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.initial_delay_seconds
|
Počet sekund po spuštění kontejneru, než se zahájí sondy aktivity. Výchozí hodnota je 310. |
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.timeout_seconds
|
Počet sekund, po jejichž uplynutí vyprší časový limit sondy aktivity. Výchozí hodnota je 2 sekundy. Minimální hodnota je 1. |
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.success_threshold
|
Minimální počet po sobě jdoucích úspěchů sondy aktivity, který se má po selhání považovat za úspěšný. Výchozí hodnota je 1. Minimální hodnota je 1. |
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.failure_threshold
|
Když se pod spustí a sonda aktivity selže, Kubernetes zkusí |
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.namespace
|
Obor názvů Kubernetes, do kterého se má tato webová služba nasadit: až 63 znaků malých alfanumerických znaků (a-z, 0-9) a spojovníku (-). První a poslední znaky nesmí být pomlčky. |
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.token_auth_enabled
|
Určuje, jestli se má pro tuto webovou službu povolit ověřování Azure Active Directory. Pokud je tato možnost povolená, můžou uživatelé přistupovat k této webové službě načtením přístupových tokenů pomocí svých přihlašovacích údajů Azure Active Directory. Výchozí hodnota je False. |
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.version_name
|
Název verze v koncovém bodu. |
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.traffic_percentile
|
Objem provozu, který verze přijímá v koncovém bodu. |
Metody
validate_endpoint_configuration |
Zkontrolujte, jestli jsou zadané hodnoty konfigurace platné. Pokud se ověření nezdaří, vyvolá webserviceException. |
validate_endpoint_configuration
Zkontrolujte, jestli jsou zadané hodnoty konfigurace platné.
Pokud se ověření nezdaří, vyvolá webserviceException.
validate_endpoint_configuration()
Výjimky
Typ | Description |
---|---|