Sdílet prostřednictvím


AksServiceDeploymentConfiguration Třída

Představuje informace o konfiguraci nasazení pro službu nasazenou na Azure Kubernetes Service.

Vytvořte objekt AksServiceDeploymentConfiguration pomocí deploy_configuration metody AksWebservice třídy.

Inicializace objektu konfigurace pro nasazení do cílového výpočetního objektu AKS

Dědičnost
AksServiceDeploymentConfiguration

Konstruktor

AksServiceDeploymentConfiguration(autoscale_enabled, autoscale_min_replicas, autoscale_max_replicas, autoscale_refresh_seconds, autoscale_target_utilization, collect_model_data, auth_enabled, cpu_cores, memory_gb, enable_app_insights, scoring_timeout_ms, replica_max_concurrent_requests, max_request_wait_time, num_replicas, primary_key, secondary_key, tags, properties, description, gpu_cores, period_seconds, initial_delay_seconds, timeout_seconds, success_threshold, failure_threshold, namespace, token_auth_enabled, compute_target_name, cpu_cores_limit, memory_gb_limit, blobfuse_enabled=None)

Parametry

Name Description
cpu_cores_limit
Vyžadováno

Maximální počet jader procesoru, které může tato webová služba používat. Může být desetinná čárka.

memory_gb_limit
Vyžadováno

Maximální velikost paměti (v GB), kterou může tato webová služba používat. Může být desetinná čárka.

autoscale_enabled
Vyžadováno

Určuje, jestli se má pro tuto webovou službu povolit automatické škálování. Výchozí hodnota je Pravda, pokud num_replicas je hodnota None.

autoscale_min_replicas
Vyžadováno
int

Minimální počet kontejnerů, které se mají použít při automatickém škálování této webové služby. Výchozí hodnota je 1.

autoscale_max_replicas
Vyžadováno
int

Maximální počet kontejnerů, které se mají použít při automatickém škálování této webové služby. Výchozí hodnota je 10.

autoscale_refresh_seconds
Vyžadováno
int

Jak často se má automatické škálování pokoušet o škálování této webové služby. Výchozí hodnota je 1.

autoscale_target_utilization
Vyžadováno
int

Cílové využití (v procentech ze 100), které by se automatické škálování mělo pokusit zachovat pro tuto webovou službu. Výchozí hodnota je 70.

collect_model_data
Vyžadováno

Určuje, jestli se má povolit shromažďování dat modelu pro tuto webovou službu. Výchozí hodnota je False.

auth_enabled
Vyžadováno

Určuje, jestli se má povolit ověřování pro tuto webovou službu. Výchozí hodnota je True.

cpu_cores
Vyžadováno

Počet jader procesoru, která mají být přidělena pro tuto webovou službu. Může být desetinná čárka. Výchozí hodnota je 0.1.

memory_gb
Vyžadováno

Velikost paměti (v GB), která se má přidělit této webové službě. Může být desetinná čárka. Výchozí hodnota je 0,5.

enable_app_insights
Vyžadováno

Jestli chcete povolit protokolování Application Insights pro tuto webovou službu. Výchozí hodnota je False.

scoring_timeout_ms
Vyžadováno
int

Časový limit pro vynucení bodování volání této webové služby Výchozí hodnota je 60000.

replica_max_concurrent_requests
Vyžadováno
int

Maximální počet souběžných požadavků na repliku, které mají být pro tuto webovou službu povoleny. Výchozí hodnota je 1. Toto nastavení neměňte z výchozí hodnoty 1, pokud vám k tomu nedá pokyn technická podpora Microsoftu nebo člen týmu Azure Machine Learning.

max_request_wait_time
Vyžadováno
int

Maximální doba, po kterou požadavek zůstane ve frontě (v milisekundách) před vrácením chyby 503. Výchozí hodnota je 500.

num_replicas
Vyžadováno
int

Počet kontejnerů, které mají být přiděleny pro tuto webovou službu. Žádné výchozí nastavení. Pokud tento parametr není nastavený, je automatické škálování ve výchozím nastavení povolené.

primary_key
Vyžadováno
str

Primární ověřovací klíč, který se použije pro tuto webovou službu.

secondary_key
Vyžadováno
str

Sekundární ověřovací klíč, který se má použít pro tuto webovou službu.

tags
Vyžadováno

Slovník značek klíčových hodnot pro tuto webovou službu.

properties
Vyžadováno

Slovník vlastností klíčové hodnoty pro tuto webovou službu. Tyto vlastnosti nelze po nasazení změnit, je však možné přidat nové páry hodnot klíčů.

description
Vyžadováno
str

Popis pro tuto webovou službu.

gpu_cores
Vyžadováno
int

Počet jader GPU, která se mají přidělit pro tuto webovou službu. Výchozí hodnota je 0.

period_seconds
Vyžadováno
int

Jak často (v sekundách) se má provádět sonda aktivity. Výchozí hodnota je 10 sekund. Minimální hodnota je 1.

initial_delay_seconds
Vyžadováno
int

Počet sekund po spuštění kontejneru, než se spustí sondy aktivity. Výchozí hodnota je 310.

timeout_seconds
Vyžadováno
int

Počet sekund, po jejichž uplynutí vyprší časový limit sondy aktivity Výchozí hodnota je 2 sekundy. Minimální hodnota je 1.

success_threshold
Vyžadováno
int

Minimální počet po sobě jdoucích úspěchů sondy aktivity, které se mají po neúspěchu považovat za úspěšné. Výchozí hodnota je 1. Minimální hodnota je 1.

failure_threshold
Vyžadováno
int

Když se pod spustí a sonda aktivity selže, Kubernetes zkusí failureThreshold časy, než to vzdá. Výchozí hodnota je 3. Minimální hodnota je 1.

namespace
Vyžadováno
str

Obor názvů Kubernetes, do kterého se má tato webová služba nasadit: až 63 znaků malých alfanumerických znaků (a-z, 0-9) a spojovníku (-). První a poslední znaky nesmí být pomlčky.

token_auth_enabled
Vyžadováno

Jestli chcete pro tuto webovou službu povolit ověřování Azure Active Directory. Pokud je tato možnost povolená, můžou uživatelé přistupovat k této webové službě načtením přístupových tokenů pomocí svých přihlašovacích údajů Azure Active Directory. Výchozí hodnota je False.

cpu_cores_limit
Vyžadováno

Maximální počet jader procesoru, které může tato webová služba používat. Může být desetinná čárka.

memory_gb_limit
Vyžadováno

Maximální velikost paměti (v GB), kterou může tato webová služba používat. Může být desetinná čárka.

blobfuse_enabled

Jestli chcete povolit blobfuse pro stahování modelů pro tuto webovou službu. Výchozí hodnota je True.

Default value: None
autoscale_enabled
Vyžadováno

Určuje, jestli se má pro tuto webovou službu povolit automatické škálování. Výchozí hodnota je Pravda, pokud num_replicas je hodnota None.

autoscale_min_replicas
Vyžadováno
int

Minimální počet kontejnerů, které se mají použít při automatickém škálování této webové služby. Výchozí hodnota je 1.

autoscale_max_replicas
Vyžadováno
int

Maximální počet kontejnerů, které se mají použít při automatickém škálování této webové služby. Výchozí hodnota je 10.

autoscale_refresh_seconds
Vyžadováno
int

Jak často se má automatické škálování pokoušet o škálování této webové služby. Výchozí hodnota je 1.

autoscale_target_utilization
Vyžadováno
int

Cílové využití (v procentech ze 100), které by se automatické škálování mělo pokusit zachovat pro tuto webovou službu. Výchozí hodnota je 70.

collect_model_data
Vyžadováno

Určuje, jestli se má povolit shromažďování dat modelu pro tuto webovou službu. Výchozí hodnota je False.

auth_enabled
Vyžadováno

Určuje, jestli se má povolit ověřování pro tuto webovou službu. Výchozí hodnota je True.

cpu_cores
Vyžadováno

Počet jader procesoru, která mají být přidělena pro tuto webovou službu. Může být desetinná čárka. Výchozí hodnota je 0.1.

memory_gb
Vyžadováno

Velikost paměti (v GB), která se má přidělit této webové službě. Může to být desetinná čárka. Výchozí hodnota je 0,5.

enable_app_insights
Vyžadováno

Jestli chcete povolit protokolování Application Insights pro tuto webovou službu. Výchozí hodnota je Nepravda.

scoring_timeout_ms
Vyžadováno
int

Časový limit, který se má vynutit pro vyhodnocování volání této webové služby. Výchozí hodnota je 60000.

replica_max_concurrent_requests
Vyžadováno
int

Maximální počet souběžných požadavků na repliku, které jsou pro tuto webovou službu povolené. Výchozí hodnota je 1. Toto nastavení neměňte z výchozí hodnoty 1, pokud vám to nepovolí technická podpora Microsoftu nebo člen týmu Služby Azure Machine Learning.

max_request_wait_time
Vyžadováno
int

Maximální doba, po kterou požadavek zůstane ve frontě (v milisekundách) před vrácením chyby 503. Výchozí hodnota je 500.

num_replicas
Vyžadováno
int

Počet kontejnerů, které se mají přidělit pro tuto webovou službu. Není výchozí. Pokud tento parametr není nastavený, je automatické škálování ve výchozím nastavení povolené.

primary_key
Vyžadováno
str

Primární ověřovací klíč, který se má použít pro tuto webovou službu.

secondary_key
Vyžadováno
str

Sekundární ověřovací klíč, který se má použít pro tuto webovou službu.

tags
Vyžadováno

Slovník značek klíčových hodnot pro tuto webovou službu.

properties
Vyžadováno

Slovník vlastností klíčové hodnoty pro tuto webovou službu. Tyto vlastnosti nelze po nasazení změnit, je však možné přidat nové páry hodnot klíčů.

description
Vyžadováno
str

Popis pro tuto webovou službu.

gpu_cores
Vyžadováno
int

Počet jader GPU, která se mají přidělit pro tuto webovou službu. Výchozí hodnota je 0.

period_seconds
Vyžadováno
int

Jak často (v sekundách) se má sonda aktivity provádět. Výchozí hodnota je 10 sekund. Minimální hodnota je 1.

initial_delay_seconds
Vyžadováno
int

Počet sekund po spuštění kontejneru před zahájením sondy živosti Výchozí hodnota je 310.

timeout_seconds
Vyžadováno
int

Počet sekund, po jejichž uplynutí vyprší časový limit sondy aktivity. Výchozí hodnota je 2 sekundy. Minimální hodnota je 1.

success_threshold
Vyžadováno
int

Minimální počet po sobě jdoucích úspěchů, aby se sonda živosti po neúspěchu považovala za úspěšnou. Výchozí hodnota je 1. Minimální hodnota je 1.

failure_threshold
Vyžadováno
int

Když se pod spustí a sonda živosti selže, Kubernetes zkusí failureThreshold časy, než to vzdát. Výchozí hodnota je 3. Minimální hodnota je 1.

namespace
Vyžadováno
str

Obor názvů Kubernetes, ve kterém se má tato webová služba nasadit: až 63 alfanumerických znaků s malými písmeny (a-z, 0-9) a spojovníku (-). První a poslední znak nesmí být pomlčky.

token_auth_enabled
Vyžadováno

Jestli se má pro tuto webovou službu povolit ověřování Azure Active Directory. Pokud je tato možnost povolená, uživatelé můžou k této webové službě přistupovat tak, že načítají přístupový token pomocí svých přihlašovacích údajů Azure Active Directory. Výchozí hodnota je False.

compute_target_name
Vyžadováno
str

Název cílového výpočetního prostředí, do které se má nasadit

cpu_cores_limit
Vyžadováno

Maximální počet jader procesoru, která může tato webová služba používat. Může to být desetinná čárka.

memory_gb_limit
Vyžadováno

Maximální velikost paměti (v GB) může tato webová služba používat. Může to být desetinná čárka.

blobfuse_enabled
Vyžadováno

Jestli chcete povolit blobfuse pro stahování modelů pro tuto webovou službu. Výchozí hodnota je Pravda.

Proměnné

Name Description
autoscale_enabled

Určuje, zda se má povolit automatické škálování pro tuto webovou službu. Výchozí hodnota je Pravda, pokud num_replicas je none.

autoscale_min_replicas
int

Minimální počet kontejnerů, které se mají použít při automatickém škálování této webové služby. Výchozí hodnota je 1.

autoscale_max_replicas
int

Maximální počet kontejnerů, které se mají použít při automatickém škálování této webové služby. Výchozí hodnota je 10.

autoscale_refresh_seconds
int

Jak často se má automatické škálování pokoušet škálovat tuto webovou službu. Výchozí hodnota je 1.

autoscale_target_utilization
int

Cílové využití (v procentech ze 100) by se automatické škálování mělo pokusit zachovat pro tuto webovou službu. Výchozí hodnota je 70.

collect_model_data

Zda se má povolit shromažďování dat modelu pro tuto webovou službu. Výchozí hodnota je False.

auth_enabled

Zda se má povolit ověřování pro tuto webovou službu. Výchozí hodnota je Pravda.

cpu_cores

Počet jader procesoru, která se mají přidělit pro tuto webovou službu. Může to být desetinná čárka. Výchozí hodnota je 0.1.

memory_gb

Velikost paměti (v GB), která se má přidělit této webové službě. Může to být desetinná čárka. Výchozí hodnota je 0,5.

enable_app_insights

Jestli chcete povolit protokolování Application Insights pro tuto webovou službu. Výchozí hodnota je Nepravda.

scoring_timeout_ms
int

Časový limit, který se má vynutit pro vyhodnocování volání této webové služby. Výchozí hodnota je 60000.

replica_max_concurrent_requests
int

Maximální počet souběžných požadavků na repliku, které jsou pro tuto webovou službu povolené. Výchozí hodnota je 1. Toto nastavení neměňte z výchozí hodnoty 1, pokud vám to nepovolí technická podpora Microsoftu nebo člen týmu Služby Azure Machine Learning.

max_request_wait_time
int

Maximální doba, po kterou požadavek zůstane ve frontě (v milisekundách) před vrácením chyby 503. Výchozí hodnota je 500.

num_replicas
int

Počet kontejnerů, které se mají přidělit pro tuto webovou službu. Není výchozí. Pokud tento parametr není nastavený, je automatické škálování ve výchozím nastavení povolené.

primary_key
str

Primární ověřovací klíč, který se má použít pro tuto webovou službu.

secondary_key
str

Sekundární ověřovací klíč, který se má použít pro tuto webovou službu.

azureml.core.webservice.AksServiceDeploymentConfiguration.tags

Slovník značek klíčových hodnot pro tuto webovou službu.

azureml.core.webservice.AksServiceDeploymentConfiguration.properties

Slovník vlastností klíčové hodnoty pro tuto webovou službu. Tyto vlastnosti nelze po nasazení změnit, je však možné přidat nové páry hodnot klíčů.

azureml.core.webservice.AksServiceDeploymentConfiguration.description

Popis pro tuto webovou službu.

gpu_cores
int

Počet jader GPU, která se mají přidělit pro tuto webovou službu. Výchozí hodnota je 0.

period_seconds
int

Jak často (v sekundách) se má sonda aktivity provádět. Výchozí hodnota je 10 sekund. Minimální hodnota je 1.

initial_delay_seconds
int

Počet sekund po spuštění kontejneru před zahájením sondy živosti Výchozí hodnota je 310.

timeout_seconds
int

Počet sekund, po jejichž uplynutí vyprší časový limit sondy aktivity. Výchozí hodnota je 2 sekundy. Minimální hodnota je 1.

success_threshold
int

Minimální počet po sobě jdoucích úspěchů, aby se sonda živosti po neúspěchu považovala za úspěšnou. Výchozí hodnota je 1. Minimální hodnota je 1.

failure_threshold
int

Když se pod spustí a sonda živosti selže, Kubernetes zkusí failureThreshold časy, než to vzdát. Výchozí hodnota je 3. Minimální hodnota je 1.

azureml.core.webservice.AksServiceDeploymentConfiguration.namespace

Obor názvů Kubernetes, ve kterém se má tato webová služba nasadit: až 63 alfanumerických znaků s malými písmeny (a-z, 0-9) a spojovníku (-). První a poslední znak nesmí být pomlčky.

token_auth_enabled

Jestli se má pro tuto webovou službu povolit ověřování Azure Active Directory. Pokud je tato možnost povolená, uživatelé můžou k této webové službě přistupovat tak, že načítají přístupový token pomocí svých přihlašovacích údajů Azure Active Directory. Výchozí hodnota je False.

Metody

print_deploy_configuration

Vytiskněte konfiguraci nasazení.

validate_configuration

Zkontrolujte, jestli jsou zadané hodnoty konfigurace platné.

Pokud se ověření nezdaří, vyvolá webserviceException.

print_deploy_configuration

Vytiskněte konfiguraci nasazení.

print_deploy_configuration()

validate_configuration

Zkontrolujte, jestli jsou zadané hodnoty konfigurace platné.

Pokud se ověření nezdaří, vyvolá webserviceException.

validate_configuration()

Výjimky

Typ Description