Dela via


AksEndpointDeploymentConfiguration Klass

Anteckning

Det här är en experimentell klass och kan ändras när som helst. Mer information finns i https://aka.ms/azuremlexperimental.

Representerar distributionskonfigurationsinformation för en tjänst som distribueras på Azure Kubernetes Service.

Skapa ett AksEndpointDeploymentConfiguration-objekt med hjälp deploy_configuration av -metoden i AksEndpoint klassen .

Initiera ett konfigurationsobjekt för att distribuera en slutpunkt till ett AKS-beräkningsmål.

Arv
AksEndpointDeploymentConfiguration

Konstruktor

AksEndpointDeploymentConfiguration(autoscale_enabled, autoscale_min_replicas, autoscale_max_replicas, autoscale_refresh_seconds, autoscale_target_utilization, collect_model_data, auth_enabled, cpu_cores, memory_gb, enable_app_insights, scoring_timeout_ms, replica_max_concurrent_requests, max_request_wait_time, num_replicas, primary_key, secondary_key, tags, properties, description, gpu_cores, period_seconds, initial_delay_seconds, timeout_seconds, success_threshold, failure_threshold, namespace, token_auth_enabled, version_name, traffic_percentile, compute_target_name, cpu_cores_limit, memory_gb_limit)

Parametrar

Name Description
autoscale_enabled
Obligatorisk

Om du vill aktivera automatisk skalning för den här webbtjänsten eller inte. Standardvärdet är Sant om num_replicas är Ingen.

autoscale_min_replicas
Obligatorisk
int

Det minsta antalet containrar som ska användas vid automatisk skalning av den här webbtjänsten. Standardvärdet är 1.

autoscale_max_replicas
Obligatorisk
int

Det maximala antalet containrar som ska användas vid automatisk skalning av den här webbtjänsten. Standardvärdet är 10.

autoscale_refresh_seconds
Obligatorisk
int

Hur ofta autoskalning ska försöka skala den här webbtjänsten. Standardvärdet är 1.

autoscale_target_utilization
Obligatorisk
int

Målanvändningen (i procent av 100) som autoskalningen ska försöka underhålla för den här webbtjänsten. Standardvärdet är 70.

collect_model_data
Obligatorisk

Om du vill aktivera insamling av modelldata för den här webbtjänsten eller inte. Standardvärdet är False.

auth_enabled
Obligatorisk

Om du vill aktivera autentisering för den här webbtjänsten eller inte. Standardvärdet är True.

cpu_cores
Obligatorisk

Antalet processorkärnor som ska allokeras för den här webbtjänsten. Kan vara en decimal. Standardvärdet är 0.1

memory_gb
Obligatorisk

Mängden minne (i GB) som ska allokeras för den här webbtjänsten. Kan vara en decimal. Standardvärdet är 0,5

enable_app_insights
Obligatorisk

Om du vill aktivera Application Insights-loggning för den här webbtjänsten eller inte. Standardvärdet är False.

scoring_timeout_ms
Obligatorisk
int

En timeout för att framtvinga poängsättning av anrop till den här webbtjänsten. Standardvärdet är 60000.

replica_max_concurrent_requests
Obligatorisk
int

Antalet samtidiga begäranden per replik som tillåts för den här webbtjänsten. Standardvärdet är 1. Ändra inte den här inställningen från standardvärdet 1 om du inte instrueras av Microsofts tekniska support eller en medlem i Azure Machine Learning-teamet.

max_request_wait_time
Obligatorisk
int

Den maximala tiden som en begäran finns kvar i kön (i millisekunder) innan ett 503-fel returneras. Standardvärdet är 500.

num_replicas
Obligatorisk
int

Antalet containrar som ska allokeras för den här webbtjänsten. Inget standardvärde, om den här parametern inte har angetts är autoskalning aktiverad som standard.

primary_key
Obligatorisk
str

En primär autentiseringsnyckel som ska användas för den här webbtjänsten

secondary_key
Obligatorisk
str

En sekundär autentiseringsnyckel som ska användas för den här webbtjänsten

tags
Obligatorisk

Ordlista med nyckelvärdestaggar för att ge den här webbtjänsten

properties
Obligatorisk

Ordlista med nyckelvärdesegenskaper som ger den här webbtjänsten. Dessa egenskaper kan inte ändras efter distributionen, men nya nyckel/värde-par kan läggas till.

description
Obligatorisk
str

En beskrivning som ger den här webbtjänsten.

gpu_cores
Obligatorisk
int

Antalet GPU-kärnor som ska allokeras för den här webbtjänsten. Standardvärdet är 0.

period_seconds
Obligatorisk
int

Hur ofta (i sekunder) liveavsökningen ska utföras. Standardvärdet är 10 sekunder. Minimivärdet är 1.

initial_delay_seconds
Obligatorisk
int

Antalet sekunder efter att containern har startats innan liveavsökningar initieras. Standardvärdet är 310.

timeout_seconds
Obligatorisk
int

Antalet sekunder som liveavsökningen överskrider tidsgränsen. Standardvärdet är 2 sekunder. Minimivärdet är 1.

success_threshold
Obligatorisk
int

Minsta antal lyckade resultat i följd för att liveavsökningen ska anses vara lyckad efter att ha misslyckats. Standardvärdet är 1. Minimivärdet är 1.

failure_threshold
Obligatorisk
int

När en podd startar och liveavsökningen misslyckas försöker failureThreshold Kubernetes gånger innan den ger upp. Standardvärdet är 3. Minimivärdet är 1.

namespace
Obligatorisk
str

Kubernetes-namnområdet där den här webbtjänsten ska distribueras: upp till 63 alfanumeriska gemener ('a'-'z', '0'-'9') och bindestreck ('-') tecken. Det första och sista tecknen får inte vara bindestreck.

token_auth_enabled
Obligatorisk

Om du vill aktivera Azure Active Directory-autentisering för den här webbtjänsten eller inte. Om detta är aktiverat kan användarna komma åt den här webbtjänsten genom att hämta åtkomsttoken med sina Azure Active Directory-autentiseringsuppgifter. Standardvärdet är False.

version_name
Obligatorisk
str

Namnet på versionen i en slutpunkt.

traffic_percentile
Obligatorisk

Mängden trafik som versionen tar i en slutpunkt.

cpu_cores_limit
Obligatorisk

Det maximala antalet processorkärnor som den här webbtjänsten tillåts använda. Kan vara en decimal.

memory_gb_limit
Obligatorisk

Den maximala mängden minne (i GB) som den här webbtjänsten får använda. Kan vara en decimal.

autoscale_enabled
Obligatorisk

Om du vill aktivera automatisk skalning för den här webbtjänsten eller inte. Standardvärdet är Sant om num_replicas är Ingen.

autoscale_min_replicas
Obligatorisk
int

Det minsta antalet containrar som ska användas vid automatisk skalning av den här webbtjänsten. Standardvärdet är 1.

autoscale_max_replicas
Obligatorisk
int

Det maximala antalet containrar som ska användas vid automatisk skalning av den här webbtjänsten. Standardvärdet är 10.

autoscale_refresh_seconds
Obligatorisk
int

Hur ofta autoskalning ska försöka skala den här webbtjänsten. Standardvärdet är 1.

autoscale_target_utilization
Obligatorisk
int

Målanvändningen (i procent av 100) som autoskalningen ska försöka underhålla för den här webbtjänsten. Standardvärdet är 70.

collect_model_data
Obligatorisk

Om du vill aktivera insamling av modelldata för den här webbtjänsten eller inte. Standardvärdet är False.

auth_enabled
Obligatorisk

Om du vill aktivera autentisering för den här webbtjänsten eller inte. Standardvärdet är True.

cpu_cores
Obligatorisk

Antalet processorkärnor som ska allokeras för den här webbtjänsten. Kan vara en decimal. Standardvärdet är 0.1

memory_gb
Obligatorisk

Mängden minne (i GB) som ska allokeras för den här webbtjänsten. Kan vara en decimal. Standardvärdet är 0,5

enable_app_insights
Obligatorisk

Om du vill aktivera Application Insights-loggning för den här webbtjänsten eller inte. Standardvärdet är False.

scoring_timeout_ms
Obligatorisk
int

En timeout för att framtvinga poängsättning av anrop till den här webbtjänsten. Standardvärdet är 60000.

replica_max_concurrent_requests
Obligatorisk
int

Antalet samtidiga begäranden per replik som tillåts för den här webbtjänsten. Standardvärdet är 1. Ändra inte den här inställningen från standardvärdet 1 om du inte instrueras av Microsofts tekniska support eller en medlem i Azure Machine Learning-teamet.

max_request_wait_time
Obligatorisk
int

Den maximala tiden som en begäran finns kvar i kön (i millisekunder) innan ett 503-fel returneras. Standardvärdet är 500.

num_replicas
Obligatorisk
int

Antalet containrar som ska allokeras för den här webbtjänsten. Inget standardvärde, om den här parametern inte har angetts är autoskalning aktiverad som standard.

primary_key
Obligatorisk
str

En primär autentiseringsnyckel som ska användas för den här webbtjänsten

secondary_key
Obligatorisk
str

En sekundär autentiseringsnyckel som ska användas för den här webbtjänsten

tags
Obligatorisk

Ordlista med nyckelvärdestaggar för att ge den här webbtjänsten

properties
Obligatorisk

Ordlista med nyckelvärdesegenskaper som ger den här webbtjänsten. Dessa egenskaper kan inte ändras efter distributionen, men nya nyckel/värde-par kan läggas till.

description
Obligatorisk
str

En beskrivning som ger den här webbtjänsten.

gpu_cores
Obligatorisk
int

Antalet GPU-kärnor som ska allokeras för den här webbtjänsten. Standardvärdet är 0.

period_seconds
Obligatorisk
int

Hur ofta (i sekunder) liveavsökningen ska utföras. Standardvärdet är 10 sekunder. Minimivärdet är 1.

initial_delay_seconds
Obligatorisk
int

Antalet sekunder efter att containern har startats innan liveavsökningar initieras. Standardvärdet är 310.

timeout_seconds
Obligatorisk
int

Antalet sekunder som liveavsökningen överskrider tidsgränsen. Standardvärdet är 2 sekunder. Minimivärdet är 1.

success_threshold
Obligatorisk
int

Minsta antal lyckade resultat i följd för att liveavsökningen ska anses vara lyckad efter att ha misslyckats. Standardvärdet är 1. Minimivärdet är 1.

failure_threshold
Obligatorisk
int

När en podd startar och liveavsökningen misslyckas försöker failureThreshold Kubernetes gånger innan den ger upp. Standardvärdet är 3. Minimivärdet är 1.

namespace
Obligatorisk
str

Kubernetes-namnområdet där den här webbtjänsten ska distribueras: upp till 63 alfanumeriska gemener ('a'-'z', '0'-'9') och bindestreck ('-') tecken. Det första och sista tecknen får inte vara bindestreck.

token_auth_enabled
Obligatorisk

Om du vill aktivera Azure Active Directory-autentisering för den här webbtjänsten eller inte. Om detta är aktiverat kan användarna komma åt den här webbtjänsten genom att hämta åtkomsttoken med sina Azure Active Directory-autentiseringsuppgifter. Standardvärdet är False.

version_name
Obligatorisk
str

Namnet på versionen i en slutpunkt.

traffic_percentile
Obligatorisk

Mängden trafik som versionen tar i en slutpunkt.

compute_target_name
Obligatorisk
str

Namnet på beräkningsmålet som ska distribueras till

cpu_cores_limit
Obligatorisk

Det maximala antalet processorkärnor som den här webbtjänsten tillåts använda. Kan vara en decimal.

memory_gb_limit
Obligatorisk

Den maximala mängden minne (i GB) som den här webbtjänsten får använda. Kan vara en decimal.

Variabler

Name Description
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.autoscale_enabled

Om du vill aktivera automatisk skalning för den här webbtjänsten eller inte. Standardvärdet är Sant om num_replicas är Ingen.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.autoscale_min_replicas

Det minsta antalet containrar som ska användas vid automatisk skalning av den här webbtjänsten. Standardvärdet är 1.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.autoscale_max_replicas

Det maximala antalet containrar som ska användas vid automatisk skalning av den här webbtjänsten. Standardvärdet är 10.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.autoscale_refresh_seconds

Hur ofta autoskalning ska försöka skala den här webbtjänsten. Standardvärdet är 1.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.autoscale_target_utilization

Målanvändningen (i procent av 100) som autoskalningen ska försöka underhålla för den här webbtjänsten. Standardvärdet är 70.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.collect_model_data

Om du vill aktivera insamling av modelldata för den här webbtjänsten eller inte. Standardvärdet är False.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.auth_enabled

Om du vill aktivera autentisering för den här webbtjänsten eller inte. Standardvärdet är True.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.cpu_cores

Antalet processorkärnor som ska allokeras för den här webbtjänsten. Kan vara en decimal. Standardvärdet är 0.1

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.memory_gb

Mängden minne (i GB) som ska allokeras för den här webbtjänsten. Kan vara en decimal. Standardvärdet är 0,5

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.enable_app_insights

Om du vill aktivera Application Insights-loggning för den här webbtjänsten eller inte. Standardvärdet är False.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.scoring_timeout_ms

En timeout för att framtvinga poängsättning av anrop till den här webbtjänsten. Standardvärdet är 60000.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.replica_max_concurrent_requests

Antalet samtidiga begäranden per replik som tillåts för den här webbtjänsten. Standardvärdet är 1. Ändra inte den här inställningen från standardvärdet 1 om du inte instrueras av Microsofts tekniska support eller en medlem i Azure Machine Learning-teamet.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.max_request_wait_time

Den maximala tiden som en begäran finns kvar i kön (i millisekunder) innan ett 503-fel returneras. Standardvärdet är 500.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.num_replicas

Antalet containrar som ska allokeras för den här webbtjänsten. Inget standardvärde, om den här parametern inte har angetts är autoskalning aktiverad som standard.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.primary_key

En primär autentiseringsnyckel som ska användas för den här webbtjänsten

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.secondary_key

En sekundär autentiseringsnyckel som ska användas för den här webbtjänsten

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.tags

Ordlista med nyckelvärdestaggar för att ge den här webbtjänsten

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.properties

Ordlista med nyckelvärdesegenskaper som ger den här webbtjänsten. Dessa egenskaper kan inte ändras efter distributionen, men nya nyckel/värde-par kan läggas till.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.description

En beskrivning som ger den här webbtjänsten.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.gpu_cores

Antalet GPU-kärnor som ska allokeras för den här webbtjänsten. Standardvärdet är 0.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.period_seconds

Hur ofta (i sekunder) liveavsökningen ska utföras. Standardvärdet är 10 sekunder. Minimivärdet är 1.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.initial_delay_seconds

Antalet sekunder efter att containern har startats innan liveavsökningar initieras. Standardvärdet är 310.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.timeout_seconds

Antalet sekunder som liveavsökningen överskrider tidsgränsen. Standardvärdet är 2 sekunder. Minimivärdet är 1.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.success_threshold

Minsta antal lyckade resultat i följd för att liveavsökningen ska anses vara lyckad efter att ha misslyckats. Standardvärdet är 1. Minimivärdet är 1.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.failure_threshold

När en podd startar och liveavsökningen misslyckas försöker failureThreshold Kubernetes gånger innan den ger upp. Standardvärdet är 3. Minimivärdet är 1.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.namespace

Kubernetes-namnområdet där den här webbtjänsten ska distribueras: upp till 63 alfanumeriska gemener ('a'-'z', '0'-'9') och bindestreck ('-') tecken. Det första och sista tecknen får inte vara bindestreck.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.token_auth_enabled

Om du vill aktivera Azure Active Directory-autentisering för den här webbtjänsten eller inte. Om detta är aktiverat kan användarna komma åt den här webbtjänsten genom att hämta åtkomsttoken med sina Azure Active Directory-autentiseringsuppgifter. Standardvärdet är False.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.version_name

Namnet på versionen i en slutpunkt.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.traffic_percentile

Mängden trafik som versionen tar i en slutpunkt.

Metoder

validate_endpoint_configuration

Kontrollera att de angivna konfigurationsvärdena är giltiga.

Genererar en WebserviceException om verifieringen misslyckas.

validate_endpoint_configuration

Kontrollera att de angivna konfigurationsvärdena är giltiga.

Genererar en WebserviceException om verifieringen misslyckas.

validate_endpoint_configuration()

Undantag

Typ Description