Condividi tramite


AksEndpointDeploymentConfiguration Classe

Nota

Si tratta di una classe sperimentale e può cambiare in qualsiasi momento. Per altre informazioni, vedere https://aka.ms/azuremlexperimental.

Rappresenta le informazioni di configurazione della distribuzione per un servizio distribuito in servizio Azure Kubernetes.

Creare un oggetto AksEndpointDeploymentConfiguration usando il deploy_configuration metodo della AksEndpoint classe .

Inizializzare un oggetto di configurazione per la distribuzione di un endpoint in una destinazione di calcolo del servizio Azure Kubernetes.

Ereditarietà
AksEndpointDeploymentConfiguration

Costruttore

AksEndpointDeploymentConfiguration(autoscale_enabled, autoscale_min_replicas, autoscale_max_replicas, autoscale_refresh_seconds, autoscale_target_utilization, collect_model_data, auth_enabled, cpu_cores, memory_gb, enable_app_insights, scoring_timeout_ms, replica_max_concurrent_requests, max_request_wait_time, num_replicas, primary_key, secondary_key, tags, properties, description, gpu_cores, period_seconds, initial_delay_seconds, timeout_seconds, success_threshold, failure_threshold, namespace, token_auth_enabled, version_name, traffic_percentile, compute_target_name, cpu_cores_limit, memory_gb_limit)

Parametri

Nome Descrizione
autoscale_enabled
Necessario

Indica se abilitare o meno la scalabilità automatica per questo servizio Web. Il valore predefinito è True se num_replicas non è Nessuno.

autoscale_min_replicas
Necessario
int

Numero minimo di contenitori da usare per la scalabilità automatica di questo servizio Web. Assume il valore predefinito 1.

autoscale_max_replicas
Necessario
int

Numero massimo di contenitori da usare per la scalabilità automatica di questo servizio Web. Il valore predefinito è 10.

autoscale_refresh_seconds
Necessario
int

Frequenza con cui l'utilità di scalabilità automatica deve tentare di ridimensionare questo servizio Web. Assume il valore predefinito 1.

autoscale_target_utilization
Necessario
int

L'utilizzo di destinazione ,in percentuale su 100, il ridimensionamento automatico deve tentare di gestire per questo servizio Web. Il valore predefinito è 70.

collect_model_data
Necessario

Indica se abilitare o meno la raccolta dei dati del modello per questo servizio Web. Il valore predefinito è False.

auth_enabled
Necessario

Indica se abilitare o meno l'autenticazione per questo servizio Web. Il valore predefinito è True.

cpu_cores
Necessario

Numero di core cpu da allocare per questo servizio Web. Può essere un decimale. Il valore predefinito è 0.1

memory_gb
Necessario

Quantità di memoria (in GB) da allocare per questo servizio Web. Può essere un decimale. Il valore predefinito è 0.5

enable_app_insights
Necessario

Indica se abilitare o meno la registrazione di Application Insights per questo servizio Web. Il valore predefinito è False.

scoring_timeout_ms
Necessario
int

Timeout da applicare per l'assegnazione dei punteggi alle chiamate a questo servizio Web. Il valore predefinito è 60000.

replica_max_concurrent_requests
Necessario
int

Numero massimo di richieste simultanee per replica che consentono questo servizio Web. Assume il valore predefinito 1. Non modificare questa impostazione dal valore predefinito 1, a meno che non venga richiesto dal supporto tecnico Microsoft o da un membro del team di Azure Machine Learning.

max_request_wait_time
Necessario
int

La quantità massima di tempo per cui una richiesta rimarrà nella coda (in millisecondi) prima di restituire un errore 503. Il valore predefinito è 500.

num_replicas
Necessario
int

Numero di contenitori da allocare per questo servizio Web. Nessun valore predefinito, se questo parametro non è impostato, l'utilità di scalabilità automatica è abilitata per impostazione predefinita.

primary_key
Necessario
str

Una chiave di autenticazione primaria da usare per questo servizio Web

secondary_key
Necessario
str

Una chiave di autenticazione secondaria da usare per questo servizio Web

tags
Necessario

Dizionario di tag chiave-valore per assegnare questo servizio Web

properties
Necessario

Dizionario delle proprietà chiave-valore per assegnare questo servizio Web. Queste proprietà non possono essere modificate dopo la distribuzione, ma è possibile aggiungere nuove coppie chiave-valore.

description
Necessario
str

Descrizione da assegnare a questo servizio Web.

gpu_cores
Necessario
int

Numero di core GPU da allocare per questo servizio Web. Il valore predefinito è 0.

period_seconds
Necessario
int

La frequenza (in secondi) con cui eseguire il probe di attività. Il valore predefinito è 10 secondi. Il valore minimo è 1.

initial_delay_seconds
Necessario
int

Numero di secondi dopo l'avvio del contenitore prima dell'avvio dei probe di attività. Il valore predefinito è 310.

timeout_seconds
Necessario
int

Numero di secondi dopo il quale si verifica il timeout del probe di attività. Il valore predefinito è 2 secondi. Il valore minimo è 1.

success_threshold
Necessario
int

Numero minimo di successi consecutivi per il probe di attività da considerare riuscito dopo l'esito negativo. Assume il valore predefinito 1. Il valore minimo è 1.

failure_threshold
Necessario
int

Quando un pod viene avviato e il probe di attività ha esito negativo, Kubernetes proverà failureThreshold i tempi prima di rinunciare. Il valore predefinito è 3. Il valore minimo è 1.

namespace
Necessario
str

Spazio dei nomi Kubernetes in cui distribuire questo servizio Web: fino a 63 caratteri alfanumerici minuscoli ('a'-'z', '0'-'9') e trattino ('-'). Il primo e l'ultimo carattere non possono essere trattini.

token_auth_enabled
Necessario

Indica se abilitare o meno l'autenticazione di Azure Active Directory per questo servizio Web. Se questa opzione è abilitata, gli utenti possono accedere a questo servizio Web recuperando il token di accesso usando le credenziali di Azure Active Directory. Il valore predefinito è False.

version_name
Necessario
str

Nome della versione in un endpoint.

traffic_percentile
Necessario

Quantità di traffico impiegato dalla versione in un endpoint.

cpu_cores_limit
Necessario

È consentito usare il numero massimo di core cpu per questo servizio Web. Può essere un decimale.

memory_gb_limit
Necessario

La quantità massima di memoria (in GB) che questo servizio Web può usare. Può essere un decimale.

autoscale_enabled
Necessario

Indica se abilitare o meno la scalabilità automatica per questo servizio Web. Il valore predefinito è True se num_replicas non è Nessuno.

autoscale_min_replicas
Necessario
int

Numero minimo di contenitori da usare per la scalabilità automatica di questo servizio Web. Assume il valore predefinito 1.

autoscale_max_replicas
Necessario
int

Numero massimo di contenitori da usare per la scalabilità automatica di questo servizio Web. Il valore predefinito è 10.

autoscale_refresh_seconds
Necessario
int

Frequenza con cui l'utilità di scalabilità automatica deve tentare di ridimensionare questo servizio Web. Assume il valore predefinito 1.

autoscale_target_utilization
Necessario
int

L'utilizzo di destinazione ,in percentuale su 100, il ridimensionamento automatico deve tentare di gestire per questo servizio Web. Il valore predefinito è 70.

collect_model_data
Necessario

Indica se abilitare o meno la raccolta dei dati del modello per questo servizio Web. Il valore predefinito è False.

auth_enabled
Necessario

Indica se abilitare o meno l'autenticazione per questo servizio Web. Il valore predefinito è True.

cpu_cores
Necessario

Numero di core cpu da allocare per questo servizio Web. Può essere un decimale. Il valore predefinito è 0.1

memory_gb
Necessario

Quantità di memoria (in GB) da allocare per questo servizio Web. Può essere un decimale. Il valore predefinito è 0.5

enable_app_insights
Necessario

Indica se abilitare o meno la registrazione di Application Insights per questo servizio Web. Il valore predefinito è False.

scoring_timeout_ms
Necessario
int

Timeout da applicare per l'assegnazione dei punteggi alle chiamate a questo servizio Web. Il valore predefinito è 60000.

replica_max_concurrent_requests
Necessario
int

Numero massimo di richieste simultanee per replica che consentono questo servizio Web. Assume il valore predefinito 1. Non modificare questa impostazione dal valore predefinito 1, a meno che non venga richiesto dal supporto tecnico Microsoft o da un membro del team di Azure Machine Learning.

max_request_wait_time
Necessario
int

La quantità massima di tempo per cui una richiesta rimarrà nella coda (in millisecondi) prima di restituire un errore 503. Il valore predefinito è 500.

num_replicas
Necessario
int

Numero di contenitori da allocare per questo servizio Web. Nessun valore predefinito, se questo parametro non è impostato, l'utilità di scalabilità automatica è abilitata per impostazione predefinita.

primary_key
Necessario
str

Una chiave di autenticazione primaria da usare per questo servizio Web

secondary_key
Necessario
str

Una chiave di autenticazione secondaria da usare per questo servizio Web

tags
Necessario

Dizionario di tag chiave-valore per assegnare questo servizio Web

properties
Necessario

Dizionario delle proprietà chiave-valore per assegnare questo servizio Web. Queste proprietà non possono essere modificate dopo la distribuzione, ma è possibile aggiungere nuove coppie chiave-valore.

description
Necessario
str

Descrizione da assegnare a questo servizio Web.

gpu_cores
Necessario
int

Numero di core GPU da allocare per questo servizio Web. Il valore predefinito è 0.

period_seconds
Necessario
int

La frequenza (in secondi) con cui eseguire il probe di attività. Il valore predefinito è 10 secondi. Il valore minimo è 1.

initial_delay_seconds
Necessario
int

Numero di secondi dopo l'avvio del contenitore prima dell'avvio dei probe di attività. Il valore predefinito è 310.

timeout_seconds
Necessario
int

Numero di secondi dopo il quale si verifica il timeout del probe di attività. Il valore predefinito è 2 secondi. Il valore minimo è 1.

success_threshold
Necessario
int

Numero minimo di successi consecutivi per il probe di attività da considerare riuscito dopo l'esito negativo. Assume il valore predefinito 1. Il valore minimo è 1.

failure_threshold
Necessario
int

Quando un pod viene avviato e il probe di attività ha esito negativo, Kubernetes proverà failureThreshold i tempi prima di rinunciare. Il valore predefinito è 3. Il valore minimo è 1.

namespace
Necessario
str

Spazio dei nomi Kubernetes in cui distribuire questo servizio Web: fino a 63 caratteri alfanumerici minuscoli ('a'-'z', '0'-'9') e trattino ('-'). Il primo e l'ultimo carattere non possono essere trattini.

token_auth_enabled
Necessario

Indica se abilitare o meno l'autenticazione di Azure Active Directory per questo servizio Web. Se questa opzione è abilitata, gli utenti possono accedere a questo servizio Web recuperando il token di accesso usando le credenziali di Azure Active Directory. Il valore predefinito è False.

version_name
Necessario
str

Nome della versione in un endpoint.

traffic_percentile
Necessario

Quantità di traffico impiegato dalla versione in un endpoint.

compute_target_name
Necessario
str

Nome della destinazione di calcolo in cui eseguire la distribuzione

cpu_cores_limit
Necessario

È consentito usare il numero massimo di core cpu per questo servizio Web. Può essere un decimale.

memory_gb_limit
Necessario

La quantità massima di memoria (in GB) che questo servizio Web può usare. Può essere un decimale.

Variabili

Nome Descrizione
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.autoscale_enabled

Indica se abilitare o meno la scalabilità automatica per questo servizio Web. Il valore predefinito è True se num_replicas non è Nessuno.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.autoscale_min_replicas

Numero minimo di contenitori da usare per la scalabilità automatica di questo servizio Web. Assume il valore predefinito 1.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.autoscale_max_replicas

Numero massimo di contenitori da usare per la scalabilità automatica di questo servizio Web. Il valore predefinito è 10.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.autoscale_refresh_seconds

Frequenza con cui l'utilità di scalabilità automatica deve tentare di ridimensionare questo servizio Web. Assume il valore predefinito 1.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.autoscale_target_utilization

L'utilizzo di destinazione ,in percentuale su 100, il ridimensionamento automatico deve tentare di gestire per questo servizio Web. Il valore predefinito è 70.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.collect_model_data

Indica se abilitare o meno la raccolta dei dati del modello per questo servizio Web. Il valore predefinito è False.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.auth_enabled

Indica se abilitare o meno l'autenticazione per questo servizio Web. Il valore predefinito è True.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.cpu_cores

Numero di core cpu da allocare per questo servizio Web. Può essere un decimale. Il valore predefinito è 0.1

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.memory_gb

Quantità di memoria (in GB) da allocare per questo servizio Web. Può essere un decimale. Il valore predefinito è 0.5

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.enable_app_insights

Indica se abilitare o meno la registrazione di Application Insights per questo servizio Web. Il valore predefinito è False.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.scoring_timeout_ms

Timeout da applicare per l'assegnazione dei punteggi alle chiamate a questo servizio Web. Il valore predefinito è 60000.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.replica_max_concurrent_requests

Numero massimo di richieste simultanee per replica che consentono questo servizio Web. Assume il valore predefinito 1. Non modificare questa impostazione dal valore predefinito 1, a meno che non venga richiesto dal supporto tecnico Microsoft o da un membro del team di Azure Machine Learning.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.max_request_wait_time

La quantità massima di tempo per cui una richiesta rimarrà nella coda (in millisecondi) prima di restituire un errore 503. Il valore predefinito è 500.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.num_replicas

Numero di contenitori da allocare per questo servizio Web. Nessun valore predefinito, se questo parametro non è impostato, l'utilità di scalabilità automatica è abilitata per impostazione predefinita.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.primary_key

Una chiave di autenticazione primaria da usare per questo servizio Web

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.secondary_key

Una chiave di autenticazione secondaria da usare per questo servizio Web

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.tags

Dizionario di tag chiave-valore per assegnare questo servizio Web

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.properties

Dizionario delle proprietà chiave-valore per assegnare questo servizio Web. Queste proprietà non possono essere modificate dopo la distribuzione, ma è possibile aggiungere nuove coppie chiave-valore.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.description

Descrizione da assegnare a questo servizio Web.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.gpu_cores

Numero di core GPU da allocare per questo servizio Web. Il valore predefinito è 0.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.period_seconds

La frequenza (in secondi) con cui eseguire il probe di attività. Il valore predefinito è 10 secondi. Il valore minimo è 1.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.initial_delay_seconds

Numero di secondi dopo l'avvio del contenitore prima dell'avvio dei probe di attività. Il valore predefinito è 310.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.timeout_seconds

Numero di secondi dopo il quale il probe di liveness timeout. Il valore predefinito è 2 secondi. Il valore minimo è 1.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.success_threshold

I successi consecutivi minimi per il probe di liveness devono essere considerati riusciti dopo aver avuto esito negativo. Assume il valore predefinito 1. Il valore minimo è 1.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.failure_threshold

Quando un pod inizia e il probe di liveness ha esito negativo, Kubernetes tenterà failureThreshold i tempi prima di rinunciare. Il valore predefinito è 3. Il valore minimo è 1.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.namespace

Spazio dei nomi Kubernetes in cui distribuire questo servizio Web: fino a 63 caratteri alfanumerici minuscoli ('a'-'z', '0'-'9') e trattino ('-'). I primi e gli ultimi caratteri non possono essere trattini.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.token_auth_enabled

Indica se abilitare l'autenticazione di Azure Active Directory per questo servizio Web. Se questa opzione è abilitata, gli utenti possono accedere a questo servizio Web recuperando il token di accesso usando le credenziali di Azure Active Directory. Il valore predefinito è False.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.version_name

Nome della versione in un endpoint.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.traffic_percentile

La quantità di traffico che la versione accetta in un endpoint.

Metodi

validate_endpoint_configuration

Verificare che i valori di configurazione specificati siano validi.

Genererà un'eccezione WebserviceException se la convalida non riesce.

validate_endpoint_configuration

Verificare che i valori di configurazione specificati siano validi.

Genererà un'eccezione WebserviceException se la convalida non riesce.

validate_endpoint_configuration()

Eccezioni

Tipo Descrizione