Condividi tramite


AksServiceDeploymentConfiguration Classe

Rappresenta le informazioni di configurazione della distribuzione per un servizio distribuito in servizio Azure Kubernetes.

Creare un oggetto AksServiceDeploymentConfiguration usando il deploy_configuration metodo della AksWebservice classe .

Inizializzare un oggetto di configurazione per la distribuzione in una destinazione di calcolo del servizio Azure Kubernetes.

Ereditarietà
AksServiceDeploymentConfiguration

Costruttore

AksServiceDeploymentConfiguration(autoscale_enabled, autoscale_min_replicas, autoscale_max_replicas, autoscale_refresh_seconds, autoscale_target_utilization, collect_model_data, auth_enabled, cpu_cores, memory_gb, enable_app_insights, scoring_timeout_ms, replica_max_concurrent_requests, max_request_wait_time, num_replicas, primary_key, secondary_key, tags, properties, description, gpu_cores, period_seconds, initial_delay_seconds, timeout_seconds, success_threshold, failure_threshold, namespace, token_auth_enabled, compute_target_name, cpu_cores_limit, memory_gb_limit, blobfuse_enabled=None)

Parametri

Nome Descrizione
cpu_cores_limit
Necessario

Il numero massimo di core cpu che questo servizio Web può usare. Può essere un decimale.

memory_gb_limit
Necessario

La quantità massima di memoria (in GB) di questo servizio Web è consentita per l'uso. Può essere un decimale.

autoscale_enabled
Necessario

Indica se abilitare la scalabilità automatica per questo servizio Web. Il valore predefinito è True se num_replicas non è Nessuno.

autoscale_min_replicas
Necessario
int

Numero minimo di contenitori da usare durante la scalabilità automatica di questo servizio Web. Assume il valore predefinito 1.

autoscale_max_replicas
Necessario
int

Numero massimo di contenitori da usare durante la scalabilità automatica di questo servizio Web. Impostazione predefinita su 10

autoscale_refresh_seconds
Necessario
int

Frequenza con cui il ridimensionatore automatico deve tentare di ridimensionare questo servizio Web. Assume il valore predefinito 1.

autoscale_target_utilization
Necessario
int

L'utilizzo di destinazione (in percentuale superiore a 100) il ridimensionatore automatico deve tentare di mantenere per questo servizio Web. Il valore predefinito è 70.

collect_model_data
Necessario

Indica se abilitare o meno la raccolta dati del modello per questo servizio Web. Il valore predefinito è False.

auth_enabled
Necessario

Indica se abilitare l'autenticazione per questo servizio Web. Impostazione predefinita su True.

cpu_cores
Necessario

Numero di core CPU da allocare per questo servizio Web. Può essere un decimale. Impostazione predefinita a 0.1

memory_gb
Necessario

Quantità di memoria (in GB) da allocare per questo servizio Web. Può essere un decimale. Impostazione predefinita a 0,5

enable_app_insights
Necessario

Indica se abilitare o meno la registrazione di Application Insights per questo servizio Web. Il valore predefinito è False

scoring_timeout_ms
Necessario
int

Timeout da applicare per l'assegnazione dei punteggi alle chiamate a questo servizio Web. Il valore predefinito è 60000.

replica_max_concurrent_requests
Necessario
int

Numero di richieste simultanee massime per replica per consentire questo servizio Web. Assume il valore predefinito 1. Non modificare questa impostazione dal valore predefinito di 1 a meno che non sia stato indicato dal supporto tecnico Microsoft o da un membro del team di Azure Machine Learning.

max_request_wait_time
Necessario
int

La quantità massima di tempo per cui una richiesta rimarrà nella coda (in millisecondi) prima di restituire un errore 503. Il valore predefinito è 500.

num_replicas
Necessario
int

Numero di contenitori da allocare per questo servizio Web. Nessun valore predefinito, se questo parametro non è impostato, il ridimensionamento automatico è abilitato per impostazione predefinita.

primary_key
Necessario
str

Chiave di autenticazione primaria da usare per questo servizio Web.

secondary_key
Necessario
str

Chiave di autenticazione secondaria da usare per questo servizio Web.

tags
Necessario

Dizionario dei tag chiave valore per assegnare questo servizio Web.

properties
Necessario

Dizionario delle proprietà del valore chiave per assegnare questo servizio Web. Queste proprietà non possono essere modificate dopo la distribuzione, ma è possibile aggiungere nuove coppie di valori chiave.

description
Necessario
str

Descrizione per assegnare questo servizio Web.

gpu_cores
Necessario
int

Numero di core GPU da allocare per questo servizio Web. Il valore predefinito è 0.

period_seconds
Necessario
int

La frequenza (in secondi) con cui eseguire il probe di attività. Il valore predefinito è 10 secondi. Il valore minimo è 1.

initial_delay_seconds
Necessario
int

Il numero di secondi dopo l'avvio del contenitore prima che vengano avviati i probe di attività. Il valore predefinito è 310.

timeout_seconds
Necessario
int

Numero di secondi dopo il quale il probe di liveness timeout. Il valore predefinito è 2 secondi. Il valore minimo è 1.

success_threshold
Necessario
int

Il numero minimo di successi consecutivi perché il probe di attività venga considerato riuscito dopo un errore. Assume il valore predefinito 1. Il valore minimo è 1.

failure_threshold
Necessario
int

Quando un pod inizia e il probe di liveness ha esito negativo, Kubernetes tenterà failureThreshold i tempi prima di rinunciare. Il valore predefinito è 3. Il valore minimo è 1.

namespace
Necessario
str

Spazio dei nomi Kubernetes in cui distribuire questo servizio Web: fino a 63 caratteri alfanumerici minuscoli ('a'-'z', '0'-'9') e trattino ('-'). I primi e gli ultimi caratteri non possono essere trattini.

token_auth_enabled
Necessario

Indica se abilitare l'autenticazione di Azure Active Directory per questo servizio Web. Se questa opzione è abilitata, gli utenti possono accedere a questo servizio Web recuperando il token di accesso usando le credenziali di Azure Active Directory. Il valore predefinito è False.

cpu_cores_limit
Necessario

Il numero massimo di core cpu che questo servizio Web può usare. Può essere un decimale.

memory_gb_limit
Necessario

La quantità massima di memoria (in GB) di questo servizio Web è consentita per l'uso. Può essere un decimale.

blobfuse_enabled

Indica se abilitare blobfuse per il download di modelli per questo servizio Web. Impostazione predefinita su True

Valore predefinito: None
autoscale_enabled
Necessario

Indica se abilitare la scalabilità automatica per questo servizio Web. Il valore predefinito è True se num_replicas non è Nessuno.

autoscale_min_replicas
Necessario
int

Numero minimo di contenitori da usare durante la scalabilità automatica di questo servizio Web. Assume il valore predefinito 1.

autoscale_max_replicas
Necessario
int

Numero massimo di contenitori da usare durante la scalabilità automatica di questo servizio Web. Impostazione predefinita su 10

autoscale_refresh_seconds
Necessario
int

Frequenza con cui il ridimensionatore automatico deve tentare di ridimensionare questo servizio Web. Assume il valore predefinito 1.

autoscale_target_utilization
Necessario
int

L'utilizzo di destinazione (in percentuale superiore a 100) il ridimensionatore automatico deve tentare di mantenere per questo servizio Web. Il valore predefinito è 70.

collect_model_data
Necessario

Indica se abilitare o meno la raccolta dati del modello per questo servizio Web. Il valore predefinito è False.

auth_enabled
Necessario

Indica se abilitare l'autenticazione per questo servizio Web. Impostazione predefinita su True.

cpu_cores
Necessario

Numero di core CPU da allocare per questo servizio Web. Può essere un decimale. Impostazione predefinita a 0.1

memory_gb
Necessario

Quantità di memoria (in GB) da allocare per questo servizio Web. Può essere un decimale. Il valore predefinito è 0.5

enable_app_insights
Necessario

Indica se abilitare o meno la registrazione di Application Insights per questo servizio Web. Il valore predefinito è False

scoring_timeout_ms
Necessario
int

Timeout da applicare per l'assegnazione dei punteggi alle chiamate a questo servizio Web. Il valore predefinito è 60000.

replica_max_concurrent_requests
Necessario
int

Numero massimo di richieste simultanee per replica che consentono questo servizio Web. Assume il valore predefinito 1. Non modificare questa impostazione dal valore predefinito 1, a meno che non venga richiesto dal supporto tecnico Microsoft o da un membro del team di Azure Machine Learning.

max_request_wait_time
Necessario
int

La quantità massima di tempo per cui una richiesta rimarrà nella coda (in millisecondi) prima di restituire un errore 503. Il valore predefinito è 500.

num_replicas
Necessario
int

Numero di contenitori da allocare per questo servizio Web. Nessun valore predefinito, se questo parametro non è impostato, l'utilità di scalabilità automatica è abilitata per impostazione predefinita.

primary_key
Necessario
str

Chiave di autenticazione primaria da usare per questo servizio Web.

secondary_key
Necessario
str

Chiave di autenticazione secondaria da usare per questo servizio Web.

tags
Necessario

Dizionario di tag chiave-valore per assegnare questo servizio Web.

properties
Necessario

Dizionario delle proprietà chiave-valore per assegnare questo servizio Web. Queste proprietà non possono essere modificate dopo la distribuzione, ma è possibile aggiungere nuove coppie chiave-valore.

description
Necessario
str

Descrizione da assegnare a questo servizio Web.

gpu_cores
Necessario
int

Numero di core GPU da allocare per questo servizio Web. Il valore predefinito è 0.

period_seconds
Necessario
int

La frequenza (in secondi) con cui eseguire il probe di attività. Il valore predefinito è 10 secondi. Il valore minimo è 1.

initial_delay_seconds
Necessario
int

Il numero di secondi dopo l'avvio del contenitore prima che vengano avviati i probe di attività. Il valore predefinito è 310.

timeout_seconds
Necessario
int

Numero di secondi dopo il quale si verifica il timeout del probe di attività. Il valore predefinito è 2 secondi. Il valore minimo è 1.

success_threshold
Necessario
int

Il numero minimo di successi consecutivi perché il probe di attività venga considerato riuscito dopo un errore. Assume il valore predefinito 1. Il valore minimo è 1.

failure_threshold
Necessario
int

Quando un pod viene avviato e il probe di attività ha esito negativo, Kubernetes proverà failureThreshold i tempi prima di rinunciare. Il valore predefinito è 3. Il valore minimo è 1.

namespace
Necessario
str

Spazio dei nomi Kubernetes in cui distribuire questo servizio Web: fino a 63 caratteri alfanumerici minuscoli ('a'-'z', '0'-'9') e trattino ('-'). Il primo e l'ultimo carattere non possono essere trattini.

token_auth_enabled
Necessario

Indica se abilitare o meno l'autenticazione di Azure Active Directory per questo servizio Web. Se questa opzione è abilitata, gli utenti possono accedere a questo servizio Web recuperando il token di accesso usando le credenziali di Azure Active Directory. Il valore predefinito è False.

compute_target_name
Necessario
str

Nome della destinazione di calcolo in cui eseguire la distribuzione

cpu_cores_limit
Necessario

È consentito usare il numero massimo di core cpu per questo servizio Web. Può essere un decimale.

memory_gb_limit
Necessario

La quantità massima di memoria (in GB) che questo servizio Web può usare. Può essere un decimale.

blobfuse_enabled
Necessario

Indica se abilitare blobfuse per il download del modello per questo servizio Web. Il valore predefinito è True

Variabili

Nome Descrizione
autoscale_enabled

Indica se abilitare la scalabilità automatica per questo servizio Web. Il valore predefinito è True se num_replicas non è Nessuno.

autoscale_min_replicas
int

Numero minimo di contenitori da usare per la scalabilità automatica di questo servizio Web. Assume il valore predefinito 1.

autoscale_max_replicas
int

Numero massimo di contenitori da usare per la scalabilità automatica di questo servizio Web. Il valore predefinito è 10

autoscale_refresh_seconds
int

Frequenza con cui l'utilità di scalabilità automatica deve tentare di ridimensionare questo servizio Web. Assume il valore predefinito 1.

autoscale_target_utilization
int

L'utilizzo di destinazione ,in percentuale su 100, il ridimensionamento automatico deve tentare di gestire per questo servizio Web. Il valore predefinito è 70.

collect_model_data

Indica se abilitare o meno la raccolta dei dati del modello per questo servizio Web. Il valore predefinito è False.

auth_enabled

Indica se abilitare o meno l'autenticazione per questo servizio Web. Il valore predefinito è True.

cpu_cores

Numero di core CPU da allocare per questo servizio Web. Può essere un decimale. Il valore predefinito è 0.1

memory_gb

Quantità di memoria (in GB) da allocare per questo servizio Web. Può essere un decimale. Il valore predefinito è 0.5

enable_app_insights

Indica se abilitare o meno la registrazione di Application Insights per questo servizio Web. Il valore predefinito è False

scoring_timeout_ms
int

Timeout da applicare per l'assegnazione dei punteggi alle chiamate a questo servizio Web. Il valore predefinito è 60000.

replica_max_concurrent_requests
int

Numero massimo di richieste simultanee per replica che consentono questo servizio Web. Assume il valore predefinito 1. Non modificare questa impostazione dal valore predefinito 1, a meno che non venga richiesto dal supporto tecnico Microsoft o da un membro del team di Azure Machine Learning.

max_request_wait_time
int

La quantità massima di tempo per cui una richiesta rimarrà nella coda (in millisecondi) prima di restituire un errore 503. Il valore predefinito è 500.

num_replicas
int

Numero di contenitori da allocare per questo servizio Web. Nessun valore predefinito, se questo parametro non è impostato, l'utilità di scalabilità automatica è abilitata per impostazione predefinita.

primary_key
str

Chiave di autenticazione primaria da usare per questo servizio Web.

secondary_key
str

Chiave di autenticazione secondaria da usare per questo servizio Web.

azureml.core.webservice.AksServiceDeploymentConfiguration.tags

Dizionario di tag chiave-valore per assegnare questo servizio Web.

azureml.core.webservice.AksServiceDeploymentConfiguration.properties

Dizionario delle proprietà chiave-valore per assegnare questo servizio Web. Queste proprietà non possono essere modificate dopo la distribuzione, ma è possibile aggiungere nuove coppie chiave-valore.

azureml.core.webservice.AksServiceDeploymentConfiguration.description

Descrizione da assegnare a questo servizio Web.

gpu_cores
int

Numero di core GPU da allocare per questo servizio Web. Il valore predefinito è 0.

period_seconds
int

La frequenza (in secondi) con cui eseguire il probe di attività. Il valore predefinito è 10 secondi. Il valore minimo è 1.

initial_delay_seconds
int

Il numero di secondi dopo l'avvio del contenitore prima che vengano avviati i probe di attività. Il valore predefinito è 310.

timeout_seconds
int

Numero di secondi dopo il quale si verifica il timeout del probe di attività. Il valore predefinito è 2 secondi. Il valore minimo è 1.

success_threshold
int

Il numero minimo di successi consecutivi perché il probe di attività venga considerato riuscito dopo un errore. Assume il valore predefinito 1. Il valore minimo è 1.

failure_threshold
int

Quando un pod inizia e il probe di liveness ha esito negativo, Kubernetes tenterà failureThreshold i tempi prima di rinunciare. Il valore predefinito è 3. Il valore minimo è 1.

azureml.core.webservice.AksServiceDeploymentConfiguration.namespace

Spazio dei nomi Kubernetes in cui distribuire questo servizio Web: fino a 63 caratteri alfanumerici minuscoli ('a'-'z', '0'-'9') e trattino ('-'). I primi e gli ultimi caratteri non possono essere trattini.

token_auth_enabled

Indica se abilitare l'autenticazione di Azure Active Directory per questo servizio Web. Se questa opzione è abilitata, gli utenti possono accedere a questo servizio Web recuperando il token di accesso usando le credenziali di Azure Active Directory. Il valore predefinito è False.

Metodi

print_deploy_configuration

Stampare la configurazione della distribuzione.

validate_configuration

Verificare che i valori di configurazione specificati siano validi.

Genererà un'eccezione WebserviceException se la convalida non riesce.

print_deploy_configuration

Stampare la configurazione della distribuzione.

print_deploy_configuration()

validate_configuration

Verificare che i valori di configurazione specificati siano validi.

Genererà un'eccezione WebserviceException se la convalida non riesce.

validate_configuration()

Eccezioni

Tipo Descrizione