AksServiceDeploymentConfiguration Classe
Representa uma informação de configuração de implementação para um serviço implementado no Azure Kubernetes Service.
Crie um objeto AksServiceDeploymentConfiguration com o deploy_configuration
método da AksWebservice classe.
Inicialize um objeto de configuração para implementar num destino de computação do AKS.
- Herança
-
AksServiceDeploymentConfiguration
Construtor
AksServiceDeploymentConfiguration(autoscale_enabled, autoscale_min_replicas, autoscale_max_replicas, autoscale_refresh_seconds, autoscale_target_utilization, collect_model_data, auth_enabled, cpu_cores, memory_gb, enable_app_insights, scoring_timeout_ms, replica_max_concurrent_requests, max_request_wait_time, num_replicas, primary_key, secondary_key, tags, properties, description, gpu_cores, period_seconds, initial_delay_seconds, timeout_seconds, success_threshold, failure_threshold, namespace, token_auth_enabled, compute_target_name, cpu_cores_limit, memory_gb_limit, blobfuse_enabled=None)
Parâmetros
Name | Description |
---|---|
cpu_cores_limit
Necessário
|
O número máximo de núcleos de cpu que este Webservice tem permissão para utilizar. Pode ser um decimal. |
memory_gb_limit
Necessário
|
A quantidade máxima de memória (em GB) que este Webservice tem permissão para utilizar. Pode ser um decimal. |
autoscale_enabled
Necessário
|
Indica se pretende ativar o dimensionamento automático para este webservice.
A predefinição é Verdadeiro se |
autoscale_min_replicas
Necessário
|
O número mínimo de contentores a utilizar ao dimensionar automaticamente este webservice. A predefinição é 1. |
autoscale_max_replicas
Necessário
|
O número máximo de contentores a utilizar ao dimensionar automaticamente este Webservice. Predefinições para 10 |
autoscale_refresh_seconds
Necessário
|
Com que frequência o dimensionador automático deve tentar dimensionar este webservice. A predefinição é 1. |
autoscale_target_utilization
Necessário
|
A utilização de destino (em percentagem de 100) que o dimensionador automático deve tentar manter para este webservice. A predefinição é 70. |
collect_model_data
Necessário
|
Se pretende ativar ou não a recolha de dados de modelos para este Webservice. A predefinição é Falso. |
auth_enabled
Necessário
|
Se pretende ativar ou não a autenticação para este webservice. A predefinição é Verdadeiro. |
cpu_cores
Necessário
|
O número de núcleos de CPU a alocar para este webservice. Pode ser um decimal. Predefinições para 0.1 |
memory_gb
Necessário
|
A quantidade de memória (em GB) a alocar para este webservice. Pode ser um decimal. Predefinições para 0,5 |
enable_app_insights
Necessário
|
Se pretende ativar ou não o registo do Application Insights para este Webservice. Predefinições para Falso |
scoring_timeout_ms
Necessário
|
Um tempo limite para impor chamadas de classificação para este webservice. A predefinição é 60000. |
replica_max_concurrent_requests
Necessário
|
O número máximo de pedidos simultâneos por réplica para permitir este serviço Web. A predefinição é 1. Não altere esta definição do valor predefinido de 1, a menos que seja instruído pelo Suporte Técnico da Microsoft ou por um membro da equipa do Azure Machine Learning. |
max_request_wait_time
Necessário
|
A quantidade máxima de tempo que um pedido permanecerá na fila (em milissegundos) antes de devolver um erro 503. A predefinição é 500. |
num_replicas
Necessário
|
O número de contentores a alocar para este Webservice. Sem predefinição, se este parâmetro não estiver definido, o dimensionador automático está ativado por predefinição. |
primary_key
Necessário
|
Uma chave de autenticação primária a utilizar para este webservice. |
secondary_key
Necessário
|
Uma chave de autenticação secundária a utilizar para este webservice. |
tags
Necessário
|
Dicionário de etiquetas de valor de chave para dar este webservice. |
properties
Necessário
|
Dicionário de propriedades de valor de chave para fornecer este Webservice. Estas propriedades não podem ser alteradas após a implementação, no entanto, podem ser adicionados novos pares de valores chave. |
description
Necessário
|
Uma descrição para dar a este Webservice. |
gpu_cores
Necessário
|
O número de núcleos de GPU a alocar para este Webservice. A predefinição é 0. |
period_seconds
Necessário
|
Com que frequência (em segundos) executar a sonda liveness. Predefinição para 10 segundos. O valor mínimo é 1. |
initial_delay_seconds
Necessário
|
Número de segundos após o início do contentor antes de as pesquisas de liveness serem iniciadas. A predefinição é 310. |
timeout_seconds
Necessário
|
Número de segundos após o qual a sonda de liveness excede o tempo limite. A predefinição é de 2 segundos. O valor mínimo é 1. |
success_threshold
Necessário
|
Êxitos mínimos consecutivos para que a sonda liveness seja considerada bem-sucedida depois de ter falhado. A predefinição é 1. O valor mínimo é 1. |
failure_threshold
Necessário
|
Quando um Pod é iniciado e a sonda liveness falha, o Kubernetes tenta |
namespace
Necessário
|
O espaço de nomes do Kubernetes no qual pretende implementar este Webservice: até 63 carateres alfanuméricos em minúsculas ('a'-'z', '0'-'9') e hífen ('-'). O primeiro e o último carateres não podem ser hífenes. |
token_auth_enabled
Necessário
|
Se pretende ativar ou não a autenticação do Azure Active Directory para este serviço Web. Se esta opção estiver ativada, os utilizadores podem aceder a este webservice ao obter o token de acesso com as respetivas credenciais do Azure Active Directory. A predefinição é Falso. |
cpu_cores_limit
Necessário
|
O número máximo de núcleos de cpu que este Webservice tem permissão para utilizar. Pode ser um decimal. |
memory_gb_limit
Necessário
|
A quantidade máxima de memória (em GB) que este Webservice tem permissão para utilizar. Pode ser um decimal. |
blobfuse_enabled
|
Quer ative ou não o blobfuse para transferência de modelos para este Webservice. Predefinições para Verdadeiro Default value: None
|
autoscale_enabled
Necessário
|
Indica se pretende ativar o dimensionamento automático para este webservice.
A predefinição é Verdadeiro se |
autoscale_min_replicas
Necessário
|
O número mínimo de contentores a utilizar ao dimensionar automaticamente este webservice. A predefinição é 1. |
autoscale_max_replicas
Necessário
|
O número máximo de contentores a utilizar ao dimensionar automaticamente este Webservice. Predefinições para 10 |
autoscale_refresh_seconds
Necessário
|
Com que frequência o dimensionador automático deve tentar dimensionar este webservice. A predefinição é 1. |
autoscale_target_utilization
Necessário
|
A utilização de destino (em percentagem de 100) que o dimensionador automático deve tentar manter para este webservice. A predefinição é 70. |
collect_model_data
Necessário
|
Se pretende ativar ou não a recolha de dados de modelos para este Webservice. A predefinição é Falso. |
auth_enabled
Necessário
|
Se pretende ativar ou não a autenticação para este webservice. A predefinição é Verdadeiro. |
cpu_cores
Necessário
|
O número de núcleos de CPU a alocar para este webservice. Pode ser um decimal. Predefinições para 0.1 |
memory_gb
Necessário
|
A quantidade de memória (em GB) a alocar para este Webservice. Pode ser um decimal. Predefinições para 0,5 |
enable_app_insights
Necessário
|
Quer ative ou não o registo do Application Insights para este Webservice. Predefinições para Falso |
scoring_timeout_ms
Necessário
|
Um tempo limite para impor chamadas de classificação para este webservice. A predefinição é 60000. |
replica_max_concurrent_requests
Necessário
|
O número máximo de pedidos simultâneos por réplica para permitir este Webservice. A predefinição é 1. Não altere esta definição do valor predefinido de 1, a menos que seja instruído pelo Suporte Técnico da Microsoft ou por um membro da equipa do Azure Machine Learning. |
max_request_wait_time
Necessário
|
A quantidade máxima de tempo que um pedido permanecerá na fila (em milissegundos) antes de devolver um erro 503. A predefinição é 500. |
num_replicas
Necessário
|
O número de contentores a alocar para este Webservice. Sem predefinição, se este parâmetro não estiver definido, o dimensionador automático está ativado por predefinição. |
primary_key
Necessário
|
Uma chave de autenticação primária a utilizar para este webservice. |
secondary_key
Necessário
|
Uma chave de autenticação secundária a utilizar para este webservice. |
tags
Necessário
|
Dicionário de etiquetas de valor chave para fornecer este Webservice. |
properties
Necessário
|
Dicionário de propriedades de valor chave para fornecer este Webservice. Estas propriedades não podem ser alteradas após a implementação, no entanto, podem ser adicionados novos pares de valores chave. |
description
Necessário
|
Uma descrição para fornecer este serviço Web. |
gpu_cores
Necessário
|
O número de núcleos de GPU a alocar para este Webservice. A predefinição é 0. |
period_seconds
Necessário
|
Com que frequência (em segundos) executar a sonda liveness. Predefinição para 10 segundos. O valor mínimo é 1. |
initial_delay_seconds
Necessário
|
Número de segundos após o início do contentor antes de as sondas liveness serem iniciadas. A predefinição é 310. |
timeout_seconds
Necessário
|
Número de segundos após o qual a sonda de liveness excede o limite de tempo. A predefinição é de 2 segundos. O valor mínimo é 1. |
success_threshold
Necessário
|
Êxitos mínimos consecutivos para que a sonda liveness seja considerada com êxito depois de ter falhado. A predefinição é 1. O valor mínimo é 1. |
failure_threshold
Necessário
|
Quando um Pod é iniciado e a sonda liveness falha, o Kubernetes tenta horas |
namespace
Necessário
|
O espaço de nomes do Kubernetes no qual pretende implementar este Webservice: até 63 carateres alfanuméricos em minúsculas ('a'-'z', '0'-'9') e carateres de hífen ('-'). Os primeiros e últimos carateres não podem ser hífenes. |
token_auth_enabled
Necessário
|
Quer ative ou não a autenticação do Azure Active Directory para este webservice. Se esta opção estiver ativada, os utilizadores podem aceder a este webservice ao obter o token de acesso com as respetivas credenciais do Azure Active Directory. Predefinições para Falso. |
compute_target_name
Necessário
|
O nome do destino de computação a implementar no |
cpu_cores_limit
Necessário
|
O número máximo de núcleos de cpu que este Webservice pode utilizar. Pode ser um decimal. |
memory_gb_limit
Necessário
|
A quantidade máxima de memória (em GB) que este Webservice pode utilizar. Pode ser um decimal. |
blobfuse_enabled
Necessário
|
Quer ative ou não o blobfuse para transferência de modelos para este Webservice. Predefinições para Verdadeiro |
Variáveis
Name | Description |
---|---|
autoscale_enabled
|
Indica se pretende ativar o dimensionamento automático para este Webservice.
A predefinição é Verdadeiro se |
autoscale_min_replicas
|
O número mínimo de contentores a utilizar ao dimensionar automaticamente este Webservice. A predefinição é 1. |
autoscale_max_replicas
|
O número máximo de contentores a utilizar ao dimensionar automaticamente este Webservice. Predefinições para 10 |
autoscale_refresh_seconds
|
Com que frequência o dimensionador automático deve tentar dimensionar este webservice. A predefinição é 1. |
autoscale_target_utilization
|
A utilização de destino (em percentagem em 100) que o dimensionador automático deve tentar manter para este webservice. A predefinição é 70. |
collect_model_data
|
Quer ative ou não a recolha de dados de modelos para este Webservice. Predefinições para Falso. |
auth_enabled
|
Quer ative ou não a autenticação para este Webservice. Predefinições para Verdadeiro. |
cpu_cores
|
O número de núcleos de CPU a alocar para este Webservice. Pode ser um decimal. Predefinições para 0.1 |
memory_gb
|
A quantidade de memória (em GB) a alocar para este Webservice. Pode ser um decimal. Predefinições para 0,5 |
enable_app_insights
|
Quer ative ou não o registo do Application Insights para este Webservice. Predefinições para Falso |
scoring_timeout_ms
|
Um tempo limite para impor chamadas de classificação para este webservice. A predefinição é 60000. |
replica_max_concurrent_requests
|
O número máximo de pedidos simultâneos por réplica para permitir este Webservice. A predefinição é 1. Não altere esta definição do valor predefinido de 1, a menos que seja instruído pelo Suporte Técnico da Microsoft ou por um membro da equipa do Azure Machine Learning. |
max_request_wait_time
|
A quantidade máxima de tempo que um pedido permanecerá na fila (em milissegundos) antes de devolver um erro 503. A predefinição é 500. |
num_replicas
|
O número de contentores a alocar para este Webservice. Sem predefinição, se este parâmetro não estiver definido, o dimensionador automático está ativado por predefinição. |
primary_key
|
Uma chave de autenticação primária a utilizar para este webservice. |
secondary_key
|
Uma chave de autenticação secundária a utilizar para este webservice. |
azureml.core.webservice.AksServiceDeploymentConfiguration.tags
|
Dicionário de etiquetas de valor chave para fornecer este Webservice. |
azureml.core.webservice.AksServiceDeploymentConfiguration.properties
|
Dicionário de propriedades de valor chave para fornecer este Webservice. Estas propriedades não podem ser alteradas após a implementação, no entanto, podem ser adicionados novos pares de valores chave. |
azureml.core.webservice.AksServiceDeploymentConfiguration.description
|
Uma descrição para fornecer este serviço Web. |
gpu_cores
|
O número de núcleos de GPU a alocar para este Webservice. A predefinição é 0. |
period_seconds
|
Com que frequência (em segundos) executar a sonda liveness. Predefinição para 10 segundos. O valor mínimo é 1. |
initial_delay_seconds
|
Número de segundos após o início do contentor antes de as sondas liveness serem iniciadas. A predefinição é 310. |
timeout_seconds
|
Número de segundos após o qual a sonda de liveness excede o limite de tempo. A predefinição é de 2 segundos. O valor mínimo é 1. |
success_threshold
|
Êxitos mínimos consecutivos para que a sonda liveness seja considerada com êxito depois de ter falhado. A predefinição é 1. O valor mínimo é 1. |
failure_threshold
|
Quando um Pod é iniciado e a sonda liveness falha, o Kubernetes tenta horas |
azureml.core.webservice.AksServiceDeploymentConfiguration.namespace
|
O espaço de nomes do Kubernetes no qual pretende implementar este Webservice: até 63 carateres alfanuméricos em minúsculas ('a'-'z', '0'-'9') e carateres de hífen ('-'). Os primeiros e últimos carateres não podem ser hífenes. |
token_auth_enabled
|
Quer ative ou não a autenticação do Azure Active Directory para este webservice. Se esta opção estiver ativada, os utilizadores podem aceder a este webservice ao obter o token de acesso com as respetivas credenciais do Azure Active Directory. Predefinições para Falso. |
Métodos
print_deploy_configuration |
Imprima a configuração da implementação. |
validate_configuration |
Verifique se os valores de configuração especificados são válidos. Irá gerar um WebserviceException se a validação falhar. |
print_deploy_configuration
Imprima a configuração da implementação.
print_deploy_configuration()
validate_configuration
Verifique se os valores de configuração especificados são válidos.
Irá gerar um WebserviceException se a validação falhar.
validate_configuration()
Exceções
Tipo | Description |
---|---|