Partilhar via


AksServiceDeploymentConfiguration Classe

Representa uma informação de configuração de implementação para um serviço implementado no Azure Kubernetes Service.

Crie um objeto AksServiceDeploymentConfiguration com o deploy_configuration método da AksWebservice classe.

Inicialize um objeto de configuração para implementar num destino de computação do AKS.

Herança
AksServiceDeploymentConfiguration

Construtor

AksServiceDeploymentConfiguration(autoscale_enabled, autoscale_min_replicas, autoscale_max_replicas, autoscale_refresh_seconds, autoscale_target_utilization, collect_model_data, auth_enabled, cpu_cores, memory_gb, enable_app_insights, scoring_timeout_ms, replica_max_concurrent_requests, max_request_wait_time, num_replicas, primary_key, secondary_key, tags, properties, description, gpu_cores, period_seconds, initial_delay_seconds, timeout_seconds, success_threshold, failure_threshold, namespace, token_auth_enabled, compute_target_name, cpu_cores_limit, memory_gb_limit, blobfuse_enabled=None)

Parâmetros

Name Description
cpu_cores_limit
Necessário

O número máximo de núcleos de cpu que este Webservice tem permissão para utilizar. Pode ser um decimal.

memory_gb_limit
Necessário

A quantidade máxima de memória (em GB) que este Webservice tem permissão para utilizar. Pode ser um decimal.

autoscale_enabled
Necessário

Indica se pretende ativar o dimensionamento automático para este webservice. A predefinição é Verdadeiro se num_replicas for Nenhum.

autoscale_min_replicas
Necessário
int

O número mínimo de contentores a utilizar ao dimensionar automaticamente este webservice. A predefinição é 1.

autoscale_max_replicas
Necessário
int

O número máximo de contentores a utilizar ao dimensionar automaticamente este Webservice. Predefinições para 10

autoscale_refresh_seconds
Necessário
int

Com que frequência o dimensionador automático deve tentar dimensionar este webservice. A predefinição é 1.

autoscale_target_utilization
Necessário
int

A utilização de destino (em percentagem de 100) que o dimensionador automático deve tentar manter para este webservice. A predefinição é 70.

collect_model_data
Necessário

Se pretende ativar ou não a recolha de dados de modelos para este Webservice. A predefinição é Falso.

auth_enabled
Necessário

Se pretende ativar ou não a autenticação para este webservice. A predefinição é Verdadeiro.

cpu_cores
Necessário

O número de núcleos de CPU a alocar para este webservice. Pode ser um decimal. Predefinições para 0.1

memory_gb
Necessário

A quantidade de memória (em GB) a alocar para este webservice. Pode ser um decimal. Predefinições para 0,5

enable_app_insights
Necessário

Se pretende ativar ou não o registo do Application Insights para este Webservice. Predefinições para Falso

scoring_timeout_ms
Necessário
int

Um tempo limite para impor chamadas de classificação para este webservice. A predefinição é 60000.

replica_max_concurrent_requests
Necessário
int

O número máximo de pedidos simultâneos por réplica para permitir este serviço Web. A predefinição é 1. Não altere esta definição do valor predefinido de 1, a menos que seja instruído pelo Suporte Técnico da Microsoft ou por um membro da equipa do Azure Machine Learning.

max_request_wait_time
Necessário
int

A quantidade máxima de tempo que um pedido permanecerá na fila (em milissegundos) antes de devolver um erro 503. A predefinição é 500.

num_replicas
Necessário
int

O número de contentores a alocar para este Webservice. Sem predefinição, se este parâmetro não estiver definido, o dimensionador automático está ativado por predefinição.

primary_key
Necessário
str

Uma chave de autenticação primária a utilizar para este webservice.

secondary_key
Necessário
str

Uma chave de autenticação secundária a utilizar para este webservice.

tags
Necessário

Dicionário de etiquetas de valor de chave para dar este webservice.

properties
Necessário

Dicionário de propriedades de valor de chave para fornecer este Webservice. Estas propriedades não podem ser alteradas após a implementação, no entanto, podem ser adicionados novos pares de valores chave.

description
Necessário
str

Uma descrição para dar a este Webservice.

gpu_cores
Necessário
int

O número de núcleos de GPU a alocar para este Webservice. A predefinição é 0.

period_seconds
Necessário
int

Com que frequência (em segundos) executar a sonda liveness. Predefinição para 10 segundos. O valor mínimo é 1.

initial_delay_seconds
Necessário
int

Número de segundos após o início do contentor antes de as pesquisas de liveness serem iniciadas. A predefinição é 310.

timeout_seconds
Necessário
int

Número de segundos após o qual a sonda de liveness excede o tempo limite. A predefinição é de 2 segundos. O valor mínimo é 1.

success_threshold
Necessário
int

Êxitos mínimos consecutivos para que a sonda liveness seja considerada bem-sucedida depois de ter falhado. A predefinição é 1. O valor mínimo é 1.

failure_threshold
Necessário
int

Quando um Pod é iniciado e a sonda liveness falha, o Kubernetes tenta failureThreshold horas antes de desistir. A predefinição é 3. O valor mínimo é 1.

namespace
Necessário
str

O espaço de nomes do Kubernetes no qual pretende implementar este Webservice: até 63 carateres alfanuméricos em minúsculas ('a'-'z', '0'-'9') e hífen ('-'). O primeiro e o último carateres não podem ser hífenes.

token_auth_enabled
Necessário

Se pretende ativar ou não a autenticação do Azure Active Directory para este serviço Web. Se esta opção estiver ativada, os utilizadores podem aceder a este webservice ao obter o token de acesso com as respetivas credenciais do Azure Active Directory. A predefinição é Falso.

cpu_cores_limit
Necessário

O número máximo de núcleos de cpu que este Webservice tem permissão para utilizar. Pode ser um decimal.

memory_gb_limit
Necessário

A quantidade máxima de memória (em GB) que este Webservice tem permissão para utilizar. Pode ser um decimal.

blobfuse_enabled

Quer ative ou não o blobfuse para transferência de modelos para este Webservice. Predefinições para Verdadeiro

Default value: None
autoscale_enabled
Necessário

Indica se pretende ativar o dimensionamento automático para este webservice. A predefinição é Verdadeiro se num_replicas for Nenhum.

autoscale_min_replicas
Necessário
int

O número mínimo de contentores a utilizar ao dimensionar automaticamente este webservice. A predefinição é 1.

autoscale_max_replicas
Necessário
int

O número máximo de contentores a utilizar ao dimensionar automaticamente este Webservice. Predefinições para 10

autoscale_refresh_seconds
Necessário
int

Com que frequência o dimensionador automático deve tentar dimensionar este webservice. A predefinição é 1.

autoscale_target_utilization
Necessário
int

A utilização de destino (em percentagem de 100) que o dimensionador automático deve tentar manter para este webservice. A predefinição é 70.

collect_model_data
Necessário

Se pretende ativar ou não a recolha de dados de modelos para este Webservice. A predefinição é Falso.

auth_enabled
Necessário

Se pretende ativar ou não a autenticação para este webservice. A predefinição é Verdadeiro.

cpu_cores
Necessário

O número de núcleos de CPU a alocar para este webservice. Pode ser um decimal. Predefinições para 0.1

memory_gb
Necessário

A quantidade de memória (em GB) a alocar para este Webservice. Pode ser um decimal. Predefinições para 0,5

enable_app_insights
Necessário

Quer ative ou não o registo do Application Insights para este Webservice. Predefinições para Falso

scoring_timeout_ms
Necessário
int

Um tempo limite para impor chamadas de classificação para este webservice. A predefinição é 60000.

replica_max_concurrent_requests
Necessário
int

O número máximo de pedidos simultâneos por réplica para permitir este Webservice. A predefinição é 1. Não altere esta definição do valor predefinido de 1, a menos que seja instruído pelo Suporte Técnico da Microsoft ou por um membro da equipa do Azure Machine Learning.

max_request_wait_time
Necessário
int

A quantidade máxima de tempo que um pedido permanecerá na fila (em milissegundos) antes de devolver um erro 503. A predefinição é 500.

num_replicas
Necessário
int

O número de contentores a alocar para este Webservice. Sem predefinição, se este parâmetro não estiver definido, o dimensionador automático está ativado por predefinição.

primary_key
Necessário
str

Uma chave de autenticação primária a utilizar para este webservice.

secondary_key
Necessário
str

Uma chave de autenticação secundária a utilizar para este webservice.

tags
Necessário

Dicionário de etiquetas de valor chave para fornecer este Webservice.

properties
Necessário

Dicionário de propriedades de valor chave para fornecer este Webservice. Estas propriedades não podem ser alteradas após a implementação, no entanto, podem ser adicionados novos pares de valores chave.

description
Necessário
str

Uma descrição para fornecer este serviço Web.

gpu_cores
Necessário
int

O número de núcleos de GPU a alocar para este Webservice. A predefinição é 0.

period_seconds
Necessário
int

Com que frequência (em segundos) executar a sonda liveness. Predefinição para 10 segundos. O valor mínimo é 1.

initial_delay_seconds
Necessário
int

Número de segundos após o início do contentor antes de as sondas liveness serem iniciadas. A predefinição é 310.

timeout_seconds
Necessário
int

Número de segundos após o qual a sonda de liveness excede o limite de tempo. A predefinição é de 2 segundos. O valor mínimo é 1.

success_threshold
Necessário
int

Êxitos mínimos consecutivos para que a sonda liveness seja considerada com êxito depois de ter falhado. A predefinição é 1. O valor mínimo é 1.

failure_threshold
Necessário
int

Quando um Pod é iniciado e a sonda liveness falha, o Kubernetes tenta horas failureThreshold antes de desistir. A predefinição é 3. O valor mínimo é 1.

namespace
Necessário
str

O espaço de nomes do Kubernetes no qual pretende implementar este Webservice: até 63 carateres alfanuméricos em minúsculas ('a'-'z', '0'-'9') e carateres de hífen ('-'). Os primeiros e últimos carateres não podem ser hífenes.

token_auth_enabled
Necessário

Quer ative ou não a autenticação do Azure Active Directory para este webservice. Se esta opção estiver ativada, os utilizadores podem aceder a este webservice ao obter o token de acesso com as respetivas credenciais do Azure Active Directory. Predefinições para Falso.

compute_target_name
Necessário
str

O nome do destino de computação a implementar no

cpu_cores_limit
Necessário

O número máximo de núcleos de cpu que este Webservice pode utilizar. Pode ser um decimal.

memory_gb_limit
Necessário

A quantidade máxima de memória (em GB) que este Webservice pode utilizar. Pode ser um decimal.

blobfuse_enabled
Necessário

Quer ative ou não o blobfuse para transferência de modelos para este Webservice. Predefinições para Verdadeiro

Variáveis

Name Description
autoscale_enabled

Indica se pretende ativar o dimensionamento automático para este Webservice. A predefinição é Verdadeiro se num_replicas for Nenhuma.

autoscale_min_replicas
int

O número mínimo de contentores a utilizar ao dimensionar automaticamente este Webservice. A predefinição é 1.

autoscale_max_replicas
int

O número máximo de contentores a utilizar ao dimensionar automaticamente este Webservice. Predefinições para 10

autoscale_refresh_seconds
int

Com que frequência o dimensionador automático deve tentar dimensionar este webservice. A predefinição é 1.

autoscale_target_utilization
int

A utilização de destino (em percentagem em 100) que o dimensionador automático deve tentar manter para este webservice. A predefinição é 70.

collect_model_data

Quer ative ou não a recolha de dados de modelos para este Webservice. Predefinições para Falso.

auth_enabled

Quer ative ou não a autenticação para este Webservice. Predefinições para Verdadeiro.

cpu_cores

O número de núcleos de CPU a alocar para este Webservice. Pode ser um decimal. Predefinições para 0.1

memory_gb

A quantidade de memória (em GB) a alocar para este Webservice. Pode ser um decimal. Predefinições para 0,5

enable_app_insights

Quer ative ou não o registo do Application Insights para este Webservice. Predefinições para Falso

scoring_timeout_ms
int

Um tempo limite para impor chamadas de classificação para este webservice. A predefinição é 60000.

replica_max_concurrent_requests
int

O número máximo de pedidos simultâneos por réplica para permitir este Webservice. A predefinição é 1. Não altere esta definição do valor predefinido de 1, a menos que seja instruído pelo Suporte Técnico da Microsoft ou por um membro da equipa do Azure Machine Learning.

max_request_wait_time
int

A quantidade máxima de tempo que um pedido permanecerá na fila (em milissegundos) antes de devolver um erro 503. A predefinição é 500.

num_replicas
int

O número de contentores a alocar para este Webservice. Sem predefinição, se este parâmetro não estiver definido, o dimensionador automático está ativado por predefinição.

primary_key
str

Uma chave de autenticação primária a utilizar para este webservice.

secondary_key
str

Uma chave de autenticação secundária a utilizar para este webservice.

azureml.core.webservice.AksServiceDeploymentConfiguration.tags

Dicionário de etiquetas de valor chave para fornecer este Webservice.

azureml.core.webservice.AksServiceDeploymentConfiguration.properties

Dicionário de propriedades de valor chave para fornecer este Webservice. Estas propriedades não podem ser alteradas após a implementação, no entanto, podem ser adicionados novos pares de valores chave.

azureml.core.webservice.AksServiceDeploymentConfiguration.description

Uma descrição para fornecer este serviço Web.

gpu_cores
int

O número de núcleos de GPU a alocar para este Webservice. A predefinição é 0.

period_seconds
int

Com que frequência (em segundos) executar a sonda liveness. Predefinição para 10 segundos. O valor mínimo é 1.

initial_delay_seconds
int

Número de segundos após o início do contentor antes de as sondas liveness serem iniciadas. A predefinição é 310.

timeout_seconds
int

Número de segundos após o qual a sonda de liveness excede o limite de tempo. A predefinição é de 2 segundos. O valor mínimo é 1.

success_threshold
int

Êxitos mínimos consecutivos para que a sonda liveness seja considerada com êxito depois de ter falhado. A predefinição é 1. O valor mínimo é 1.

failure_threshold
int

Quando um Pod é iniciado e a sonda liveness falha, o Kubernetes tenta horas failureThreshold antes de desistir. A predefinição é 3. O valor mínimo é 1.

azureml.core.webservice.AksServiceDeploymentConfiguration.namespace

O espaço de nomes do Kubernetes no qual pretende implementar este Webservice: até 63 carateres alfanuméricos em minúsculas ('a'-'z', '0'-'9') e carateres de hífen ('-'). Os primeiros e últimos carateres não podem ser hífenes.

token_auth_enabled

Quer ative ou não a autenticação do Azure Active Directory para este webservice. Se esta opção estiver ativada, os utilizadores podem aceder a este webservice ao obter o token de acesso com as respetivas credenciais do Azure Active Directory. Predefinições para Falso.

Métodos

print_deploy_configuration

Imprima a configuração da implementação.

validate_configuration

Verifique se os valores de configuração especificados são válidos.

Irá gerar um WebserviceException se a validação falhar.

print_deploy_configuration

Imprima a configuração da implementação.

print_deploy_configuration()

validate_configuration

Verifique se os valores de configuração especificados são válidos.

Irá gerar um WebserviceException se a validação falhar.

validate_configuration()

Exceções

Tipo Description