Partilhar via


AksEndpointDeploymentConfiguration Classe

Nota

Esta é uma classe experimental e pode mudar em qualquer altura. Para obter mais informações, veja https://aka.ms/azuremlexperimental.

Representa as informações de configuração de implementação de um serviço implementado no Azure Kubernetes Service.

Crie um objeto AksEndpointDeploymentConfiguration com o deploy_configuration método da AksEndpoint classe.

Inicialize um objeto de configuração para implementar um Ponto Final num destino de computação do AKS.

Herança
AksEndpointDeploymentConfiguration

Construtor

AksEndpointDeploymentConfiguration(autoscale_enabled, autoscale_min_replicas, autoscale_max_replicas, autoscale_refresh_seconds, autoscale_target_utilization, collect_model_data, auth_enabled, cpu_cores, memory_gb, enable_app_insights, scoring_timeout_ms, replica_max_concurrent_requests, max_request_wait_time, num_replicas, primary_key, secondary_key, tags, properties, description, gpu_cores, period_seconds, initial_delay_seconds, timeout_seconds, success_threshold, failure_threshold, namespace, token_auth_enabled, version_name, traffic_percentile, compute_target_name, cpu_cores_limit, memory_gb_limit)

Parâmetros

Name Description
autoscale_enabled
Necessário

Se pretende ativar ou não o dimensionamento automático para este webservice. A predefinição é Verdadeiro se num_replicas for Nenhum.

autoscale_min_replicas
Necessário
int

O número mínimo de contentores a utilizar ao dimensionar automaticamente este webservice. A predefinição é 1.

autoscale_max_replicas
Necessário
int

O número máximo de contentores a utilizar ao dimensionar automaticamente este Webservice. A predefinição é 10.

autoscale_refresh_seconds
Necessário
int

Com que frequência o dimensionador automático deve tentar dimensionar este webservice. A predefinição é 1.

autoscale_target_utilization
Necessário
int

A utilização de destino (em percentagem de 100) que o dimensionador automático deve tentar manter para este webservice. A predefinição é 70.

collect_model_data
Necessário

Se pretende ativar ou não a recolha de dados de modelos para este Webservice. A predefinição é Falso.

auth_enabled
Necessário

Se pretende ativar ou não a autenticação para este webservice. A predefinição é Verdadeiro.

cpu_cores
Necessário

O número de núcleos de cpu a alocar para este Webservice. Pode ser um decimal. Predefinições para 0.1

memory_gb
Necessário

A quantidade de memória (em GB) a alocar para este webservice. Pode ser um decimal. Predefinições para 0,5

enable_app_insights
Necessário

Se pretende ativar ou não o registo do Application Insights para este Webservice. A predefinição é Falso.

scoring_timeout_ms
Necessário
int

Um tempo limite para impor chamadas de classificação para este webservice. A predefinição é 60000.

replica_max_concurrent_requests
Necessário
int

O número máximo de pedidos simultâneos por réplica para permitir este serviço Web. A predefinição é 1. Não altere esta definição do valor predefinido de 1, a menos que seja instruído pelo Suporte Técnico da Microsoft ou por um membro da equipa do Azure Machine Learning.

max_request_wait_time
Necessário
int

A quantidade máxima de tempo que um pedido permanecerá na fila (em milissegundos) antes de devolver um erro 503. A predefinição é 500.

num_replicas
Necessário
int

O número de contentores a alocar para este Webservice. Sem predefinição, se este parâmetro não estiver definido, o dimensionador automático está ativado por predefinição.

primary_key
Necessário
str

Uma chave de autenticação primária a utilizar para este webservice

secondary_key
Necessário
str

Uma chave de autenticação secundária a utilizar para este webservice

tags
Necessário

Dicionário de etiquetas de valor de chave para dar este Webservice

properties
Necessário

Dicionário de propriedades de valor de chave para dar este Webservice. Estas propriedades não podem ser alteradas após a implementação, no entanto, podem ser adicionados novos pares de valores chave.

description
Necessário
str

Uma descrição para dar a este Webservice.

gpu_cores
Necessário
int

O número de núcleos de GPU a alocar para este Webservice. A predefinição é 0.

period_seconds
Necessário
int

Com que frequência (em segundos) executar a sonda liveness. Predefinição para 10 segundos. O valor mínimo é 1.

initial_delay_seconds
Necessário
int

O número de segundos após o início do contentor antes de as pesquisas liveness serem iniciadas. A predefinição é 310.

timeout_seconds
Necessário
int

O número de segundos após o qual a sonda liveness excede o tempo limite. A predefinição é de 2 segundos. O valor mínimo é 1.

success_threshold
Necessário
int

Os êxitos mínimos consecutivos para a sonda liveness serem considerados bem-sucedidos depois de terem falhado. A predefinição é 1. O valor mínimo é 1.

failure_threshold
Necessário
int

Quando um Pod é iniciado e a sonda liveness falha, o Kubernetes tenta failureThreshold horas antes de desistir. A predefinição é 3. O valor mínimo é 1.

namespace
Necessário
str

O espaço de nomes do Kubernetes no qual pretende implementar este Webservice: até 63 carateres alfanuméricos em minúsculas ('a'-'z', '0'-'9') e hífen ('-'). O primeiro e o último carateres não podem ser hífenes.

token_auth_enabled
Necessário

Se pretende ativar ou não a autenticação do Azure Active Directory para este serviço Web. Se esta opção estiver ativada, os utilizadores podem aceder a este webservice ao obter o token de acesso com as respetivas credenciais do Azure Active Directory. A predefinição é Falso.

version_name
Necessário
str

O nome da versão num ponto final.

traffic_percentile
Necessário

A quantidade de tráfego que a versão recebe num ponto final.

cpu_cores_limit
Necessário

O número máximo de núcleos de cpu que este Webservice tem permissão para utilizar. Pode ser um decimal.

memory_gb_limit
Necessário

A quantidade máxima de memória (em GB) que este Webservice tem permissão para utilizar. Pode ser um decimal.

autoscale_enabled
Necessário

Se pretende ativar ou não o dimensionamento automático para este webservice. A predefinição é Verdadeiro se num_replicas for Nenhum.

autoscale_min_replicas
Necessário
int

O número mínimo de contentores a utilizar ao dimensionar automaticamente este webservice. A predefinição é 1.

autoscale_max_replicas
Necessário
int

O número máximo de contentores a utilizar ao dimensionar automaticamente este Webservice. A predefinição é 10.

autoscale_refresh_seconds
Necessário
int

Com que frequência o dimensionador automático deve tentar dimensionar este webservice. A predefinição é 1.

autoscale_target_utilization
Necessário
int

A utilização de destino (em percentagem de 100) que o dimensionador automático deve tentar manter para este webservice. A predefinição é 70.

collect_model_data
Necessário

Se pretende ativar ou não a recolha de dados de modelos para este Webservice. A predefinição é Falso.

auth_enabled
Necessário

Se pretende ativar ou não a autenticação para este webservice. A predefinição é Verdadeiro.

cpu_cores
Necessário

O número de núcleos de cpu a alocar para este Webservice. Pode ser um decimal. Predefinições para 0.1

memory_gb
Necessário

A quantidade de memória (em GB) a alocar para este Webservice. Pode ser um decimal. Predefinições para 0,5

enable_app_insights
Necessário

Quer ative ou não o registo do Application Insights para este Webservice. Predefinições para Falso.

scoring_timeout_ms
Necessário
int

Um tempo limite para impor chamadas de classificação para este webservice. A predefinição é 60000.

replica_max_concurrent_requests
Necessário
int

O número máximo de pedidos simultâneos por réplica para permitir este Webservice. A predefinição é 1. Não altere esta definição do valor predefinido de 1, a menos que seja instruído pelo Suporte Técnico da Microsoft ou por um membro da equipa do Azure Machine Learning.

max_request_wait_time
Necessário
int

A quantidade máxima de tempo que um pedido permanecerá na fila (em milissegundos) antes de devolver um erro 503. A predefinição é 500.

num_replicas
Necessário
int

O número de contentores a alocar para este Webservice. Sem predefinição, se este parâmetro não estiver definido, o dimensionador automático está ativado por predefinição.

primary_key
Necessário
str

Uma chave de autenticação primária a utilizar para este webservice

secondary_key
Necessário
str

Uma chave de autenticação secundária a utilizar para este webservice

tags
Necessário

Dicionário de etiquetas de valor chave para fornecer este Webservice

properties
Necessário

Dicionário de propriedades de valor chave para fornecer este Webservice. Estas propriedades não podem ser alteradas após a implementação, no entanto, podem ser adicionados novos pares de valores chave.

description
Necessário
str

Uma descrição para fornecer este serviço Web.

gpu_cores
Necessário
int

O número de núcleos de GPU a alocar para este Webservice. A predefinição é 0.

period_seconds
Necessário
int

Com que frequência (em segundos) executar a sonda liveness. Predefinição para 10 segundos. O valor mínimo é 1.

initial_delay_seconds
Necessário
int

O número de segundos após o início do contentor antes de as sondas liveness serem iniciadas. A predefinição é 310.

timeout_seconds
Necessário
int

O número de segundos após o qual a sonda de liveness excede o limite de tempo. A predefinição é de 2 segundos. O valor mínimo é 1.

success_threshold
Necessário
int

Os êxitos mínimos consecutivos para a sonda de liveness serem considerados bem-sucedidos depois de terem falhado. A predefinição é 1. O valor mínimo é 1.

failure_threshold
Necessário
int

Quando um Pod é iniciado e a sonda liveness falha, o Kubernetes tenta horas failureThreshold antes de desistir. A predefinição é 3. O valor mínimo é 1.

namespace
Necessário
str

O espaço de nomes do Kubernetes no qual pretende implementar este Webservice: até 63 carateres alfanuméricos em minúsculas ('a'-'z', '0'-'9') e carateres de hífen ('-'). Os primeiros e últimos carateres não podem ser hífenes.

token_auth_enabled
Necessário

Quer ative ou não a autenticação do Azure Active Directory para este webservice. Se esta opção estiver ativada, os utilizadores podem aceder a este webservice ao obter o token de acesso com as respetivas credenciais do Azure Active Directory. Predefinições para Falso.

version_name
Necessário
str

O nome da versão num ponto final.

traffic_percentile
Necessário

A quantidade de tráfego que a versão utiliza num ponto final.

compute_target_name
Necessário
str

O nome do destino de computação a implementar no

cpu_cores_limit
Necessário

O número máximo de núcleos de cpu que este Webservice pode utilizar. Pode ser um decimal.

memory_gb_limit
Necessário

A quantidade máxima de memória (em GB) que este Webservice pode utilizar. Pode ser um decimal.

Variáveis

Name Description
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.autoscale_enabled

Quer ative ou não o dimensionamento automático para este Webservice. A predefinição é Verdadeiro se num_replicas for Nenhuma.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.autoscale_min_replicas

O número mínimo de contentores a utilizar ao dimensionar automaticamente este Webservice. A predefinição é 1.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.autoscale_max_replicas

O número máximo de contentores a utilizar ao dimensionar automaticamente este Webservice. A predefinição é 10.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.autoscale_refresh_seconds

Com que frequência o dimensionador automático deve tentar dimensionar este webservice. A predefinição é 1.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.autoscale_target_utilization

A utilização de destino (em percentagem em 100) que o dimensionador automático deve tentar manter para este serviço Web. A predefinição é 70.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.collect_model_data

Quer ative ou não a recolha de dados de modelos para este Webservice. Predefinições para Falso.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.auth_enabled

Quer ative ou não a autenticação para este Webservice. Predefinições para Verdadeiro.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.cpu_cores

O número de núcleos de cpu a alocar para este Webservice. Pode ser um decimal. Predefinições para 0.1

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.memory_gb

A quantidade de memória (em GB) a alocar para este Webservice. Pode ser um decimal. Predefinições para 0,5

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.enable_app_insights

Quer ative ou não o registo do Application Insights para este Webservice. Predefinições para Falso.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.scoring_timeout_ms

Um tempo limite para impor chamadas de classificação para este webservice. A predefinição é 60000.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.replica_max_concurrent_requests

O número máximo de pedidos simultâneos por réplica para permitir este Webservice. A predefinição é 1. Não altere esta definição do valor predefinido de 1, a menos que seja instruído pelo Suporte Técnico da Microsoft ou por um membro da equipa do Azure Machine Learning.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.max_request_wait_time

A quantidade máxima de tempo que um pedido permanecerá na fila (em milissegundos) antes de devolver um erro 503. A predefinição é 500.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.num_replicas

O número de contentores a alocar para este Webservice. Sem predefinição, se este parâmetro não estiver definido, o dimensionador automático está ativado por predefinição.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.primary_key

Uma chave de autenticação primária a utilizar para este webservice

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.secondary_key

Uma chave de autenticação secundária a utilizar para este webservice

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.tags

Dicionário de etiquetas de valor chave para fornecer este Webservice

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.properties

Dicionário de propriedades de valor chave para fornecer este Webservice. Estas propriedades não podem ser alteradas após a implementação, no entanto, podem ser adicionados novos pares de valores chave.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.description

Uma descrição para fornecer este serviço Web.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.gpu_cores

O número de núcleos de GPU a alocar para este Webservice. A predefinição é 0.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.period_seconds

Com que frequência (em segundos) executar a sonda liveness. Predefinição para 10 segundos. O valor mínimo é 1.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.initial_delay_seconds

O número de segundos após o início do contentor antes de as sondas liveness serem iniciadas. A predefinição é 310.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.timeout_seconds

O número de segundos após o qual a sonda de liveness excede o limite de tempo. A predefinição é de 2 segundos. O valor mínimo é 1.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.success_threshold

Os êxitos mínimos consecutivos para a sonda de liveness serem considerados bem-sucedidos depois de terem falhado. A predefinição é 1. O valor mínimo é 1.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.failure_threshold

Quando um Pod é iniciado e a sonda liveness falha, o Kubernetes tenta horas failureThreshold antes de desistir. A predefinição é 3. O valor mínimo é 1.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.namespace

O espaço de nomes do Kubernetes no qual pretende implementar este Webservice: até 63 carateres alfanuméricos em minúsculas ('a'-'z', '0'-'9') e carateres de hífen ('-'). Os primeiros e últimos carateres não podem ser hífenes.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.token_auth_enabled

Quer ative ou não a autenticação do Azure Active Directory para este webservice. Se esta opção estiver ativada, os utilizadores podem aceder a este webservice ao obter o token de acesso com as respetivas credenciais do Azure Active Directory. Predefinições para Falso.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.version_name

O nome da versão num ponto final.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.traffic_percentile

A quantidade de tráfego que a versão utiliza num ponto final.

Métodos

validate_endpoint_configuration

Verifique se os valores de configuração especificados são válidos.

Irá gerar um WebserviceException se a validação falhar.

validate_endpoint_configuration

Verifique se os valores de configuração especificados são válidos.

Irá gerar um WebserviceException se a validação falhar.

validate_endpoint_configuration()

Exceções

Tipo Description