AksEndpointDeploymentConfiguration Clase

Referencia

Nota

Se trata de una clase experimental y puede cambiar en cualquier momento. Consulte https://aka.ms/azuremlexperimental para más información.

Representa información de configuración de implementación para un servicio implementado en Azure Kubernetes Service.

Crea un objeto AksEndpointDeploymentConfiguration mediante el método deploy_configuration de la clase AksEndpoint.

Inicialice un objeto de configuración para implementar un punto de conexión en un destino de proceso de AKS.

Herencia: AksServiceDeploymentConfiguration

AksEndpointDeploymentConfiguration

Constructor

AksEndpointDeploymentConfiguration(autoscale_enabled, autoscale_min_replicas, autoscale_max_replicas, autoscale_refresh_seconds, autoscale_target_utilization, collect_model_data, auth_enabled, cpu_cores, memory_gb, enable_app_insights, scoring_timeout_ms, replica_max_concurrent_requests, max_request_wait_time, num_replicas, primary_key, secondary_key, tags, properties, description, gpu_cores, period_seconds, initial_delay_seconds, timeout_seconds, success_threshold, failure_threshold, namespace, token_auth_enabled, version_name, traffic_percentile, compute_target_name, cpu_cores_limit, memory_gb_limit)

Parámetros

Nombre	Description
autoscale_enabled Requerido	bool Indica si se debe habilitar o no la escalabilidad automática para este Webservice. El valor predeterminado es True si `num_replicas` es Ninguno.
autoscale_min_replicas Requerido	int Número mínimo de contenedores que se van a usar al escalar automáticamente este Webservice. De manera predeterminada, su valor es 1.
autoscale_max_replicas Requerido	int Número máximo de contenedores que se van a usar al escalar automáticamente este Webservice. El valor predeterminado es 10.
autoscale_refresh_seconds Requerido	int Frecuencia con la que el escalador automático debe intentar escalar este Webservice. De manera predeterminada, su valor es 1.
autoscale_target_utilization Requerido	int Uso objetivo (en un porcentaje de 100) que el escalador automático debe intentar mantener para este Webservice. El valor predeterminado es 70.
collect_model_data Requerido	bool Indica si se debe habilitar o no la recopilación de datos del modelo para este Webservice. El valor predeterminado es False.
auth_enabled Requerido	bool Indica si se debe habilitar o no la autenticación para este servicio web. El valor predeterminado es True.
cpu_cores Requerido	float Número de núcleos de CPU que se asignarán a este Webservice. Puede ser un decimal. El valor predeterminado es 0,1.
memory_gb Requerido	float Cantidad de memoria (en GB) que se va a asignar a este Webservice. Puede ser un decimal. El valor predeterminado es 0,5.
enable_app_insights Requerido	bool Indica si se debe habilitar o no el registro de Application Insights para este Webservice. El valor predeterminado es False.
scoring_timeout_ms Requerido	int Tiempo de espera para aplicar a las llamadas de puntuación a este Webservice. El valor predeterminado es 60 000.
replica_max_concurrent_requests Requerido	int Número máximo de solicitudes simultáneas por réplica que se permitirán para este Webservice. De manera predeterminada, su valor es 1. No cambie este valor a menos que se lo indique el soporte técnico de Microsoft o un miembro del equipo de Azure Machine Learning.
max_request_wait_time Requerido	int Cantidad máxima de tiempo que permanecerá una solicitud en la cola (en milisegundos) antes de devolver un error 503. El valor predeterminado es 500.
num_replicas Requerido	int Número de contenedores que se asignarán a este Webservice. No tiene un valor predeterminado. Si no se establece este parámetro, el escalador automático se habilita de manera predeterminada.
primary_key Requerido	str Clave de autenticación principal que se usará para este servicio web
secondary_key Requerido	str Clave de autenticación secundaria que se usará para este servicio web
tags Requerido	dict[str, str] Diccionario de etiquetas de valor de clave para proporcionar este Webservice.
properties Requerido	dict[str, str] Diccionario de propiedades de valor de clave para proporcionar este Webservice. Estas propiedades no se pueden cambiar después de la implementación, pero se pueden agregar nuevos pares clave-valor.
description Requerido	str Descripción para proporcionar a este Webservice.
gpu_cores Requerido	int Número de núcleos de GPU que se asignará a este servicio web. El valor predeterminado es 0.
period_seconds Requerido	int Frecuencia (en segundos) en que se ejecutará el sondeo de ejecución. El valor predeterminado es de 10 segundos. El valor mínimo es 1.
initial_delay_seconds Requerido	int Número de segundos después de que se haya iniciado el contenedor antes de que se inicien los sondeos de ejecución. El valor predeterminado es 310.
timeout_seconds Requerido	int Número de segundos tras los cuales el sondeo de ejecución agota el tiempo de espera. El valor predeterminado es de 2 segundos. El valor mínimo es 1.
success_threshold Requerido	int Número mínimo de valores correctos consecutivos para que el sondeo de ejecución se considere correcto después de que se haya producido un error. De manera predeterminada, su valor es 1. El valor mínimo es 1.
failure_threshold Requerido	int Cuando se inicie un pod y se produzca un error en el sondeo de ejecución, Kubernetes probará `failureThreshold` veces antes de abandonar. El valor predeterminado es 3. El valor mínimo es 1.
namespace Requerido	str El espacio de nombres de Kubernetes en el que se va a implementar este Webservice: hasta 63 caracteres alfanuméricos en minúsculas ("a"-"z", "0"-"9") y guion ("-"). El primer y el último carácter no puede ser un guion.
token_auth_enabled Requerido	bool Si quiere habilitar o no la autenticación de Azure Active Directory para este Webservice. Si esta opción está habilitada, los usuarios pueden acceder a este Webservice mediante la captura de un token de acceso con sus credenciales de Azure Active Directory. El valor predeterminado es False.
version_name Requerido	str Nombre de la versión de un punto de conexión.
traffic_percentile Requerido	float Cantidad de tráfico que toma la versión en un punto de conexión.
cpu_cores_limit Requerido	float Número máximo de núcleos de CPU que puede usar este objeto Webservice. Puede ser un decimal.
memory_gb_limit Requerido	float Cantidad máxima de memoria (en GB) que puede usar este objeto Webservice. Puede ser un decimal.
autoscale_enabled Requerido	bool Indica si se debe habilitar o no la escalabilidad automática para este Webservice. El valor predeterminado es True si `num_replicas` es Ninguno.
autoscale_min_replicas Requerido	int Número mínimo de contenedores que se van a usar al escalar automáticamente este Webservice. De manera predeterminada, su valor es 1.
autoscale_max_replicas Requerido	int Número máximo de contenedores que se van a usar al escalar automáticamente este Webservice. El valor predeterminado es 10.
autoscale_refresh_seconds Requerido	int Frecuencia con la que el escalador automático debe intentar escalar este Webservice. De manera predeterminada, su valor es 1.
autoscale_target_utilization Requerido	int Uso objetivo (en un porcentaje de 100) que el escalador automático debe intentar mantener para este Webservice. El valor predeterminado es 70.
collect_model_data Requerido	bool Indica si se debe habilitar o no la recopilación de datos del modelo para este Webservice. El valor predeterminado es False.
auth_enabled Requerido	bool Indica si se debe habilitar o no la autenticación para este servicio web. El valor predeterminado es True.
cpu_cores Requerido	float Número de núcleos de CPU que se asignarán a este Webservice. Puede ser un decimal. El valor predeterminado es 0,1.
memory_gb Requerido	float Cantidad de memoria (en GB) que se va a asignar a este Webservice. Puede ser un decimal. El valor predeterminado es 0,5.
enable_app_insights Requerido	bool Indica si se debe habilitar o no el registro de Application Insights para este Webservice. El valor predeterminado es False.
scoring_timeout_ms Requerido	int Tiempo de espera para aplicar a las llamadas de puntuación a este Webservice. El valor predeterminado es 60 000.
replica_max_concurrent_requests Requerido	int Número máximo de solicitudes simultáneas por réplica que se permitirán para este Webservice. De manera predeterminada, su valor es 1. No cambie este valor a menos que se lo indique el soporte técnico de Microsoft o un miembro del equipo de Azure Machine Learning.
max_request_wait_time Requerido	int Cantidad máxima de tiempo que permanecerá una solicitud en la cola (en milisegundos) antes de devolver un error 503. El valor predeterminado es 500.
num_replicas Requerido	int Número de contenedores que se asignarán a este Webservice. No tiene un valor predeterminado. Si no se establece este parámetro, el escalador automático se habilita de manera predeterminada.
primary_key Requerido	str Clave de autenticación principal que se usará para este servicio web
secondary_key Requerido	str Clave de autenticación secundaria que se usará para este servicio web
tags Requerido	dict[str, str] Diccionario de etiquetas de valor de clave para proporcionar este Webservice.
properties Requerido	dict[str, str] Diccionario de propiedades de valor de clave para proporcionar este Webservice. Estas propiedades no se pueden cambiar después de la implementación, pero se pueden agregar nuevos pares clave-valor.
description Requerido	str Descripción para proporcionar a este Webservice.
gpu_cores Requerido	int Número de núcleos de GPU que se asignará a este servicio web. El valor predeterminado es 0.
period_seconds Requerido	int Frecuencia (en segundos) en que se ejecutará el sondeo de ejecución. El valor predeterminado es de 10 segundos. El valor mínimo es 1.
initial_delay_seconds Requerido	int Número de segundos después de que se haya iniciado el contenedor antes de que se inicien los sondeos de ejecución. El valor predeterminado es 310.
timeout_seconds Requerido	int Número de segundos tras los cuales el sondeo de ejecución agota el tiempo de espera. El valor predeterminado es de 2 segundos. El valor mínimo es 1.
success_threshold Requerido	int Número mínimo de valores correctos consecutivos para que el sondeo de ejecución se considere correcto después de que se haya producido un error. De manera predeterminada, su valor es 1. El valor mínimo es 1.
failure_threshold Requerido	int Cuando se inicie un pod y se produzca un error en el sondeo de ejecución, Kubernetes probará `failureThreshold` veces antes de abandonar. El valor predeterminado es 3. El valor mínimo es 1.
namespace Requerido	str El espacio de nombres de Kubernetes en el que se va a implementar este Webservice: hasta 63 caracteres alfanuméricos en minúsculas ("a"-"z", "0"-"9") y guion ("-"). El primer y el último carácter no puede ser un guion.
token_auth_enabled Requerido	bool Si quiere habilitar o no la autenticación de Azure Active Directory para este Webservice. Si esta opción está habilitada, los usuarios pueden acceder a este Webservice mediante la captura de un token de acceso con sus credenciales de Azure Active Directory. El valor predeterminado es False.
version_name Requerido	str Nombre de la versión de un punto de conexión.
traffic_percentile Requerido	float Cantidad de tráfico que toma la versión en un punto de conexión.
compute_target_name Requerido	str Nombre del destino de proceso en el que se implementará.
cpu_cores_limit Requerido	float Número máximo de núcleos de CPU que puede usar este servicio web. Puede ser un decimal.
memory_gb_limit Requerido	float Cantidad máxima de memoria (en GB) que puede usar este objeto Webservice. Puede ser un decimal.

Variables

Nombre	Description
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.autoscale_enabled	Indica si se debe habilitar o no la escalabilidad automática para este Webservice. El valor predeterminado es True si `num_replicas` es Ninguno.
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.autoscale_min_replicas	Número mínimo de contenedores que se van a usar al escalar automáticamente este Webservice. De manera predeterminada, su valor es 1.
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.autoscale_max_replicas	Número máximo de contenedores que se van a usar al escalar automáticamente este Webservice. El valor predeterminado es 10.
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.autoscale_refresh_seconds	Frecuencia con la que el escalador automático debe intentar escalar este Webservice. De manera predeterminada, su valor es 1.
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.autoscale_target_utilization	Uso objetivo (en un porcentaje de 100) que el escalador automático debe intentar mantener para este Webservice. El valor predeterminado es 70.
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.collect_model_data	Indica si se debe habilitar o no la recopilación de datos del modelo para este Webservice. El valor predeterminado es False.
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.auth_enabled	Indica si se debe habilitar o no la autenticación para este servicio web. El valor predeterminado es True.
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.cpu_cores	Número de núcleos de CPU que se asignarán a este Webservice. Puede ser un decimal. El valor predeterminado es 0,1.
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.memory_gb	Cantidad de memoria (en GB) que se va a asignar a este Webservice. Puede ser un decimal. El valor predeterminado es 0,5.
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.enable_app_insights	Indica si se debe habilitar o no el registro de Application Insights para este Webservice. El valor predeterminado es False.
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.scoring_timeout_ms	Tiempo de espera para aplicar a las llamadas de puntuación a este Webservice. El valor predeterminado es 60 000.
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.replica_max_concurrent_requests	Número máximo de solicitudes simultáneas por réplica que se permitirán para este Webservice. De manera predeterminada, su valor es 1. No cambie este valor a menos que se lo indique el soporte técnico de Microsoft o un miembro del equipo de Azure Machine Learning.
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.max_request_wait_time	Cantidad máxima de tiempo que permanecerá una solicitud en la cola (en milisegundos) antes de devolver un error 503. El valor predeterminado es 500.
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.num_replicas	Número de contenedores que se asignarán a este Webservice. No tiene un valor predeterminado. Si no se establece este parámetro, el escalador automático se habilita de manera predeterminada.
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.primary_key	Clave de autenticación principal que se usará para este servicio web
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.secondary_key	Clave de autenticación secundaria que se usará para este servicio web
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.tags	Diccionario de etiquetas de valor de clave para proporcionar este Webservice.
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.properties	Diccionario de propiedades de valor de clave para proporcionar este Webservice. Estas propiedades no se pueden cambiar después de la implementación, pero se pueden agregar nuevos pares clave-valor.
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.description	Descripción para proporcionar a este Webservice.
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.gpu_cores	Número de núcleos de GPU que se asignará a este servicio web. El valor predeterminado es 0.
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.period_seconds	Frecuencia (en segundos) en que se ejecutará el sondeo de ejecución. El valor predeterminado es de 10 segundos. El valor mínimo es 1.
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.initial_delay_seconds	Número de segundos después de que se haya iniciado el contenedor antes de que se inicien los sondeos de ejecución. El valor predeterminado es 310.
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.timeout_seconds	Número de segundos tras los cuales el sondeo de ejecución agota el tiempo de espera. El valor predeterminado es de 2 segundos. El valor mínimo es 1.
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.success_threshold	Número mínimo de valores correctos consecutivos para que el sondeo de ejecución se considere correcto después de que se haya producido un error. De manera predeterminada, su valor es 1. El valor mínimo es 1.
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.failure_threshold	Cuando se inicie un pod y se produzca un error en el sondeo de ejecución, Kubernetes probará `failureThreshold` veces antes de abandonar. El valor predeterminado es 3. El valor mínimo es 1.
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.namespace	El espacio de nombres de Kubernetes en el que se va a implementar este Webservice: hasta 63 caracteres alfanuméricos en minúsculas ("a"-"z", "0"-"9") y guion ("-"). El primer y el último carácter no puede ser un guion.
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.token_auth_enabled	Si quiere habilitar o no la autenticación de Azure Active Directory para este Webservice. Si esta opción está habilitada, los usuarios pueden acceder a este Webservice mediante la captura de un token de acceso con sus credenciales de Azure Active Directory. El valor predeterminado es False.
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.version_name	Nombre de la versión de un punto de conexión.
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.traffic_percentile	Cantidad de tráfico que toma la versión en un punto de conexión.

Métodos

validate_endpoint_configuration

Comprueba que los valores de configuración especificados sean válidos.

Genera una excepción WebserviceException si se produce un error en la validación.

validate_endpoint_configuration

Comprueba que los valores de configuración especificados sean válidos.

Genera una excepción WebserviceException si se produce un error en la validación.

validate_endpoint_configuration()

Excepciones

Tipo	Description
WebserviceException

Compartir a través de

AksEndpointDeploymentConfiguration Clase

Constructor

Parámetros

Variables

Métodos

validate_endpoint_configuration

Excepciones

Comentarios

Recursos adicionales