AksEndpointDeploymentConfiguration 클래스
참고
이는 실험적인 클래스이며 언제든지 변경될 수 있습니다. 자세한 내용은 https://aka.ms/azuremlexperimental을 참조하세요.
Azure Kubernetes Service에 배포된 서비스에 대한 배포 구성 정보를 나타냅니다.
AksEndpoint 클래스의 deploy_configuration
메서드를 사용하여 AksEndpointDeploymentConfiguration 개체를 만듭니다.
AKS 컴퓨팅 대상에 엔드포인트를 배포하기 위한 구성 개체를 초기화합니다.
- 상속
-
AksEndpointDeploymentConfiguration
생성자
AksEndpointDeploymentConfiguration(autoscale_enabled, autoscale_min_replicas, autoscale_max_replicas, autoscale_refresh_seconds, autoscale_target_utilization, collect_model_data, auth_enabled, cpu_cores, memory_gb, enable_app_insights, scoring_timeout_ms, replica_max_concurrent_requests, max_request_wait_time, num_replicas, primary_key, secondary_key, tags, properties, description, gpu_cores, period_seconds, initial_delay_seconds, timeout_seconds, success_threshold, failure_threshold, namespace, token_auth_enabled, version_name, traffic_percentile, compute_target_name, cpu_cores_limit, memory_gb_limit)
매개 변수
Name | Description |
---|---|
autoscale_enabled
필수
|
이 Webservice에 자동 스케일링을 사용할지 여부를 나타냅니다.
|
autoscale_min_replicas
필수
|
이 Webservice를 자동 스케일링할 때 사용할 최소 컨테이너 수입니다. 기본값은 1입니다. |
autoscale_max_replicas
필수
|
이 Webservice를 자동 스케일링할 때 사용할 최대 컨테이너 수입니다. 기본값은 10입니다. |
autoscale_refresh_seconds
필수
|
자동 스케일러가 이 Webservice를 스케일링하려고 시도하는 빈도입니다. 기본값은 1입니다. |
autoscale_target_utilization
필수
|
자동 스케일러가 이 Webservice에 대해 유지해야 하는 목표 사용률(백분율)입니다. 기본값은 70입니다. |
collect_model_data
필수
|
이 Webservice에 모델 데이터 컬렉션을 사용할지 여부를 나타냅니다. 기본값은 False입니다. |
auth_enabled
필수
|
이 Webservice에 인증을 사용할지 여부를 나타냅니다. 기본값은 True입니다. |
cpu_cores
필수
|
이 Webservice에 할당할 CPU 코어 수입니다. 10진수일 수 있습니다. 기본값은 0.1입니다. |
memory_gb
필수
|
이 Webservice에 할당할 메모리 양(GB)입니다. 10진수일 수 있습니다. 기본값은 0.5입니다. |
enable_app_insights
필수
|
이 Webservice에 Application Insights 로깅을 사용할지 여부를 나타냅니다. 기본값은 False입니다. |
scoring_timeout_ms
필수
|
이 Webservice에 대한 채점 호출을 적용하는 시간 제한입니다. 기본값은 60000입니다. |
replica_max_concurrent_requests
필수
|
이 Webservice에 허용할 복제본당 최대 동시 요청 수입니다. 기본값은 1입니다. Microsoft 기술 지원 또는 Azure Machine Learning 팀의 멤버가 지시하지 않는 한 이 설정을 기본값 1에서 변경하지 마세요. |
max_request_wait_time
필수
|
요청이 큐에 유지되는 최대 시간(밀리초)입니다. 이 시간이 경과하면 503 오류가 반환됩니다. 기본값은 500입니다. |
num_replicas
필수
|
이 Webservice에 할당할 컨테이너 수입니다. 기본값은 없습니다. 이 매개 변수를 설정하지 않으면 기본적으로 자동 스케일러가 사용됩니다. |
primary_key
필수
|
이 웹 서비스에 사용할 기본 인증 키입니다. |
secondary_key
필수
|
이 웹 서비스에 사용할 보조 인증 키입니다. |
tags
필수
|
이 Webservice에 제공할 키 값 태그의 사전입니다. |
properties
필수
|
이 Webservice에 제공할 키 값 속성의 사전입니다. 배포 후에는 이러한 속성을 변경할 수 없지만, 새 키 값 쌍을 추가할 수 있습니다. |
description
필수
|
이 Webservice에 제공할 설명입니다. |
gpu_cores
필수
|
이 Webservice에 할당할 GPU 코어 수입니다. 기본값은 0입니다. |
period_seconds
필수
|
활동성 프로브를 수행하는 빈도(초)입니다. 기본값은 10초입니다. 최솟값은 1입니다. |
initial_delay_seconds
필수
|
컨테이너가 시작된 후 활동성 프로브가 시작되기 전까지의 시간(초)입니다. 기본값은 310입니다. |
timeout_seconds
필수
|
이 시간(초)이 경과하면 활동성 프로브가 시간 초과됩니다. 기본값은 2초입니다. 최솟값은 1입니다. |
success_threshold
필수
|
활동성 프로브가 실패한 후 성공한 것으로 간주되는 최소 연속 성공 횟수입니다. 기본값은 1입니다. 최솟값은 1입니다. |
failure_threshold
필수
|
Pod가 시작되고 활동성 프로브가 실패하면 Kubernetes에서 포기하기 전에 |
namespace
필수
|
이 Webservice를 배포할 Kubernetes 네임스페이스입니다. 최대 63개의 소문자 영숫자('a'-'z', '0'-'9') 및 하이픈('-') 문자입니다. 첫 번째 문자와 마지막 문자는 하이픈이면 안 됩니다. |
token_auth_enabled
필수
|
이 Webservice에 대해 Azure Active Directory 인증을 사용하도록 설정할지 여부를 나타냅니다. 사용하도록 설정하면 사용자는 Azure Active Directory 자격 증명을 사용하여 액세스 토큰을 가져와 이 Webservice에 액세스할 수 있습니다. 기본값은 False입니다. |
version_name
필수
|
엔드포인트의 버전 이름입니다. |
traffic_percentile
필수
|
버전이 엔드포인트에서 차지하는 트래픽 양입니다. |
cpu_cores_limit
필수
|
이 Webservice에서 사용할 수 있는 최대 CPU 코어 수입니다. 10진수일 수 있습니다. |
memory_gb_limit
필수
|
이 Webservice에서 사용할 수 있는 최대 메모리 양(GB)입니다. 10진수일 수 있습니다. |
autoscale_enabled
필수
|
이 Webservice에 자동 스케일링을 사용할지 여부를 나타냅니다.
|
autoscale_min_replicas
필수
|
이 Webservice를 자동 스케일링할 때 사용할 최소 컨테이너 수입니다. 기본값은 1입니다. |
autoscale_max_replicas
필수
|
이 Webservice를 자동 스케일링할 때 사용할 최대 컨테이너 수입니다. 기본값은 10입니다. |
autoscale_refresh_seconds
필수
|
자동 스케일러가 이 Webservice를 스케일링하려고 시도하는 빈도입니다. 기본값은 1입니다. |
autoscale_target_utilization
필수
|
자동 스케일러가 이 Webservice에 대해 유지해야 하는 목표 사용률(백분율)입니다. 기본값은 70입니다. |
collect_model_data
필수
|
이 Webservice에 모델 데이터 컬렉션을 사용할지 여부를 나타냅니다. 기본값은 False입니다. |
auth_enabled
필수
|
이 Webservice에 인증을 사용할지 여부를 나타냅니다. 기본값은 True입니다. |
cpu_cores
필수
|
이 Webservice에 할당할 CPU 코어 수입니다. 10진수일 수 있습니다. 기본값은 0.1입니다. |
memory_gb
필수
|
이 Webservice에 할당할 메모리 양(GB)입니다. 10진수일 수 있습니다. 기본값은 0.5입니다. |
enable_app_insights
필수
|
이 Webservice에 Application Insights 로깅을 사용할지 여부를 나타냅니다. 기본값은 False입니다. |
scoring_timeout_ms
필수
|
이 Webservice에 대한 채점 호출을 적용하는 시간 제한입니다. 기본값은 60000입니다. |
replica_max_concurrent_requests
필수
|
이 Webservice에 허용할 복제본당 최대 동시 요청 수입니다. 기본값은 1입니다. Microsoft 기술 지원 또는 Azure Machine Learning 팀의 멤버가 지시하지 않는 한 이 설정을 기본값 1에서 변경하지 마세요. |
max_request_wait_time
필수
|
요청이 큐에 유지되는 최대 시간(밀리초)입니다. 이 시간이 경과하면 503 오류가 반환됩니다. 기본값은 500입니다. |
num_replicas
필수
|
이 Webservice에 할당할 컨테이너 수입니다. 기본값은 없습니다. 이 매개 변수를 설정하지 않으면 기본적으로 자동 스케일러가 사용됩니다. |
primary_key
필수
|
이 웹 서비스에 사용할 기본 인증 키입니다. |
secondary_key
필수
|
이 웹 서비스에 사용할 보조 인증 키입니다. |
tags
필수
|
이 Webservice에 제공할 키 값 태그의 사전입니다. |
properties
필수
|
이 Webservice에 제공할 키 값 속성의 사전입니다. 배포 후에는 이러한 속성을 변경할 수 없지만, 새 키 값 쌍을 추가할 수 있습니다. |
description
필수
|
이 Webservice에 제공할 설명입니다. |
gpu_cores
필수
|
이 Webservice에 할당할 GPU 코어 수입니다. 기본값은 0입니다. |
period_seconds
필수
|
활동성 프로브를 수행하는 빈도(초)입니다. 기본값은 10초입니다. 최솟값은 1입니다. |
initial_delay_seconds
필수
|
컨테이너가 시작된 후 활동성 프로브가 시작되기 전까지의 시간(초)입니다. 기본값은 310입니다. |
timeout_seconds
필수
|
이 시간(초)이 경과하면 활동성 프로브가 시간 초과됩니다. 기본값은 2초입니다. 최솟값은 1입니다. |
success_threshold
필수
|
활동성 프로브가 실패한 후 성공한 것으로 간주되는 최소 연속 성공 횟수입니다. 기본값은 1입니다. 최솟값은 1입니다. |
failure_threshold
필수
|
Pod가 시작되고 활동성 프로브가 실패하면 Kubernetes에서 포기하기 전에 |
namespace
필수
|
이 Webservice를 배포할 Kubernetes 네임스페이스입니다. 최대 63개의 소문자 영숫자('a'-'z', '0'-'9') 및 하이픈('-') 문자입니다. 첫 번째 문자와 마지막 문자는 하이픈이면 안 됩니다. |
token_auth_enabled
필수
|
이 Webservice에 대해 Azure Active Directory 인증을 사용하도록 설정할지 여부를 나타냅니다. 사용하도록 설정하면 사용자는 Azure Active Directory 자격 증명을 사용하여 액세스 토큰을 가져와 이 Webservice에 액세스할 수 있습니다. 기본값은 False입니다. |
version_name
필수
|
엔드포인트의 버전 이름입니다. |
traffic_percentile
필수
|
버전이 엔드포인트에서 차지하는 트래픽 양입니다. |
compute_target_name
필수
|
배포할 컴퓨팅 대상의 이름입니다. |
cpu_cores_limit
필수
|
이 Webservice에서 사용할 수 있는 최대 CPU 코어 수입니다. 10진수일 수 있습니다. |
memory_gb_limit
필수
|
이 Webservice에서 사용할 수 있는 최대 메모리 양(GB)입니다. 10진수일 수 있습니다. |
변수
Name | Description |
---|---|
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.autoscale_enabled
|
이 Webservice에 자동 스케일링을 사용할지 여부를 나타냅니다.
|
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.autoscale_min_replicas
|
이 Webservice를 자동 스케일링할 때 사용할 최소 컨테이너 수입니다. 기본값은 1입니다. |
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.autoscale_max_replicas
|
이 Webservice를 자동 스케일링할 때 사용할 최대 컨테이너 수입니다. 기본값은 10입니다. |
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.autoscale_refresh_seconds
|
자동 스케일러가 이 Webservice를 스케일링하려고 시도하는 빈도입니다. 기본값은 1입니다. |
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.autoscale_target_utilization
|
자동 스케일러가 이 Webservice에 대해 유지해야 하는 목표 사용률(백분율)입니다. 기본값은 70입니다. |
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.collect_model_data
|
이 Webservice에 모델 데이터 컬렉션을 사용할지 여부를 나타냅니다. 기본값은 False입니다. |
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.auth_enabled
|
이 Webservice에 인증을 사용할지 여부를 나타냅니다. 기본값은 True입니다. |
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.cpu_cores
|
이 Webservice에 할당할 CPU 코어 수입니다. 10진수일 수 있습니다. 기본값은 0.1입니다. |
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.memory_gb
|
이 Webservice에 할당할 메모리 양(GB)입니다. 10진수일 수 있습니다. 기본값은 0.5입니다. |
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.enable_app_insights
|
이 Webservice에 Application Insights 로깅을 사용할지 여부를 나타냅니다. 기본값은 False입니다. |
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.scoring_timeout_ms
|
이 Webservice에 대한 채점 호출을 적용하는 시간 제한입니다. 기본값은 60000입니다. |
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.replica_max_concurrent_requests
|
이 Webservice에 허용할 복제본당 최대 동시 요청 수입니다. 기본값은 1입니다. Microsoft 기술 지원 또는 Azure Machine Learning 팀의 멤버가 지시하지 않는 한 이 설정을 기본값 1에서 변경하지 마세요. |
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.max_request_wait_time
|
요청이 큐에 유지되는 최대 시간(밀리초)입니다. 이 시간이 경과하면 503 오류가 반환됩니다. 기본값은 500입니다. |
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.num_replicas
|
이 Webservice에 할당할 컨테이너 수입니다. 기본값은 없습니다. 이 매개 변수를 설정하지 않으면 기본적으로 자동 스케일러가 사용됩니다. |
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.primary_key
|
이 웹 서비스에 사용할 기본 인증 키입니다. |
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.secondary_key
|
이 웹 서비스에 사용할 보조 인증 키입니다. |
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.tags
|
이 Webservice에 제공할 키 값 태그의 사전입니다. |
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.properties
|
이 Webservice에 제공할 키 값 속성의 사전입니다. 배포 후에는 이러한 속성을 변경할 수 없지만, 새 키 값 쌍을 추가할 수 있습니다. |
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.description
|
이 Webservice에 제공할 설명입니다. |
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.gpu_cores
|
이 Webservice에 할당할 GPU 코어 수입니다. 기본값은 0입니다. |
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.period_seconds
|
활동성 프로브를 수행하는 빈도(초)입니다. 기본값은 10초입니다. 최솟값은 1입니다. |
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.initial_delay_seconds
|
컨테이너가 시작된 후 활동성 프로브가 시작되기 전까지의 시간(초)입니다. 기본값은 310입니다. |
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.timeout_seconds
|
이 시간(초)이 경과하면 활동성 프로브가 시간 초과됩니다. 기본값은 2초입니다. 최솟값은 1입니다. |
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.success_threshold
|
활동성 프로브가 실패한 후 성공한 것으로 간주되는 최소 연속 성공 횟수입니다. 기본값은 1입니다. 최솟값은 1입니다. |
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.failure_threshold
|
Pod가 시작되고 활동성 프로브가 실패하면 Kubernetes에서 포기하기 전에 |
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.namespace
|
이 Webservice를 배포할 Kubernetes 네임스페이스입니다. 최대 63개의 소문자 영숫자('a'-'z', '0'-'9') 및 하이픈('-') 문자입니다. 첫 번째 문자와 마지막 문자는 하이픈이면 안 됩니다. |
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.token_auth_enabled
|
이 Webservice에 대해 Azure Active Directory 인증을 사용하도록 설정할지 여부를 나타냅니다. 사용하도록 설정하면 사용자는 Azure Active Directory 자격 증명을 사용하여 액세스 토큰을 가져와 이 Webservice에 액세스할 수 있습니다. 기본값은 False입니다. |
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.version_name
|
엔드포인트의 버전 이름입니다. |
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.traffic_percentile
|
버전이 엔드포인트에서 차지하는 트래픽 양입니다. |
메서드
validate_endpoint_configuration |
지정된 구성 값이 유효한지 확인합니다. 유효성 검사에 실패하면 WebserviceException이 발생합니다. |
validate_endpoint_configuration
지정된 구성 값이 유효한지 확인합니다.
유효성 검사에 실패하면 WebserviceException이 발생합니다.
validate_endpoint_configuration()
예외
형식 | Description |
---|---|