AksEndpoint 클래스
참고
이는 실험적인 클래스이며 언제든지 변경될 수 있습니다. 자세한 내용은 https://aka.ms/azuremlexperimental을 참조하세요.
Azure Kubernetes Service에서 실행되는 동일한 엔드포인트 뒤에 있는 웹 서비스 버전 컬렉션을 나타냅니다.
AksWebservice는 단일 채점 엔드포인트가 있는 단일 서비스를 배포하는 반면, AksEndpoint 클래스를 사용하면 동일한 채점 엔드포인트 뒤에 여러 웹 서비스 버전을 배포할 수 있습니다. 각 웹 서비스 버전은 트래픽의 일정 비율을 제공하도록 구성할 수 있으므로 A/B 테스트 등을 위해 제어된 방식으로 모델을 배포할 수 있습니다. AksEndpoint를 사용하면 AksWebservice와 유사한 모델 개체에서 배포할 수 있습니다.
Webservice instance 초기화합니다.
Webservice 생성자는 제공된 작업 영역과 연결된 Webservice 개체의 클라우드 표현을 검색합니다. 검색된 Webservice 개체의 특정 형식에 해당하는 자식 클래스의 instance 반환합니다.
- 상속
-
AksEndpoint
생성자
AksEndpoint(workspace, name)
매개 변수
Name | Description |
---|---|
workspace
필수
|
검색할 Webservice 개체를 포함하는 작업 영역 개체입니다. |
name
필수
|
검색할 Webservice 개체의 이름입니다. |
변수
Name | Description |
---|---|
versions
|
버전 개체에 대한 버전 이름의 사전입니다. 이 엔드포인트의 일부로 배포된 모든 버전이 포함되어 있습니다. |
메서드
create_version |
제공된 속성을 사용하여 엔드포인트에 새 버전을 추가합니다. |
delete_version |
엔드포인트에서 버전을 삭제합니다. |
deploy_configuration |
AKS 컴퓨팅 대상에 배포하기 위한 구성 개체를 만듭니다. |
serialize |
이 Webservice를 JSON 직렬화 사전으로 변환합니다. |
update |
제공된 속성으로 엔드포인트를 업데이트합니다. None으로 남겨진 값은 이 엔드포인트에서 변경되지 않은 상태로 유지됩니다. |
update_version |
제공된 속성으로 엔드포인트의 기존 버전을 업데이트합니다. None으로 남겨진 값은 이 버전에서 변경되지 않은 상태로 유지됩니다. |
create_version
제공된 속성을 사용하여 엔드포인트에 새 버전을 추가합니다.
create_version(version_name, autoscale_enabled=None, autoscale_min_replicas=None, autoscale_max_replicas=None, autoscale_refresh_seconds=None, autoscale_target_utilization=None, collect_model_data=None, cpu_cores=None, memory_gb=None, scoring_timeout_ms=None, replica_max_concurrent_requests=None, max_request_wait_time=None, num_replicas=None, tags=None, properties=None, description=None, models=None, inference_config=None, gpu_cores=None, period_seconds=None, initial_delay_seconds=None, timeout_seconds=None, success_threshold=None, failure_threshold=None, traffic_percentile=None, is_default=None, is_control_version_type=None, cpu_cores_limit=None, memory_gb_limit=None)
매개 변수
Name | Description |
---|---|
version_name
필수
|
엔드포인트에 추가할 버전의 이름입니다. |
autoscale_enabled
|
엔드포인트에서 이 버전에 대한 자동 크기 조정을 사용할지 여부입니다.
Default value: None
|
autoscale_min_replicas
|
엔드포인트에서 이 버전을 자동 크기 조정할 때 사용할 최소 컨테이너 수입니다. 기본값은 1입니다. Default value: None
|
autoscale_max_replicas
|
엔드포인트에서 이 버전을 자동 크기 조정할 때 사용할 최대 컨테이너 수입니다. 기본값은 10입니다. Default value: None
|
autoscale_refresh_seconds
|
자동 크기 조정기가 엔드포인트에서 이 버전의 비율 크기 조정을 시도해야 하는 빈도입니다. 기본값은 1입니다. Default value: None
|
autoscale_target_utilization
|
자동 크기 조정기가 엔드포인트에서 이 버전에 대해 유지를 시도해야 하는 대상 사용률(백분율)입니다. 기본값은 70입니다. Default value: None
|
collect_model_data
|
엔드포인트에서 이 버전에 대한 모델 데이터 컬렉션을 사용할지 여부입니다. 기본값은 False입니다. Default value: None
|
cpu_cores
|
엔드포인트에서 이 버전에 할당할 CPU 코어 수입니다. 10진수일 수 있습니다. 기본값은 0.1입니다. Default value: None
|
memory_gb
|
엔드포인트에서 이 버전에 할당할 메모리 양(GB)입니다. 10진수일 수 있습니다. 기본값은 0.5입니다. Default value: None
|
scoring_timeout_ms
|
엔드포인트에서 이 버전에 대한 호출을 채점하기 위해 적용할 시간 제한입니다. 기본값은 60000입니다. Default value: None
|
replica_max_concurrent_requests
|
엔드포인트에서 이 버전을 허용하기 위한 복제본당 최대 동시 요청 수입니다. 기본값은 1입니다. Microsoft 기술 지원 또는 Azure Machine Learning 팀의 멤버가 지시하지 않는 한 이 설정을 기본값 1에서 변경하지 마세요. Default value: None
|
max_request_wait_time
|
요청이 큐에 유지되는 최대 시간(밀리초)입니다. 이 시간이 경과하면 503 오류가 반환됩니다. 기본값은 500입니다. Default value: None
|
num_replicas
|
엔드포인트에서 이 버전에 할당할 컨테이너 수입니다. 기본값은 없습니다. 이 매개 변수를 설정하지 않으면 기본적으로 자동 크기 조정기가 사용됩니다. Default value: None
|
tags
|
이 엔드포인트를 제공할 키 값 태그의 사전입니다. Default value: None
|
properties
|
이 엔드포인트를 제공할 키 값 속성의 사전입니다. 배포 후에는 이러한 속성을 변경할 수 없지만 새 키 값 쌍을 추가할 수 있습니다. Default value: None
|
description
|
이 엔드포인트에 제공할 설명입니다. Default value: None
|
models
|
업데이트된 서비스를 사용하여 패키징할 모델 개체 목록입니다. Default value: None
|
inference_config
|
필요한 모델 배포 속성을 제공하는 데 사용되는 InferenceConfig 개체입니다. Default value: None
|
gpu_cores
|
엔드포인트에서 이 버전에 할당할 GPU 코어 수입니다. 기본값은 0입니다. Default value: None
|
period_seconds
|
활동성 프로브를 수행하는 빈도(초)입니다. 기본값은 10초입니다. 최솟값은 1입니다. Default value: None
|
initial_delay_seconds
|
컨테이너가 시작된 후 활동성 프로브가 시작되기 전까지의 시간(초)입니다. 기본값은 310입니다. Default value: None
|
timeout_seconds
|
이 시간(초)이 경과하면 활동성 프로브가 시간 초과됩니다. 기본값은 2초입니다. 최솟값은 1입니다. Default value: None
|
success_threshold
|
활동성 프로브가 실패한 후 성공한 것으로 간주되는 최소 연속 성공 횟수입니다. 기본값은 1입니다. 최솟값은 1입니다. Default value: None
|
failure_threshold
|
Pod가 시작되고 활동성 프로브가 실패하면 Kubernetes에서 포기하기 전에 failureThreshold 시간을 시도합니다. 기본값은 3입니다. 최솟값은 1입니다. Default value: None
|
traffic_percentile
|
버전이 엔드포인트에서 차지하는 트래픽 양입니다. Default value: None
|
is_default
|
엔드포인트에서 이 버전을 기본 버전으로 사용할지 여부입니다. 기본값은 False입니다. Default value: None
|
is_control_version_type
|
엔드포인트에서 이 버전을 컨트롤 버전으로 만들지 여부입니다. 기본값은 False입니다. Default value: None
|
cpu_cores_limit
|
이 Webservice에서 사용할 수 있는 최대 CPU 코어 수입니다. 10진수일 수 있습니다. Default value: None
|
memory_gb_limit
|
이 Webservice에서 사용할 수 있는 최대 메모리 양(GB)입니다. 10진수일 수 있습니다. Default value: None
|
예외
형식 | Description |
---|---|
delete_version
엔드포인트에서 버전을 삭제합니다.
delete_version(version_name)
매개 변수
Name | Description |
---|---|
version_name
필수
|
삭제할 엔드포인트의 버전 이름입니다. |
예외
형식 | Description |
---|---|
deploy_configuration
AKS 컴퓨팅 대상에 배포하기 위한 구성 개체를 만듭니다.
static deploy_configuration(autoscale_enabled=None, autoscale_min_replicas=None, autoscale_max_replicas=None, autoscale_refresh_seconds=None, autoscale_target_utilization=None, collect_model_data=None, auth_enabled=None, cpu_cores=None, memory_gb=None, enable_app_insights=None, scoring_timeout_ms=None, replica_max_concurrent_requests=None, max_request_wait_time=None, num_replicas=None, primary_key=None, secondary_key=None, tags=None, properties=None, description=None, gpu_cores=None, period_seconds=None, initial_delay_seconds=None, timeout_seconds=None, success_threshold=None, failure_threshold=None, namespace=None, token_auth_enabled=None, version_name=None, traffic_percentile=None, compute_target_name=None, cpu_cores_limit=None, memory_gb_limit=None)
매개 변수
Name | Description |
---|---|
autoscale_enabled
|
엔드포인트에서 이 버전에 대한 자동 크기 조정을 사용할지 여부입니다.
Default value: None
|
autoscale_min_replicas
|
엔드포인트에서 이 버전을 자동 크기 조정할 때 사용할 최소 컨테이너 수입니다. 기본값은 1입니다. Default value: None
|
autoscale_max_replicas
|
엔드포인트에서 이 버전을 자동 크기 조정할 때 사용할 최대 컨테이너 수입니다. 기본값은 10입니다. Default value: None
|
autoscale_refresh_seconds
|
자동 크기 조정기가 엔드포인트에서 이 버전의 비율 크기 조정을 시도해야 하는 빈도입니다. 기본값은 1입니다. Default value: None
|
autoscale_target_utilization
|
자동 크기 조정기가 엔드포인트에서 이 버전에 대해 유지를 시도해야 하는 대상 사용률(백분율)입니다. 기본값은 70입니다. Default value: None
|
collect_model_data
|
엔드포인트에서 이 버전에 대한 모델 데이터 컬렉션을 사용할지 여부입니다. 기본값은 False입니다. Default value: None
|
auth_enabled
|
엔드포인트에서 이 버전에 대한 키 인증을 사용할지 여부입니다. 기본값은 True입니다. Default value: None
|
cpu_cores
|
엔드포인트에서 이 버전에 할당할 CPU 코어 수입니다. 10진수일 수 있습니다. 기본값은 0.1입니다. Default value: None
|
memory_gb
|
엔드포인트에서 이 버전에 할당할 메모리 양(GB)입니다. 10진수일 수 있습니다. 기본값은 0.5입니다. Default value: None
|
enable_app_insights
|
엔드포인트에서 이 버전에 대한 ApplicationInsights 로깅을 사용할지 여부입니다. 기본값은 False입니다. Default value: None
|
scoring_timeout_ms
|
엔드포인트에서 이 버전에 대한 채점 호출을 적용하기 위한 시간 제한입니다. 기본값은 60000입니다. Default value: None
|
replica_max_concurrent_requests
|
엔드포인트에서 이 버전을 허용하기 위한 복제본당 최대 동시 요청 수입니다. 기본값은 1입니다. Microsoft 기술 지원 또는 Azure Machine Learning 팀의 멤버가 지시하지 않는 한 이 설정을 기본값 1에서 변경하지 마세요. Default value: None
|
max_request_wait_time
|
요청이 큐에 유지되는 최대 시간(밀리초)입니다. 이 시간이 경과하면 503 오류가 반환됩니다. 기본값은 500입니다. Default value: None
|
num_replicas
|
엔드포인트에서 이 버전에 할당할 컨테이너 수입니다. 기본값은 없습니다. 이 매개 변수를 설정하지 않으면 기본적으로 자동 크기 조정기가 사용됩니다. Default value: None
|
primary_key
|
이 엔드포인트에 사용할 기본 인증 키입니다. Default value: None
|
secondary_key
|
이 웹 서비스에 사용할 보조 인증 키입니다. Default value: None
|
tags
|
이 엔드포인트를 제공할 키 값 태그의 사전입니다. Default value: None
|
properties
|
이 엔드포인트를 제공할 키 값 속성의 사전입니다. 배포 후에는 이러한 속성을 변경할 수 없지만 새 키 값 쌍을 추가할 수 있습니다. Default value: None
|
description
|
이 엔드포인트에 제공할 설명입니다. Default value: None
|
gpu_cores
|
엔드포인트에서 이 버전에 할당할 GPU 코어 수입니다. 기본값은 0입니다. Default value: None
|
period_seconds
|
활동성 프로브를 수행하는 빈도(초)입니다. 기본값은 10초입니다. 최솟값은 1입니다. Default value: None
|
initial_delay_seconds
|
컨테이너가 시작된 후 활동성 프로브가 시작되기 전까지의 시간(초)입니다. 기본값은 310입니다. Default value: None
|
timeout_seconds
|
활동성 프로브의 시간이 초과된 후 경과된 시간(초)입니다. 기본값은 2초입니다. 최솟값은 1입니다. Default value: None
|
success_threshold
|
활동성 프로브가 실패한 후 성공한 것으로 간주되는 최소 연속 성공 횟수입니다. 기본값은 1입니다. 최솟값은 1입니다. Default value: None
|
failure_threshold
|
Pod가 시작되고 활동성 프로브가 실패하면 Kubernetes에서 포기하기 전에 Default value: None
|
namespace
|
이 엔드포인트를 배포할 Kubernetes 네임스페이스: 최대 63자의 소문자 영숫자('a'-'z', '0'-'9') 및 하이픈('-') 문자입니다. 첫 번째 문자와 마지막 문자는 하이픈일 수 없습니다. Default value: None
|
token_auth_enabled
|
이 엔드포인트에 토큰 인증을 사용할지 여부입니다. 이 기능을 사용하면 사용자는 Azure Active Directory 자격 증명을 사용하여 액세스 토큰을 가져와 이 엔드포인트에 액세스할 수 있습니다. 기본값은 False입니다. Default value: None
|
version_name
|
엔드포인트의 버전 이름입니다. Default value: None
|
traffic_percentile
|
버전이 엔드포인트에서 차지하는 트래픽 양입니다. Default value: None
|
compute_target_name
|
배포할 컴퓨팅 대상의 이름입니다. Default value: None
|
cpu_cores_limit
|
이 Webservice에서 사용할 수 있는 최대 CPU 코어 수입니다. 10진수일 수 있습니다. Default value: None
|
memory_gb_limit
|
이 Webservice에서 사용할 수 있는 최대 메모리 양(GB)입니다. 10진수일 수 있습니다. Default value: None
|
반환
형식 | Description |
---|---|
예외
형식 | Description |
---|---|
serialize
이 Webservice를 JSON 직렬화 사전으로 변환합니다.
serialize()
반환
형식 | Description |
---|---|
이 WebService의 JSON 표현입니다. |
예외
형식 | Description |
---|---|
update
제공된 속성으로 엔드포인트를 업데이트합니다.
None으로 남겨진 값은 이 엔드포인트에서 변경되지 않은 상태로 유지됩니다.
update(auth_enabled=None, token_auth_enabled=None, enable_app_insights=None, description=None, tags=None, properties=None)
매개 변수
Name | Description |
---|---|
auth_enabled
|
엔드포인트에서 이 버전에 대한 키 인증을 사용할지 여부입니다. 기본값은 True입니다. Default value: None
|
token_auth_enabled
|
이 엔드포인트에 토큰 인증을 사용할지 여부입니다. 이 기능을 사용하면 사용자는 Azure Active Directory 자격 증명을 사용하여 액세스 토큰을 가져와 이 엔드포인트에 액세스할 수 있습니다. 기본값은 False입니다. Default value: None
|
enable_app_insights
|
엔드포인트에서 이 버전에 대한 Application Insights 로깅을 사용할지 여부입니다. 기본값은 False입니다. Default value: None
|
description
|
이 엔드포인트에 제공할 설명입니다. Default value: None
|
tags
|
이 엔드포인트를 제공할 키 값 태그의 사전입니다. Default value: None
|
properties
|
이 엔드포인트를 제공할 키 값 속성의 사전입니다. 배포 후에는 이러한 속성을 변경할 수 없지만 새 키 값 쌍을 추가할 수 있습니다. Default value: None
|
예외
형식 | Description |
---|---|
update_version
제공된 속성으로 엔드포인트의 기존 버전을 업데이트합니다.
None으로 남겨진 값은 이 버전에서 변경되지 않은 상태로 유지됩니다.
update_version(version_name, autoscale_enabled=None, autoscale_min_replicas=None, autoscale_max_replicas=None, autoscale_refresh_seconds=None, autoscale_target_utilization=None, collect_model_data=None, cpu_cores=None, memory_gb=None, scoring_timeout_ms=None, replica_max_concurrent_requests=None, max_request_wait_time=None, num_replicas=None, tags=None, properties=None, description=None, models=None, inference_config=None, gpu_cores=None, period_seconds=None, initial_delay_seconds=None, timeout_seconds=None, success_threshold=None, failure_threshold=None, traffic_percentile=None, is_default=None, is_control_version_type=None, cpu_cores_limit=None, memory_gb_limit=None)
매개 변수
Name | Description |
---|---|
version_name
필수
|
엔드포인트의 버전 이름입니다. |
autoscale_enabled
|
엔드포인트에서 이 버전에 대한 자동 크기 조정을 사용할지 여부입니다. num_replicas가 None이면 기본값은 True입니다. Default value: None
|
autoscale_min_replicas
|
엔드포인트에서 이 버전을 자동 크기 조정할 때 사용할 최소 컨테이너 수입니다. 기본값은 1입니다. Default value: None
|
autoscale_max_replicas
|
엔드포인트에서 이 버전을 자동 크기 조정할 때 사용할 최대 컨테이너 수입니다. 기본값은 10입니다. Default value: None
|
autoscale_refresh_seconds
|
자동 크기 조정기가 엔드포인트에서 이 버전의 비율 크기 조정을 시도해야 하는 빈도입니다. 기본값은 1입니다. Default value: None
|
autoscale_target_utilization
|
자동 크기 조정기가 엔드포인트에서 이 버전에 대해 유지를 시도해야 하는 대상 사용률(백분율)입니다. 기본값은 70입니다. Default value: None
|
collect_model_data
|
엔드포인트에서 이 버전에 대한 모델 데이터 컬렉션을 사용할지 여부입니다. 기본값은 False입니다. Default value: None
|
cpu_cores
|
엔드포인트에서 이 버전에 할당할 CPU 코어 수입니다. 10진수일 수 있습니다. 기본값은 0.1입니다. Default value: None
|
memory_gb
|
엔드포인트에서 이 버전에 할당할 메모리 양(GB)입니다. 10진수일 수 있습니다. 기본값은 0.5입니다. Default value: None
|
scoring_timeout_ms
|
엔드포인트에서 이 버전에 대한 호출을 채점하기 위해 적용할 시간 제한입니다. 기본값은 60000입니다. Default value: None
|
replica_max_concurrent_requests
|
엔드포인트에서 이 버전을 허용하기 위한 복제본당 최대 동시 요청 수입니다. 기본값은 1입니다. Microsoft 기술 지원 또는 Azure Machine Learning 팀의 멤버가 지시하지 않는 한 이 설정을 기본값 1에서 변경하지 마세요. Default value: None
|
max_request_wait_time
|
요청이 큐에 유지되는 최대 시간(밀리초)입니다. 이 시간이 경과하면 503 오류가 반환됩니다. 기본값은 500입니다. Default value: None
|
num_replicas
|
엔드포인트에서 이 버전에 할당할 컨테이너 수입니다. 기본값은 없습니다. 이 매개 변수를 설정하지 않으면 기본적으로 자동 크기 조정기가 사용됩니다. Default value: None
|
tags
|
이 엔드포인트를 제공할 키 값 태그의 사전입니다. Default value: None
|
properties
|
이 엔드포인트를 제공할 키 값 속성의 사전입니다. 배포 후에는 이러한 속성을 변경할 수 없지만 새 키 값 쌍을 추가할 수 있습니다. Default value: None
|
description
|
이 엔드포인트에 제공할 설명입니다. Default value: None
|
models
|
업데이트된 서비스를 사용하여 패키징할 모델 개체 목록입니다. Default value: None
|
inference_config
|
필요한 모델 배포 속성을 제공하는 데 사용되는 InferenceConfig 개체입니다. Default value: None
|
gpu_cores
|
엔드포인트에서 이 버전에 할당할 GPU 코어 수입니다. 기본값은 0입니다. Default value: None
|
period_seconds
|
활동성 프로브를 수행하는 빈도(초)입니다. 기본값은 10초입니다. 최솟값은 1입니다. Default value: None
|
initial_delay_seconds
|
컨테이너가 시작된 후 활동성 프로브가 시작되기 전까지의 시간(초)입니다. 기본값은 310입니다. Default value: None
|
timeout_seconds
|
이 시간(초)이 경과하면 활동성 프로브가 시간 초과됩니다. 기본값은 2초입니다. 최솟값은 1입니다. Default value: None
|
success_threshold
|
활동성 프로브가 실패한 후 성공한 것으로 간주되는 최소 연속 성공 횟수입니다. 기본값은 1입니다. 최솟값은 1입니다. Default value: None
|
failure_threshold
|
Pod가 시작되고 활동성 프로브가 실패하면 Kubernetes에서 포기하기 전에 failureThreshold 시간을 시도합니다. 기본값은 3입니다. 최솟값은 1입니다. Default value: None
|
traffic_percentile
|
버전이 엔드포인트에서 차지하는 트래픽 양입니다. Default value: None
|
is_default
|
엔드포인트에서 이 버전을 기본 버전으로 사용할지 여부입니다. 기본값은 False입니다. Default value: None
|
is_control_version_type
|
엔드포인트에서 이 버전을 컨트롤 버전으로 만들지 여부입니다. 기본값은 False입니다. Default value: None
|
cpu_cores_limit
|
이 Webservice에서 사용할 수 있는 최대 CPU 코어 수입니다. 10진수일 수 있습니다. Default value: None
|
memory_gb_limit
|
이 Webservice에서 사용할 수 있는 최대 메모리 양(GB)입니다. 10진수일 수 있습니다. Default value: None
|
예외
형식 | Description |
---|---|