Microsoft.MachineLearningServices 작업 영역/onlineEndpoints/deployments 2022-12-01-preview
- 최근
- 2024-10-01
- 2024-10-01-preview
- 2024-07-01-preview
- 2024-04-01
- 2024-04-01-preview
- 2024-01-01-preview
- 2023-10-01
- 2023-08-01-preview
- 2023-06-01-preview
- 2023-04-01
- 2023-04-01-preview
- 2023-02-01-preview
- 2022-12-01-preview
- 2022-10-01
- 2022-10-01-preview
- 2022-06-01-preview
- 2022-05-01
- 2022-02-01-preview
- 2021-03-01-preview
Bicep 리소스 정의
작업 영역/onlineEndpoints/deployments 리소스 종류는 다음을 대상으로 하는 작업으로 배포할 수 있습니다.
- 리소스 그룹 - 리소스 그룹 배포 명령 참조
각 API 버전에서 변경된 속성 목록은 변경 로그참조하세요.
리소스 형식
Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments 리소스를 만들려면 템플릿에 다음 Bicep을 추가합니다.
resource symbolicname 'Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2022-12-01-preview' = {
parent: resourceSymbolicName
identity: {
type: 'string'
userAssignedIdentities: {
{customized property}: {}
}
}
kind: 'string'
location: 'string'
name: 'string'
properties: {
appInsightsEnabled: bool
codeConfiguration: {
codeId: 'string'
scoringScript: 'string'
}
description: 'string'
egressPublicNetworkAccess: 'string'
environmentId: 'string'
environmentVariables: {
{customized property}: 'string'
}
instanceType: 'string'
livenessProbe: {
failureThreshold: int
initialDelay: 'string'
period: 'string'
successThreshold: int
timeout: 'string'
}
model: 'string'
modelMountPath: 'string'
properties: {
{customized property}: 'string'
}
readinessProbe: {
failureThreshold: int
initialDelay: 'string'
period: 'string'
successThreshold: int
timeout: 'string'
}
requestSettings: {
maxConcurrentRequestsPerInstance: int
maxQueueWait: 'string'
requestTimeout: 'string'
}
scaleSettings: {
scaleType: 'string'
// For remaining properties, see OnlineScaleSettings objects
}
endpointComputeType: 'string'
// For remaining properties, see OnlineDeploymentProperties objects
}
sku: {
capacity: int
family: 'string'
name: 'string'
size: 'string'
tier: 'string'
}
tags: {
{customized property}: 'string'
}
}
OnlineScaleSettings 개체
scaleType 속성을 설정하여 개체 유형을 지정합니다.
기본경우 다음을 사용합니다.
{
scaleType: 'Default'
}
TargetUtilization경우 다음을 사용합니다.
{
maxInstances: int
minInstances: int
pollingInterval: 'string'
scaleType: 'TargetUtilization'
targetUtilizationPercentage: int
}
OnlineDeploymentProperties 개체
endpointComputeType 속성을 설정하여 개체 유형을 지정합니다.
kubernetes
{
containerResourceRequirements: {
containerResourceLimits: {
cpu: 'string'
gpu: 'string'
memory: 'string'
}
containerResourceRequests: {
cpu: 'string'
gpu: 'string'
memory: 'string'
}
}
endpointComputeType: 'Kubernetes'
}
관리되는경우 다음을 사용합니다.
{
endpointComputeType: 'Managed'
}
속성 값
CodeConfiguration
이름 | 묘사 | 값 |
---|---|---|
codeId | 코드 자산의 ARM 리소스 ID입니다. | 문자열 |
scoringScript | [필수] 시작할 때 실행할 스크립트입니다. 예. "score.py" | 문자열 제약 조건: 최소 길이 = 1 패턴 = [a-zA-Z0-9_] (필수) |
ContainerResourceRequirements
이름 | 묘사 | 값 |
---|---|---|
containerResourceLimits | 컨테이너 리소스 제한 정보: | ContainerResourceSettings |
containerResourceRequests | 컨테이너 리소스 요청 정보: | ContainerResourceSettings |
ContainerResourceSettings
이름 | 묘사 | 값 |
---|---|---|
cpu(cpu) | 컨테이너에 대한 vCPU 요청/제한 수입니다. 추가 정보: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
문자열 |
gpu | 컨테이너에 대한 Nvidia GPU 카드 요청/제한 수입니다. 추가 정보: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
문자열 |
기억 | 컨테이너에 대한 메모리 크기 요청/제한입니다. 추가 정보: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
문자열 |
DefaultScaleSettings
이름 | 묘사 | 값 |
---|---|---|
scaleType | [필수] 배포 크기 조정 알고리즘의 유형 | 'Default'(필수) |
EndpointDeploymentPropertiesBaseEnvironmentVariables
이름 | 묘사 | 값 |
---|
EndpointDeploymentPropertiesBaseProperties
이름 | 묘사 | 값 |
---|
KubernetesOnlineDeployment
이름 | 묘사 | 값 |
---|---|---|
containerResourceRequirements | 컨테이너(cpu 및 메모리)에 대한 리소스 요구 사항입니다. | ContainerResourceRequirements |
endpointComputeType | [필수] 엔드포인트의 컴퓨팅 형식입니다. | 'Kubernetes'(필수) |
ManagedOnlineDeployment
이름 | 묘사 | 값 |
---|---|---|
endpointComputeType | [필수] 엔드포인트의 컴퓨팅 형식입니다. | 'Managed'(필수) |
ManagedServiceIdentity
이름 | 묘사 | 값 |
---|---|---|
형 | 관리 서비스 ID의 유형입니다(SystemAssigned 및 UserAssigned 형식이 모두 허용되는 경우). | 'None' 'SystemAssigned' 'SystemAssigned,UserAssigned' 'UserAssigned'(필수) |
userAssignedIdentities | 리소스와 연결된 사용자 할당 ID 집합입니다. userAssignedIdentities 사전 키는 '/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName} 형식의 ARM 리소스 ID입니다. 사전 값은 요청에서 빈 개체({})일 수 있습니다. | UserAssignedIdentities |
Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments
이름 | 묘사 | 값 |
---|---|---|
신원 | 관리 서비스 ID(시스템 할당 및/또는 사용자 할당 ID) | ManagedServiceIdentity |
종류 | 포털/도구/등에서 동일한 형식의 리소스에 대해 다른 UX 환경을 렌더링하는 데 사용되는 메타데이터입니다. | 문자열 |
위치 | 리소스가 있는 지리적 위치 | string(필수) |
이름 | 리소스 이름 | 문자열 제약 조건: 패턴 = ^[a-zA-Z0-9][a-zA-Z0-9\-_]{0,254}$ (필수) |
부모 | Bicep에서 자식 리소스에 대한 부모 리소스를 지정할 수 있습니다. 자식 리소스가 부모 리소스 외부에서 선언된 경우에만 이 속성을 추가해야 합니다. 자세한 내용은 부모 리소스외부의 자식 리소스 |
형식 리소스의 기호 이름: 작업 영역/onlineEndpoints |
속성 | [필수] 엔터티의 추가 특성입니다. | OnlineDeploymentProperties(필수) |
sku | 자동 크기 조정을 위한 ARM 계약에 필요한 SKU 세부 정보입니다. | Sku |
태그 | 리소스 태그 | 태그 이름 및 값의 사전입니다. 템플릿 |
OnlineDeploymentProperties
이름 | 묘사 | 값 |
---|---|---|
appInsightsEnabled | true이면 Application Insights 로깅을 사용하도록 설정합니다. | bool |
codeConfiguration | 엔드포인트 배포에 대한 코드 구성입니다. | codeConfiguration |
묘사 | 엔드포인트 배포에 대한 설명입니다. | 문자열 |
egressPublicNetworkAccess | 사용하도록 설정된 경우 송신 공용 네트워크 액세스를 허용합니다. 사용하지 않도록 설정하면 보안 송신이 생성됩니다. 기본값: 사용 | '사용 안 함' 'Enabled' |
endpointComputeType | KubernetesOnlineDeployment |
'Kubernetes' 'Managed'(필수) |
environmentId | 엔드포인트 배포에 대한 환경 사양의 ARM 리소스 ID입니다. | 문자열 |
environmentVariables | 배포에 대한 환경 변수 구성입니다. | EndpointDeploymentPropertiesBaseEnvironmentVariables |
instanceType | 컴퓨팅 인스턴스 유형입니다. | 문자열 |
livenessProbe | 활동성 프로브는 컨테이너의 상태를 정기적으로 모니터링합니다. | ProbeSettings |
모델 | 모델의 URI 경로입니다. | 문자열 |
modelMountPath | 사용자 지정 컨테이너에 모델을 탑재할 경로입니다. | 문자열 |
속성 | 속성 사전입니다. 속성을 추가할 수 있지만 제거하거나 변경할 수는 없습니다. | EndpointDeploymentPropertiesBaseProperties |
readinessProbe | 준비 상태 프로브는 컨테이너가 트래픽을 처리할 준비가 되었는지 확인합니다. 속성 및 기본값은 활동성 프로브와 동일합니다. | ProbeSettings |
requestSettings | 배포에 대한 요청 설정입니다. | OnlineRequestSettings |
scaleSettings | 배포에 대한 크기 조정 설정입니다. null이거나 제공되지 않은 경우 기본적으로 KubernetesOnlineDeployment에 대한 TargetUtilizationScaleSettings로 설정됩니다. ManagedOnlineDeployment에 대한 DefaultScaleSettings로 |
OnlineScaleSettings |
OnlineRequestSettings
이름 | 묘사 | 값 |
---|---|---|
maxConcurrentRequestsPerInstance | 배포당 허용되는 노드당 최대 동시 요청 수입니다. 기본값은 1입니다. | int |
maxQueueWait | 요청이 ISO 8601 형식으로 큐에 유지되는 최대 시간입니다. 기본값은 500ms입니다. |
문자열 |
requestTimeout | ISO 8601 형식의 채점 시간 제한입니다. 기본값은 5000ms입니다. |
문자열 |
OnlineScaleSettings
이름 | 묘사 | 값 |
---|---|---|
scaleType | DefaultScaleSettings |
'기본값' 'TargetUtilization'(필수) |
ProbeSettings
이름 | 묘사 | 값 |
---|---|---|
failureThreshold | 비정상 상태를 반환하기 전에 허용할 실패 횟수입니다. | int |
initialDelay | ISO 8601 형식의 첫 번째 프로브 앞의 지연입니다. | 문자열 |
마침표 | ISO 8601 형식의 프로브 간 시간입니다. | 문자열 |
successThreshold | 정상 상태를 반환하기 전에 성공한 프로브의 수입니다. | int |
타임 아웃 | ISO 8601 형식의 프로브 시간 제한입니다. | 문자열 |
Sku
이름 | 묘사 | 값 |
---|---|---|
용량 | SKU가 스케일 아웃/인을 지원하는 경우 용량 정수가 포함되어야 합니다. 리소스에 대해 스케일 아웃/인이 불가능한 경우 생략할 수 있습니다. | int |
가족 | 서비스에 여러 세대의 하드웨어가 있는 경우 동일한 SKU에 대해 여기에서 캡처할 수 있습니다. | 문자열 |
이름 | SKU의 이름입니다. 예 - P3. 일반적으로 letter+number 코드입니다. | string(필수) |
크기 | SKU 크기입니다. 이름 필드가 계층과 다른 값의 조합인 경우 독립 실행형 코드입니다. | 문자열 |
계층 | 이 필드는 서비스에 둘 이상의 계층이 있지만 PUT에는 필요하지 않은 경우 리소스 공급자가 구현해야 합니다. | '기본' '무료' '프리미엄' 'Standard' |
TargetUtilizationScaleSettings
이름 | 묘사 | 값 |
---|---|---|
maxInstances | 배포를 확장할 수 있는 최대 인스턴스 수입니다. 할당량은 max_instances 예약됩니다. | int |
minInstances | 항상 존재할 최소 인스턴스 수입니다. | int |
pollingInterval | ISO 8691 형식의 폴링 간격입니다. 전체 자릿수가 초인 기간만 지원합니다. | 문자열 |
scaleType | [필수] 배포 크기 조정 알고리즘의 유형 | 'TargetUtilization'(필수) |
targetUtilizationPercentage | 자동 크기 조정기용 대상 CPU 사용량입니다. | int |
TrackedResourceTags
이름 | 묘사 | 값 |
---|
UserAssignedIdentities
이름 | 묘사 | 값 |
---|
UserAssignedIdentity
이름 | 묘사 | 값 |
---|
ARM 템플릿 리소스 정의
작업 영역/onlineEndpoints/deployments 리소스 종류는 다음을 대상으로 하는 작업으로 배포할 수 있습니다.
- 리소스 그룹 - 리소스 그룹 배포 명령 참조
각 API 버전에서 변경된 속성 목록은 변경 로그참조하세요.
리소스 형식
Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments 리소스를 만들려면 템플릿에 다음 JSON을 추가합니다.
{
"type": "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments",
"apiVersion": "2022-12-01-preview",
"name": "string",
"identity": {
"type": "string",
"userAssignedIdentities": {
"{customized property}": {
}
}
},
"kind": "string",
"location": "string",
"properties": {
"appInsightsEnabled": "bool",
"codeConfiguration": {
"codeId": "string",
"scoringScript": "string"
},
"description": "string",
"egressPublicNetworkAccess": "string",
"environmentId": "string",
"environmentVariables": {
"{customized property}": "string"
},
"instanceType": "string",
"livenessProbe": {
"failureThreshold": "int",
"initialDelay": "string",
"period": "string",
"successThreshold": "int",
"timeout": "string"
},
"model": "string",
"modelMountPath": "string",
"properties": {
"{customized property}": "string"
},
"readinessProbe": {
"failureThreshold": "int",
"initialDelay": "string",
"period": "string",
"successThreshold": "int",
"timeout": "string"
},
"requestSettings": {
"maxConcurrentRequestsPerInstance": "int",
"maxQueueWait": "string",
"requestTimeout": "string"
},
"scaleSettings": {
"scaleType": "string"
// For remaining properties, see OnlineScaleSettings objects
},
"endpointComputeType": "string"
// For remaining properties, see OnlineDeploymentProperties objects
},
"sku": {
"capacity": "int",
"family": "string",
"name": "string",
"size": "string",
"tier": "string"
},
"tags": {
"{customized property}": "string"
}
}
OnlineScaleSettings 개체
scaleType 속성을 설정하여 개체 유형을 지정합니다.
기본경우 다음을 사용합니다.
{
"scaleType": "Default"
}
TargetUtilization경우 다음을 사용합니다.
{
"maxInstances": "int",
"minInstances": "int",
"pollingInterval": "string",
"scaleType": "TargetUtilization",
"targetUtilizationPercentage": "int"
}
OnlineDeploymentProperties 개체
endpointComputeType 속성을 설정하여 개체 유형을 지정합니다.
kubernetes
{
"containerResourceRequirements": {
"containerResourceLimits": {
"cpu": "string",
"gpu": "string",
"memory": "string"
},
"containerResourceRequests": {
"cpu": "string",
"gpu": "string",
"memory": "string"
}
},
"endpointComputeType": "Kubernetes"
}
관리되는경우 다음을 사용합니다.
{
"endpointComputeType": "Managed"
}
속성 값
CodeConfiguration
이름 | 묘사 | 값 |
---|---|---|
codeId | 코드 자산의 ARM 리소스 ID입니다. | 문자열 |
scoringScript | [필수] 시작할 때 실행할 스크립트입니다. 예. "score.py" | 문자열 제약 조건: 최소 길이 = 1 패턴 = [a-zA-Z0-9_] (필수) |
ContainerResourceRequirements
이름 | 묘사 | 값 |
---|---|---|
containerResourceLimits | 컨테이너 리소스 제한 정보: | ContainerResourceSettings |
containerResourceRequests | 컨테이너 리소스 요청 정보: | ContainerResourceSettings |
ContainerResourceSettings
이름 | 묘사 | 값 |
---|---|---|
cpu(cpu) | 컨테이너에 대한 vCPU 요청/제한 수입니다. 추가 정보: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
문자열 |
gpu | 컨테이너에 대한 Nvidia GPU 카드 요청/제한 수입니다. 추가 정보: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
문자열 |
기억 | 컨테이너에 대한 메모리 크기 요청/제한입니다. 추가 정보: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
문자열 |
DefaultScaleSettings
이름 | 묘사 | 값 |
---|---|---|
scaleType | [필수] 배포 크기 조정 알고리즘의 유형 | 'Default'(필수) |
EndpointDeploymentPropertiesBaseEnvironmentVariables
이름 | 묘사 | 값 |
---|
EndpointDeploymentPropertiesBaseProperties
이름 | 묘사 | 값 |
---|
KubernetesOnlineDeployment
이름 | 묘사 | 값 |
---|---|---|
containerResourceRequirements | 컨테이너(cpu 및 메모리)에 대한 리소스 요구 사항입니다. | ContainerResourceRequirements |
endpointComputeType | [필수] 엔드포인트의 컴퓨팅 형식입니다. | 'Kubernetes'(필수) |
ManagedOnlineDeployment
이름 | 묘사 | 값 |
---|---|---|
endpointComputeType | [필수] 엔드포인트의 컴퓨팅 형식입니다. | 'Managed'(필수) |
ManagedServiceIdentity
이름 | 묘사 | 값 |
---|---|---|
형 | 관리 서비스 ID의 유형입니다(SystemAssigned 및 UserAssigned 형식이 모두 허용되는 경우). | 'None' 'SystemAssigned' 'SystemAssigned,UserAssigned' 'UserAssigned'(필수) |
userAssignedIdentities | 리소스와 연결된 사용자 할당 ID 집합입니다. userAssignedIdentities 사전 키는 '/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName} 형식의 ARM 리소스 ID입니다. 사전 값은 요청에서 빈 개체({})일 수 있습니다. | UserAssignedIdentities |
Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments
이름 | 묘사 | 값 |
---|---|---|
apiVersion | api 버전 | '2022-12-01-preview' |
신원 | 관리 서비스 ID(시스템 할당 및/또는 사용자 할당 ID) | ManagedServiceIdentity |
종류 | 포털/도구/등에서 동일한 형식의 리소스에 대해 다른 UX 환경을 렌더링하는 데 사용되는 메타데이터입니다. | 문자열 |
위치 | 리소스가 있는 지리적 위치 | string(필수) |
이름 | 리소스 이름 | 문자열 제약 조건: 패턴 = ^[a-zA-Z0-9][a-zA-Z0-9\-_]{0,254}$ (필수) |
속성 | [필수] 엔터티의 추가 특성입니다. | OnlineDeploymentProperties(필수) |
sku | 자동 크기 조정을 위한 ARM 계약에 필요한 SKU 세부 정보입니다. | Sku |
태그 | 리소스 태그 | 태그 이름 및 값의 사전입니다. 템플릿 |
형 | 리소스 종류 | 'Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments' |
OnlineDeploymentProperties
이름 | 묘사 | 값 |
---|---|---|
appInsightsEnabled | true이면 Application Insights 로깅을 사용하도록 설정합니다. | bool |
codeConfiguration | 엔드포인트 배포에 대한 코드 구성입니다. | codeConfiguration |
묘사 | 엔드포인트 배포에 대한 설명입니다. | 문자열 |
egressPublicNetworkAccess | 사용하도록 설정된 경우 송신 공용 네트워크 액세스를 허용합니다. 사용하지 않도록 설정하면 보안 송신이 생성됩니다. 기본값: 사용 | '사용 안 함' 'Enabled' |
endpointComputeType | KubernetesOnlineDeployment |
'Kubernetes' 'Managed'(필수) |
environmentId | 엔드포인트 배포에 대한 환경 사양의 ARM 리소스 ID입니다. | 문자열 |
environmentVariables | 배포에 대한 환경 변수 구성입니다. | EndpointDeploymentPropertiesBaseEnvironmentVariables |
instanceType | 컴퓨팅 인스턴스 유형입니다. | 문자열 |
livenessProbe | 활동성 프로브는 컨테이너의 상태를 정기적으로 모니터링합니다. | ProbeSettings |
모델 | 모델의 URI 경로입니다. | 문자열 |
modelMountPath | 사용자 지정 컨테이너에 모델을 탑재할 경로입니다. | 문자열 |
속성 | 속성 사전입니다. 속성을 추가할 수 있지만 제거하거나 변경할 수는 없습니다. | EndpointDeploymentPropertiesBaseProperties |
readinessProbe | 준비 상태 프로브는 컨테이너가 트래픽을 처리할 준비가 되었는지 확인합니다. 속성 및 기본값은 활동성 프로브와 동일합니다. | ProbeSettings |
requestSettings | 배포에 대한 요청 설정입니다. | OnlineRequestSettings |
scaleSettings | 배포에 대한 크기 조정 설정입니다. null이거나 제공되지 않은 경우 기본적으로 KubernetesOnlineDeployment에 대한 TargetUtilizationScaleSettings로 설정됩니다. ManagedOnlineDeployment에 대한 DefaultScaleSettings로 |
OnlineScaleSettings |
OnlineRequestSettings
이름 | 묘사 | 값 |
---|---|---|
maxConcurrentRequestsPerInstance | 배포당 허용되는 노드당 최대 동시 요청 수입니다. 기본값은 1입니다. | int |
maxQueueWait | 요청이 ISO 8601 형식으로 큐에 유지되는 최대 시간입니다. 기본값은 500ms입니다. |
문자열 |
requestTimeout | ISO 8601 형식의 채점 시간 제한입니다. 기본값은 5000ms입니다. |
문자열 |
OnlineScaleSettings
이름 | 묘사 | 값 |
---|---|---|
scaleType | DefaultScaleSettings |
'기본값' 'TargetUtilization'(필수) |
ProbeSettings
이름 | 묘사 | 값 |
---|---|---|
failureThreshold | 비정상 상태를 반환하기 전에 허용할 실패 횟수입니다. | int |
initialDelay | ISO 8601 형식의 첫 번째 프로브 앞의 지연입니다. | 문자열 |
마침표 | ISO 8601 형식의 프로브 간 시간입니다. | 문자열 |
successThreshold | 정상 상태를 반환하기 전에 성공한 프로브의 수입니다. | int |
타임 아웃 | ISO 8601 형식의 프로브 시간 제한입니다. | 문자열 |
Sku
이름 | 묘사 | 값 |
---|---|---|
용량 | SKU가 스케일 아웃/인을 지원하는 경우 용량 정수가 포함되어야 합니다. 리소스에 대해 스케일 아웃/인이 불가능한 경우 생략할 수 있습니다. | int |
가족 | 서비스에 여러 세대의 하드웨어가 있는 경우 동일한 SKU에 대해 여기에서 캡처할 수 있습니다. | 문자열 |
이름 | SKU의 이름입니다. 예 - P3. 일반적으로 letter+number 코드입니다. | string(필수) |
크기 | SKU 크기입니다. 이름 필드가 계층과 다른 값의 조합인 경우 독립 실행형 코드입니다. | 문자열 |
계층 | 이 필드는 서비스에 둘 이상의 계층이 있지만 PUT에는 필요하지 않은 경우 리소스 공급자가 구현해야 합니다. | '기본' '무료' '프리미엄' 'Standard' |
TargetUtilizationScaleSettings
이름 | 묘사 | 값 |
---|---|---|
maxInstances | 배포를 확장할 수 있는 최대 인스턴스 수입니다. 할당량은 max_instances 예약됩니다. | int |
minInstances | 항상 존재할 최소 인스턴스 수입니다. | int |
pollingInterval | ISO 8691 형식의 폴링 간격입니다. 전체 자릿수가 초인 기간만 지원합니다. | 문자열 |
scaleType | [필수] 배포 크기 조정 알고리즘의 유형 | 'TargetUtilization'(필수) |
targetUtilizationPercentage | 자동 크기 조정기용 대상 CPU 사용량입니다. | int |
TrackedResourceTags
이름 | 묘사 | 값 |
---|
UserAssignedIdentities
이름 | 묘사 | 값 |
---|
UserAssignedIdentity
이름 | 묘사 | 값 |
---|
Terraform(AzAPI 공급자) 리소스 정의
작업 영역/onlineEndpoints/deployments 리소스 종류는 다음을 대상으로 하는 작업으로 배포할 수 있습니다.
- 리소스 그룹
각 API 버전에서 변경된 속성 목록은 변경 로그참조하세요.
리소스 형식
Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments 리소스를 만들려면 템플릿에 다음 Terraform을 추가합니다.
resource "azapi_resource" "symbolicname" {
type = "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2022-12-01-preview"
name = "string"
identity = {
type = "string"
userAssignedIdentities = {
{customized property} = {
}
}
}
kind = "string"
location = "string"
sku = {
capacity = int
family = "string"
name = "string"
size = "string"
tier = "string"
}
tags = {
{customized property} = "string"
}
body = jsonencode({
properties = {
appInsightsEnabled = bool
codeConfiguration = {
codeId = "string"
scoringScript = "string"
}
description = "string"
egressPublicNetworkAccess = "string"
environmentId = "string"
environmentVariables = {
{customized property} = "string"
}
instanceType = "string"
livenessProbe = {
failureThreshold = int
initialDelay = "string"
period = "string"
successThreshold = int
timeout = "string"
}
model = "string"
modelMountPath = "string"
properties = {
{customized property} = "string"
}
readinessProbe = {
failureThreshold = int
initialDelay = "string"
period = "string"
successThreshold = int
timeout = "string"
}
requestSettings = {
maxConcurrentRequestsPerInstance = int
maxQueueWait = "string"
requestTimeout = "string"
}
scaleSettings = {
scaleType = "string"
// For remaining properties, see OnlineScaleSettings objects
}
endpointComputeType = "string"
// For remaining properties, see OnlineDeploymentProperties objects
}
})
}
OnlineScaleSettings 개체
scaleType 속성을 설정하여 개체 유형을 지정합니다.
기본경우 다음을 사용합니다.
{
scaleType = "Default"
}
TargetUtilization경우 다음을 사용합니다.
{
maxInstances = int
minInstances = int
pollingInterval = "string"
scaleType = "TargetUtilization"
targetUtilizationPercentage = int
}
OnlineDeploymentProperties 개체
endpointComputeType 속성을 설정하여 개체 유형을 지정합니다.
kubernetes
{
containerResourceRequirements = {
containerResourceLimits = {
cpu = "string"
gpu = "string"
memory = "string"
}
containerResourceRequests = {
cpu = "string"
gpu = "string"
memory = "string"
}
}
endpointComputeType = "Kubernetes"
}
관리되는경우 다음을 사용합니다.
{
endpointComputeType = "Managed"
}
속성 값
CodeConfiguration
이름 | 묘사 | 값 |
---|---|---|
codeId | 코드 자산의 ARM 리소스 ID입니다. | 문자열 |
scoringScript | [필수] 시작할 때 실행할 스크립트입니다. 예. "score.py" | 문자열 제약 조건: 최소 길이 = 1 패턴 = [a-zA-Z0-9_] (필수) |
ContainerResourceRequirements
이름 | 묘사 | 값 |
---|---|---|
containerResourceLimits | 컨테이너 리소스 제한 정보: | ContainerResourceSettings |
containerResourceRequests | 컨테이너 리소스 요청 정보: | ContainerResourceSettings |
ContainerResourceSettings
이름 | 묘사 | 값 |
---|---|---|
cpu(cpu) | 컨테이너에 대한 vCPU 요청/제한 수입니다. 추가 정보: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
문자열 |
gpu | 컨테이너에 대한 Nvidia GPU 카드 요청/제한 수입니다. 추가 정보: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
문자열 |
기억 | 컨테이너에 대한 메모리 크기 요청/제한입니다. 추가 정보: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
문자열 |
DefaultScaleSettings
이름 | 묘사 | 값 |
---|---|---|
scaleType | [필수] 배포 크기 조정 알고리즘의 유형 | 'Default'(필수) |
EndpointDeploymentPropertiesBaseEnvironmentVariables
이름 | 묘사 | 값 |
---|
EndpointDeploymentPropertiesBaseProperties
이름 | 묘사 | 값 |
---|
KubernetesOnlineDeployment
이름 | 묘사 | 값 |
---|---|---|
containerResourceRequirements | 컨테이너(cpu 및 메모리)에 대한 리소스 요구 사항입니다. | ContainerResourceRequirements |
endpointComputeType | [필수] 엔드포인트의 컴퓨팅 형식입니다. | 'Kubernetes'(필수) |
ManagedOnlineDeployment
이름 | 묘사 | 값 |
---|---|---|
endpointComputeType | [필수] 엔드포인트의 컴퓨팅 형식입니다. | 'Managed'(필수) |
ManagedServiceIdentity
이름 | 묘사 | 값 |
---|---|---|
형 | 관리 서비스 ID의 유형입니다(SystemAssigned 및 UserAssigned 형식이 모두 허용되는 경우). | 'None' 'SystemAssigned' 'SystemAssigned,UserAssigned' 'UserAssigned'(필수) |
userAssignedIdentities | 리소스와 연결된 사용자 할당 ID 집합입니다. userAssignedIdentities 사전 키는 '/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName} 형식의 ARM 리소스 ID입니다. 사전 값은 요청에서 빈 개체({})일 수 있습니다. | UserAssignedIdentities |
Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments
이름 | 묘사 | 값 |
---|---|---|
신원 | 관리 서비스 ID(시스템 할당 및/또는 사용자 할당 ID) | ManagedServiceIdentity |
종류 | 포털/도구/등에서 동일한 형식의 리소스에 대해 다른 UX 환경을 렌더링하는 데 사용되는 메타데이터입니다. | 문자열 |
위치 | 리소스가 있는 지리적 위치 | string(필수) |
이름 | 리소스 이름 | 문자열 제약 조건: 패턴 = ^[a-zA-Z0-9][a-zA-Z0-9\-_]{0,254}$ (필수) |
parent_id | 이 리소스의 부모인 리소스의 ID입니다. | 형식의 리소스 ID: 작업 영역/onlineEndpoints |
속성 | [필수] 엔터티의 추가 특성입니다. | OnlineDeploymentProperties(필수) |
sku | 자동 크기 조정을 위한 ARM 계약에 필요한 SKU 세부 정보입니다. | Sku |
태그 | 리소스 태그 | 태그 이름 및 값의 사전입니다. |
형 | 리소스 종류 | "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2022-12-01-preview" |
OnlineDeploymentProperties
이름 | 묘사 | 값 |
---|---|---|
appInsightsEnabled | true이면 Application Insights 로깅을 사용하도록 설정합니다. | bool |
codeConfiguration | 엔드포인트 배포에 대한 코드 구성입니다. | codeConfiguration |
묘사 | 엔드포인트 배포에 대한 설명입니다. | 문자열 |
egressPublicNetworkAccess | 사용하도록 설정된 경우 송신 공용 네트워크 액세스를 허용합니다. 사용하지 않도록 설정하면 보안 송신이 생성됩니다. 기본값: 사용 | '사용 안 함' 'Enabled' |
endpointComputeType | KubernetesOnlineDeployment |
'Kubernetes' 'Managed'(필수) |
environmentId | 엔드포인트 배포에 대한 환경 사양의 ARM 리소스 ID입니다. | 문자열 |
environmentVariables | 배포에 대한 환경 변수 구성입니다. | EndpointDeploymentPropertiesBaseEnvironmentVariables |
instanceType | 컴퓨팅 인스턴스 유형입니다. | 문자열 |
livenessProbe | 활동성 프로브는 컨테이너의 상태를 정기적으로 모니터링합니다. | ProbeSettings |
모델 | 모델의 URI 경로입니다. | 문자열 |
modelMountPath | 사용자 지정 컨테이너에 모델을 탑재할 경로입니다. | 문자열 |
속성 | 속성 사전입니다. 속성을 추가할 수 있지만 제거하거나 변경할 수는 없습니다. | EndpointDeploymentPropertiesBaseProperties |
readinessProbe | 준비 상태 프로브는 컨테이너가 트래픽을 처리할 준비가 되었는지 확인합니다. 속성 및 기본값은 활동성 프로브와 동일합니다. | ProbeSettings |
requestSettings | 배포에 대한 요청 설정입니다. | OnlineRequestSettings |
scaleSettings | 배포에 대한 크기 조정 설정입니다. null이거나 제공되지 않은 경우 기본적으로 KubernetesOnlineDeployment에 대한 TargetUtilizationScaleSettings로 설정됩니다. ManagedOnlineDeployment에 대한 DefaultScaleSettings로 |
OnlineScaleSettings |
OnlineRequestSettings
이름 | 묘사 | 값 |
---|---|---|
maxConcurrentRequestsPerInstance | 배포당 허용되는 노드당 최대 동시 요청 수입니다. 기본값은 1입니다. | int |
maxQueueWait | 요청이 ISO 8601 형식으로 큐에 유지되는 최대 시간입니다. 기본값은 500ms입니다. |
문자열 |
requestTimeout | ISO 8601 형식의 채점 시간 제한입니다. 기본값은 5000ms입니다. |
문자열 |
OnlineScaleSettings
이름 | 묘사 | 값 |
---|---|---|
scaleType | DefaultScaleSettings |
'기본값' 'TargetUtilization'(필수) |
ProbeSettings
이름 | 묘사 | 값 |
---|---|---|
failureThreshold | 비정상 상태를 반환하기 전에 허용할 실패 횟수입니다. | int |
initialDelay | ISO 8601 형식의 첫 번째 프로브 앞의 지연입니다. | 문자열 |
마침표 | ISO 8601 형식의 프로브 간 시간입니다. | 문자열 |
successThreshold | 정상 상태를 반환하기 전에 성공한 프로브의 수입니다. | int |
타임 아웃 | ISO 8601 형식의 프로브 시간 제한입니다. | 문자열 |
Sku
이름 | 묘사 | 값 |
---|---|---|
용량 | SKU가 스케일 아웃/인을 지원하는 경우 용량 정수가 포함되어야 합니다. 리소스에 대해 스케일 아웃/인이 불가능한 경우 생략할 수 있습니다. | int |
가족 | 서비스에 여러 세대의 하드웨어가 있는 경우 동일한 SKU에 대해 여기에서 캡처할 수 있습니다. | 문자열 |
이름 | SKU의 이름입니다. 예 - P3. 일반적으로 letter+number 코드입니다. | string(필수) |
크기 | SKU 크기입니다. 이름 필드가 계층과 다른 값의 조합인 경우 독립 실행형 코드입니다. | 문자열 |
계층 | 이 필드는 서비스에 둘 이상의 계층이 있지만 PUT에는 필요하지 않은 경우 리소스 공급자가 구현해야 합니다. | '기본' '무료' '프리미엄' 'Standard' |
TargetUtilizationScaleSettings
이름 | 묘사 | 값 |
---|---|---|
maxInstances | 배포를 확장할 수 있는 최대 인스턴스 수입니다. 할당량은 max_instances 예약됩니다. | int |
minInstances | 항상 존재할 최소 인스턴스 수입니다. | int |
pollingInterval | ISO 8691 형식의 폴링 간격입니다. 전체 자릿수가 초인 기간만 지원합니다. | 문자열 |
scaleType | [필수] 배포 크기 조정 알고리즘의 유형 | 'TargetUtilization'(필수) |
targetUtilizationPercentage | 자동 크기 조정기용 대상 CPU 사용량입니다. | int |
TrackedResourceTags
이름 | 묘사 | 값 |
---|
UserAssignedIdentities
이름 | 묘사 | 값 |
---|
UserAssignedIdentity
이름 | 묘사 | 값 |
---|