Microsoft.MachineLearningServices 작업 영역/onlineEndpoints/deployments 2021-03-01-preview
- 최근
- 2024-10-01
- 2024-10-01-preview
- 2024-07-01-preview
- 2024-04-01
- 2024-04-01-preview
- 2024-01-01-preview
- 2023-10-01
- 2023-08-01-preview
- 2023-06-01-preview
- 2023-04-01
- 2023-04-01-preview
- 2023-02-01-preview
- 2022-12-01-preview
- 2022-10-01
- 2022-10-01-preview
- 2022-06-01-preview
- 2022-05-01
- 2022-02-01-preview
- 2021-03-01-preview
Bicep 리소스 정의
작업 영역/onlineEndpoints/deployments 리소스 종류는 다음을 대상으로 하는 작업으로 배포할 수 있습니다.
- 리소스 그룹 - 리소스 그룹 배포 명령 참조
각 API 버전에서 변경된 속성 목록은 변경 로그참조하세요.
리소스 형식
Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments 리소스를 만들려면 템플릿에 다음 Bicep을 추가합니다.
resource symbolicname 'Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2021-03-01-preview' = {
parent: resourceSymbolicName
identity: {
type: 'string'
userAssignedIdentities: {
{customized property}: {
clientId: 'string'
principalId: 'string'
}
}
}
kind: 'string'
location: 'string'
name: 'string'
properties: {
appInsightsEnabled: bool
codeConfiguration: {
codeId: 'string'
scoringScript: 'string'
}
description: 'string'
environmentId: 'string'
environmentVariables: {
{customized property}: 'string'
}
livenessProbe: {
failureThreshold: int
initialDelay: 'string'
period: 'string'
successThreshold: int
timeout: 'string'
}
model: {
referenceType: 'string'
// For remaining properties, see AssetReferenceBase objects
}
properties: {
{customized property}: 'string'
}
requestSettings: {
maxConcurrentRequestsPerInstance: int
maxQueueWait: 'string'
requestTimeout: 'string'
}
scaleSettings: {
maxInstances: int
minInstances: int
scaleType: 'string'
// For remaining properties, see OnlineScaleSettings objects
}
endpointComputeType: 'string'
// For remaining properties, see OnlineDeployment objects
}
tags: {
{customized property}: 'string'
}
}
OnlineScaleSettings 개체
scaleType 속성을 설정하여 개체 유형을 지정합니다.
자동
{
pollingInterval: 'string'
scaleType: 'Auto'
targetUtilizationPercentage: int
}
수동경우 다음을 사용합니다.
{
instanceCount: int
scaleType: 'Manual'
}
OnlineDeployment 개체
endpointComputeType 속성을 설정하여 개체 유형을 지정합니다.
K8S
{
containerResourceRequirements: {
cpu: int
cpuLimit: int
fpga: int
gpu: int
memoryInGB: int
memoryInGBLimit: int
}
endpointComputeType: 'K8S'
}
관리되는경우 다음을 사용합니다.
{
endpointComputeType: 'Managed'
instanceType: 'string'
readinessProbe: {
failureThreshold: int
initialDelay: 'string'
period: 'string'
successThreshold: int
timeout: 'string'
}
}
AssetReferenceBase 개체
referenceType 속성을 설정하여 개체 유형을 지정합니다.
DataPath경우 다음을 사용합니다.
{
datastoreId: 'string'
path: 'string'
referenceType: 'DataPath'
}
ID경우 다음을 사용합니다.
{
assetId: 'string'
referenceType: 'Id'
}
OutputPath경우 다음을 사용합니다.
{
jobId: 'string'
path: 'string'
referenceType: 'OutputPath'
}
속성 값
AssetReferenceBase
이름 | 묘사 | 값 |
---|---|---|
referenceType | DataPathAssetReference |
'DataPath' 'Id' 'OutputPath'(필수) |
AutoScaleSettings
이름 | 묘사 | 값 |
---|---|---|
pollingInterval | ISO 8691 형식의 폴링 간격입니다. 전체 자릿수가 초인 기간만 지원합니다. | 문자열 |
scaleType | [필수] 배포 크기 조정 알고리즘의 유형 | 'Auto'(필수) |
targetUtilizationPercentage | 자동 크기 조정기용 대상 CPU 사용량입니다. | int |
CodeConfiguration
이름 | 묘사 | 값 |
---|---|---|
codeId | 코드 자산의 ARM 리소스 ID입니다. | 문자열 |
scoringScript | [필수] 시작할 때 실행할 스크립트입니다. 예. "score.py" | 문자열 제약 조건: 최소 길이 = 1 패턴 = [a-zA-Z0-9_] (필수) |
ContainerResourceRequirements
이름 | 묘사 | 값 |
---|---|---|
cpu(cpu) | 컨테이너에서 사용할 최소 CPU 코어 양입니다. 추가 정보: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
int |
cpuLimit | 컨테이너에서 사용할 수 있는 최대 CPU 코어 양입니다. 추가 정보: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
int |
fpga | 컨테이너에 노출된 FPGA PCIE 디바이스의 수입니다. 2의 배수여야 합니다. | int |
gpu | 컨테이너의 GPU 코어 수입니다. | int |
memoryInGB | 컨테이너에서 사용할 최소 메모리 양(GB)입니다. 추가 정보: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
int |
memoryInGBLimit | 컨테이너에서 사용할 수 있는 최대 메모리 양(GB)입니다. 추가 정보: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
int |
DataPathAssetReference
이름 | 묘사 | 값 |
---|---|---|
datastoreId | 자산이 있는 데이터 저장소의 ARM 리소스 ID입니다. | 문자열 |
길 | 데이터 저장소의 파일/디렉터리의 경로입니다. | 문자열 |
referenceType | [필수] 자산 참조의 형식을 지정합니다. | 'DataPath'(필수) |
IdAssetReference
이름 | 묘사 | 값 |
---|---|---|
assetId | [필수] 자산의 ARM 리소스 ID입니다. | 문자열 제약 조건: 패턴 = [a-zA-Z0-9_] (필수) |
referenceType | [필수] 자산 참조의 형식을 지정합니다. | 'Id'(필수) |
K8SOnlineDeployment
이름 | 묘사 | 값 |
---|---|---|
containerResourceRequirements | 온라인 배포 내의 각 컨테이너 인스턴스에 대한 리소스 요구 사항입니다. | ContainerResourceRequirements |
endpointComputeType | [필수] 엔드포인트의 컴퓨팅 형식입니다. | 'K8S'(필수) |
ManagedOnlineDeployment
이름 | 묘사 | 값 |
---|---|---|
endpointComputeType | [필수] 엔드포인트의 컴퓨팅 형식입니다. | 'Managed'(필수) |
instanceType | 컴퓨팅 인스턴스 유형입니다. | 문자열 |
readinessProbe | 배포 컨테이너 활동성/준비 상태 프로브 구성. | ProbeSettings |
ManualScaleSettings
이름 | 묘사 | 값 |
---|---|---|
instanceCount | 이 배포에 대한 인스턴스 수가 수정되었습니다. | int |
scaleType | [필수] 배포 크기 조정 알고리즘의 유형 | 'Manual'(필수) |
Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments
이름 | 묘사 | 값 |
---|---|---|
신원 | 리소스와 연결된 서비스 ID입니다. | ResourceIdentity |
종류 | 포털/도구/등에서 동일한 형식의 리소스에 대해 다른 UX 환경을 렌더링하는 데 사용되는 메타데이터입니다. | 문자열 |
위치 | 리소스가 있는 지리적 위치 | string(필수) |
이름 | 리소스 이름 | 문자열 제약 조건: 패턴 = ^[a-zA-Z0-9][a-zA-Z0-9\-_]{0,254}$ (필수) |
부모 | Bicep에서 자식 리소스에 대한 부모 리소스를 지정할 수 있습니다. 자식 리소스가 부모 리소스 외부에서 선언된 경우에만 이 속성을 추가해야 합니다. 자세한 내용은 부모 리소스외부의 자식 리소스 |
형식 리소스의 기호 이름: 작업 영역/onlineEndpoints |
속성 | [필수] 엔터티의 추가 특성입니다. | OnlineDeployment(필수) |
태그 | 리소스 태그 | 태그 이름 및 값의 사전입니다. 템플릿 |
OnlineDeployment
이름 | 묘사 | 값 |
---|---|---|
appInsightsEnabled | true이면 Application Insights 로깅을 사용하도록 설정합니다. | bool |
codeConfiguration | 엔드포인트 배포에 대한 코드 구성입니다. | codeConfiguration |
묘사 | 엔드포인트 배포에 대한 설명입니다. | 문자열 |
endpointComputeType | K8SOnlineDeployment |
'K8S' 'Managed'(필수) |
environmentId | 엔드포인트 배포에 대한 환경 사양의 ARM 리소스 ID입니다. | 문자열 |
environmentVariables | 배포에 대한 환경 변수 구성입니다. | OnlineDeploymentEnvironmentVariables |
livenessProbe | 배포 컨테이너 활동성/준비 상태 프로브 구성. | ProbeSettings |
모델 | 엔드포인트 배포에 대한 모델 자산에 대한 참조입니다. | assetReferenceBase |
속성 | 속성 사전입니다. 속성을 추가할 수 있지만 제거하거나 변경할 수는 없습니다. | OnlineDeploymentProperties |
requestSettings | 온라인 배포 점수 매기기 요청 구성 | OnlineRequestSettings |
scaleSettings | 온라인 배포 크기 조정 구성. | OnlineScaleSettings |
OnlineDeploymentEnvironmentVariables
이름 | 묘사 | 값 |
---|
OnlineDeploymentProperties
이름 | 묘사 | 값 |
---|
OnlineRequestSettings
이름 | 묘사 | 값 |
---|---|---|
maxConcurrentRequestsPerInstance | 이 배포에 대해 한 번에 큐에 대기할 수 있는 요청 수입니다. | int |
maxQueueWait | ISO 8601 형식의 최대 큐 대기 시간입니다. 밀리초 정밀도를 지원합니다. | 문자열 |
requestTimeout | ISO 8601 형식의 요청 시간 제한입니다. 밀리초 정밀도를 지원합니다. | 문자열 |
OnlineScaleSettings
이름 | 묘사 | 값 |
---|---|---|
maxInstances | 이 배포의 최대 인스턴스 수입니다. | int |
minInstances | 이 배포에 대한 최소 인스턴스 수입니다. | int |
scaleType | AutoScaleSettings |
'Auto' 'Manual'(필수) |
OutputPathAssetReference
이름 | 묘사 | 값 |
---|---|---|
jobId | 작업의 ARM 리소스 ID입니다. | 문자열 |
길 | 작업 출력에 있는 파일/디렉터리의 경로입니다. | 문자열 |
referenceType | [필수] 자산 참조의 형식을 지정합니다. | 'OutputPath'(필수) |
ProbeSettings
이름 | 묘사 | 값 |
---|---|---|
failureThreshold | 비정상 상태를 반환하기 전에 허용할 실패 횟수입니다. | int |
initialDelay | ISO 8601 형식의 첫 번째 프로브 앞의 지연입니다. | 문자열 |
마침표 | ISO 8601 형식의 프로브 간 시간입니다. | 문자열 |
successThreshold | 정상 상태를 반환하기 전에 성공한 프로브의 수입니다. | int |
타임 아웃 | ISO 8601 형식의 프로브 시간 제한입니다. | 문자열 |
ResourceIdentity
이름 | 묘사 | 값 |
---|---|---|
형 | ResourceIdentity 형식의 값을 정의합니다. | 'None' 'SystemAssigned' 'SystemAssigned,UserAssigned' 'UserAssigned' |
userAssignedIdentities | 사용자 할당 ID의 사전, 키는 UAI의 ARM 리소스 ID입니다. | resourceIdentityUserAssignedIdentities |
ResourceIdentityUserAssignedIdentities
이름 | 묘사 | 값 |
---|
TrackedResourceTags
이름 | 묘사 | 값 |
---|
UserAssignedIdentityMeta
이름 | 묘사 | 값 |
---|---|---|
clientId | Aka 애플리케이션 ID는 초기 프로비저닝 중에 애플리케이션 및 서비스 주체에 연결된 Azure AD에서 생성된 고유 식별자입니다. | 문자열 |
principalId | Azure 리소스에 대한 역할 기반 액세스 권한을 부여하는 데 사용되는 관리 ID에 대한 서비스 주체 개체의 개체 ID입니다. | 문자열 |
ARM 템플릿 리소스 정의
작업 영역/onlineEndpoints/deployments 리소스 종류는 다음을 대상으로 하는 작업으로 배포할 수 있습니다.
- 리소스 그룹 - 리소스 그룹 배포 명령 참조
각 API 버전에서 변경된 속성 목록은 변경 로그참조하세요.
리소스 형식
Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments 리소스를 만들려면 템플릿에 다음 JSON을 추가합니다.
{
"type": "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments",
"apiVersion": "2021-03-01-preview",
"name": "string",
"identity": {
"type": "string",
"userAssignedIdentities": {
"{customized property}": {
"clientId": "string",
"principalId": "string"
}
}
},
"kind": "string",
"location": "string",
"properties": {
"appInsightsEnabled": "bool",
"codeConfiguration": {
"codeId": "string",
"scoringScript": "string"
},
"description": "string",
"environmentId": "string",
"environmentVariables": {
"{customized property}": "string"
},
"livenessProbe": {
"failureThreshold": "int",
"initialDelay": "string",
"period": "string",
"successThreshold": "int",
"timeout": "string"
},
"model": {
"referenceType": "string"
// For remaining properties, see AssetReferenceBase objects
},
"properties": {
"{customized property}": "string"
},
"requestSettings": {
"maxConcurrentRequestsPerInstance": "int",
"maxQueueWait": "string",
"requestTimeout": "string"
},
"scaleSettings": {
"maxInstances": "int",
"minInstances": "int",
"scaleType": "string"
// For remaining properties, see OnlineScaleSettings objects
},
"endpointComputeType": "string"
// For remaining properties, see OnlineDeployment objects
},
"tags": {
"{customized property}": "string"
}
}
OnlineScaleSettings 개체
scaleType 속성을 설정하여 개체 유형을 지정합니다.
자동
{
"pollingInterval": "string",
"scaleType": "Auto",
"targetUtilizationPercentage": "int"
}
수동경우 다음을 사용합니다.
{
"instanceCount": "int",
"scaleType": "Manual"
}
OnlineDeployment 개체
endpointComputeType 속성을 설정하여 개체 유형을 지정합니다.
K8S
{
"containerResourceRequirements": {
"cpu": "int",
"cpuLimit": "int",
"fpga": "int",
"gpu": "int",
"memoryInGB": "int",
"memoryInGBLimit": "int"
},
"endpointComputeType": "K8S"
}
관리되는경우 다음을 사용합니다.
{
"endpointComputeType": "Managed",
"instanceType": "string",
"readinessProbe": {
"failureThreshold": "int",
"initialDelay": "string",
"period": "string",
"successThreshold": "int",
"timeout": "string"
}
}
AssetReferenceBase 개체
referenceType 속성을 설정하여 개체 유형을 지정합니다.
DataPath경우 다음을 사용합니다.
{
"datastoreId": "string",
"path": "string",
"referenceType": "DataPath"
}
ID경우 다음을 사용합니다.
{
"assetId": "string",
"referenceType": "Id"
}
OutputPath경우 다음을 사용합니다.
{
"jobId": "string",
"path": "string",
"referenceType": "OutputPath"
}
속성 값
AssetReferenceBase
이름 | 묘사 | 값 |
---|---|---|
referenceType | DataPathAssetReference |
'DataPath' 'Id' 'OutputPath'(필수) |
AutoScaleSettings
이름 | 묘사 | 값 |
---|---|---|
pollingInterval | ISO 8691 형식의 폴링 간격입니다. 전체 자릿수가 초인 기간만 지원합니다. | 문자열 |
scaleType | [필수] 배포 크기 조정 알고리즘의 유형 | 'Auto'(필수) |
targetUtilizationPercentage | 자동 크기 조정기용 대상 CPU 사용량입니다. | int |
CodeConfiguration
이름 | 묘사 | 값 |
---|---|---|
codeId | 코드 자산의 ARM 리소스 ID입니다. | 문자열 |
scoringScript | [필수] 시작할 때 실행할 스크립트입니다. 예. "score.py" | 문자열 제약 조건: 최소 길이 = 1 패턴 = [a-zA-Z0-9_] (필수) |
ContainerResourceRequirements
이름 | 묘사 | 값 |
---|---|---|
cpu(cpu) | 컨테이너에서 사용할 최소 CPU 코어 양입니다. 추가 정보: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
int |
cpuLimit | 컨테이너에서 사용할 수 있는 최대 CPU 코어 양입니다. 추가 정보: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
int |
fpga | 컨테이너에 노출된 FPGA PCIE 디바이스의 수입니다. 2의 배수여야 합니다. | int |
gpu | 컨테이너의 GPU 코어 수입니다. | int |
memoryInGB | 컨테이너에서 사용할 최소 메모리 양(GB)입니다. 추가 정보: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
int |
memoryInGBLimit | 컨테이너에서 사용할 수 있는 최대 메모리 양(GB)입니다. 추가 정보: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
int |
DataPathAssetReference
이름 | 묘사 | 값 |
---|---|---|
datastoreId | 자산이 있는 데이터 저장소의 ARM 리소스 ID입니다. | 문자열 |
길 | 데이터 저장소의 파일/디렉터리의 경로입니다. | 문자열 |
referenceType | [필수] 자산 참조의 형식을 지정합니다. | 'DataPath'(필수) |
IdAssetReference
이름 | 묘사 | 값 |
---|---|---|
assetId | [필수] 자산의 ARM 리소스 ID입니다. | 문자열 제약 조건: 패턴 = [a-zA-Z0-9_] (필수) |
referenceType | [필수] 자산 참조의 형식을 지정합니다. | 'Id'(필수) |
K8SOnlineDeployment
이름 | 묘사 | 값 |
---|---|---|
containerResourceRequirements | 온라인 배포 내의 각 컨테이너 인스턴스에 대한 리소스 요구 사항입니다. | ContainerResourceRequirements |
endpointComputeType | [필수] 엔드포인트의 컴퓨팅 형식입니다. | 'K8S'(필수) |
ManagedOnlineDeployment
이름 | 묘사 | 값 |
---|---|---|
endpointComputeType | [필수] 엔드포인트의 컴퓨팅 형식입니다. | 'Managed'(필수) |
instanceType | 컴퓨팅 인스턴스 유형입니다. | 문자열 |
readinessProbe | 배포 컨테이너 활동성/준비 상태 프로브 구성. | ProbeSettings |
ManualScaleSettings
이름 | 묘사 | 값 |
---|---|---|
instanceCount | 이 배포에 대한 인스턴스 수가 수정되었습니다. | int |
scaleType | [필수] 배포 크기 조정 알고리즘의 유형 | 'Manual'(필수) |
Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments
이름 | 묘사 | 값 |
---|---|---|
apiVersion | api 버전 | '2021-03-01-preview' |
신원 | 리소스와 연결된 서비스 ID입니다. | ResourceIdentity |
종류 | 포털/도구/등에서 동일한 형식의 리소스에 대해 다른 UX 환경을 렌더링하는 데 사용되는 메타데이터입니다. | 문자열 |
위치 | 리소스가 있는 지리적 위치 | string(필수) |
이름 | 리소스 이름 | 문자열 제약 조건: 패턴 = ^[a-zA-Z0-9][a-zA-Z0-9\-_]{0,254}$ (필수) |
속성 | [필수] 엔터티의 추가 특성입니다. | OnlineDeployment(필수) |
태그 | 리소스 태그 | 태그 이름 및 값의 사전입니다. 템플릿 |
형 | 리소스 종류 | 'Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments' |
OnlineDeployment
이름 | 묘사 | 값 |
---|---|---|
appInsightsEnabled | true이면 Application Insights 로깅을 사용하도록 설정합니다. | bool |
codeConfiguration | 엔드포인트 배포에 대한 코드 구성입니다. | codeConfiguration |
묘사 | 엔드포인트 배포에 대한 설명입니다. | 문자열 |
endpointComputeType | K8SOnlineDeployment |
'K8S' 'Managed'(필수) |
environmentId | 엔드포인트 배포에 대한 환경 사양의 ARM 리소스 ID입니다. | 문자열 |
environmentVariables | 배포에 대한 환경 변수 구성입니다. | OnlineDeploymentEnvironmentVariables |
livenessProbe | 배포 컨테이너 활동성/준비 상태 프로브 구성. | ProbeSettings |
모델 | 엔드포인트 배포에 대한 모델 자산에 대한 참조입니다. | assetReferenceBase |
속성 | 속성 사전입니다. 속성을 추가할 수 있지만 제거하거나 변경할 수는 없습니다. | OnlineDeploymentProperties |
requestSettings | 온라인 배포 점수 매기기 요청 구성 | OnlineRequestSettings |
scaleSettings | 온라인 배포 크기 조정 구성. | OnlineScaleSettings |
OnlineDeploymentEnvironmentVariables
이름 | 묘사 | 값 |
---|
OnlineDeploymentProperties
이름 | 묘사 | 값 |
---|
OnlineRequestSettings
이름 | 묘사 | 값 |
---|---|---|
maxConcurrentRequestsPerInstance | 이 배포에 대해 한 번에 큐에 대기할 수 있는 요청 수입니다. | int |
maxQueueWait | ISO 8601 형식의 최대 큐 대기 시간입니다. 밀리초 정밀도를 지원합니다. | 문자열 |
requestTimeout | ISO 8601 형식의 요청 시간 제한입니다. 밀리초 정밀도를 지원합니다. | 문자열 |
OnlineScaleSettings
이름 | 묘사 | 값 |
---|---|---|
maxInstances | 이 배포의 최대 인스턴스 수입니다. | int |
minInstances | 이 배포에 대한 최소 인스턴스 수입니다. | int |
scaleType | AutoScaleSettings |
'Auto' 'Manual'(필수) |
OutputPathAssetReference
이름 | 묘사 | 값 |
---|---|---|
jobId | 작업의 ARM 리소스 ID입니다. | 문자열 |
길 | 작업 출력에 있는 파일/디렉터리의 경로입니다. | 문자열 |
referenceType | [필수] 자산 참조의 형식을 지정합니다. | 'OutputPath'(필수) |
ProbeSettings
이름 | 묘사 | 값 |
---|---|---|
failureThreshold | 비정상 상태를 반환하기 전에 허용할 실패 횟수입니다. | int |
initialDelay | ISO 8601 형식의 첫 번째 프로브 앞의 지연입니다. | 문자열 |
마침표 | ISO 8601 형식의 프로브 간 시간입니다. | 문자열 |
successThreshold | 정상 상태를 반환하기 전에 성공한 프로브의 수입니다. | int |
타임 아웃 | ISO 8601 형식의 프로브 시간 제한입니다. | 문자열 |
ResourceIdentity
이름 | 묘사 | 값 |
---|---|---|
형 | ResourceIdentity 형식의 값을 정의합니다. | 'None' 'SystemAssigned' 'SystemAssigned,UserAssigned' 'UserAssigned' |
userAssignedIdentities | 사용자 할당 ID의 사전, 키는 UAI의 ARM 리소스 ID입니다. | resourceIdentityUserAssignedIdentities |
ResourceIdentityUserAssignedIdentities
이름 | 묘사 | 값 |
---|
TrackedResourceTags
이름 | 묘사 | 값 |
---|
UserAssignedIdentityMeta
이름 | 묘사 | 값 |
---|---|---|
clientId | Aka 애플리케이션 ID는 초기 프로비저닝 중에 애플리케이션 및 서비스 주체에 연결된 Azure AD에서 생성된 고유 식별자입니다. | 문자열 |
principalId | Azure 리소스에 대한 역할 기반 액세스 권한을 부여하는 데 사용되는 관리 ID에 대한 서비스 주체 개체의 개체 ID입니다. | 문자열 |
사용 예제
Terraform(AzAPI 공급자) 리소스 정의
작업 영역/onlineEndpoints/deployments 리소스 종류는 다음을 대상으로 하는 작업으로 배포할 수 있습니다.
- 리소스 그룹
각 API 버전에서 변경된 속성 목록은 변경 로그참조하세요.
리소스 형식
Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments 리소스를 만들려면 템플릿에 다음 Terraform을 추가합니다.
resource "azapi_resource" "symbolicname" {
type = "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2021-03-01-preview"
name = "string"
identity = {
type = "string"
userAssignedIdentities = {
{customized property} = {
clientId = "string"
principalId = "string"
}
}
}
kind = "string"
location = "string"
tags = {
{customized property} = "string"
}
body = jsonencode({
properties = {
appInsightsEnabled = bool
codeConfiguration = {
codeId = "string"
scoringScript = "string"
}
description = "string"
environmentId = "string"
environmentVariables = {
{customized property} = "string"
}
livenessProbe = {
failureThreshold = int
initialDelay = "string"
period = "string"
successThreshold = int
timeout = "string"
}
model = {
referenceType = "string"
// For remaining properties, see AssetReferenceBase objects
}
properties = {
{customized property} = "string"
}
requestSettings = {
maxConcurrentRequestsPerInstance = int
maxQueueWait = "string"
requestTimeout = "string"
}
scaleSettings = {
maxInstances = int
minInstances = int
scaleType = "string"
// For remaining properties, see OnlineScaleSettings objects
}
endpointComputeType = "string"
// For remaining properties, see OnlineDeployment objects
}
})
}
OnlineScaleSettings 개체
scaleType 속성을 설정하여 개체 유형을 지정합니다.
자동
{
pollingInterval = "string"
scaleType = "Auto"
targetUtilizationPercentage = int
}
수동경우 다음을 사용합니다.
{
instanceCount = int
scaleType = "Manual"
}
OnlineDeployment 개체
endpointComputeType 속성을 설정하여 개체 유형을 지정합니다.
K8S
{
containerResourceRequirements = {
cpu = int
cpuLimit = int
fpga = int
gpu = int
memoryInGB = int
memoryInGBLimit = int
}
endpointComputeType = "K8S"
}
관리되는경우 다음을 사용합니다.
{
endpointComputeType = "Managed"
instanceType = "string"
readinessProbe = {
failureThreshold = int
initialDelay = "string"
period = "string"
successThreshold = int
timeout = "string"
}
}
AssetReferenceBase 개체
referenceType 속성을 설정하여 개체 유형을 지정합니다.
DataPath경우 다음을 사용합니다.
{
datastoreId = "string"
path = "string"
referenceType = "DataPath"
}
ID경우 다음을 사용합니다.
{
assetId = "string"
referenceType = "Id"
}
OutputPath경우 다음을 사용합니다.
{
jobId = "string"
path = "string"
referenceType = "OutputPath"
}
속성 값
AssetReferenceBase
이름 | 묘사 | 값 |
---|---|---|
referenceType | DataPathAssetReference |
'DataPath' 'Id' 'OutputPath'(필수) |
AutoScaleSettings
이름 | 묘사 | 값 |
---|---|---|
pollingInterval | ISO 8691 형식의 폴링 간격입니다. 전체 자릿수가 초인 기간만 지원합니다. | 문자열 |
scaleType | [필수] 배포 크기 조정 알고리즘의 유형 | 'Auto'(필수) |
targetUtilizationPercentage | 자동 크기 조정기용 대상 CPU 사용량입니다. | int |
CodeConfiguration
이름 | 묘사 | 값 |
---|---|---|
codeId | 코드 자산의 ARM 리소스 ID입니다. | 문자열 |
scoringScript | [필수] 시작할 때 실행할 스크립트입니다. 예. "score.py" | 문자열 제약 조건: 최소 길이 = 1 패턴 = [a-zA-Z0-9_] (필수) |
ContainerResourceRequirements
이름 | 묘사 | 값 |
---|---|---|
cpu(cpu) | 컨테이너에서 사용할 최소 CPU 코어 양입니다. 추가 정보: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
int |
cpuLimit | 컨테이너에서 사용할 수 있는 최대 CPU 코어 양입니다. 추가 정보: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
int |
fpga | 컨테이너에 노출된 FPGA PCIE 디바이스의 수입니다. 2의 배수여야 합니다. | int |
gpu | 컨테이너의 GPU 코어 수입니다. | int |
memoryInGB | 컨테이너에서 사용할 최소 메모리 양(GB)입니다. 추가 정보: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
int |
memoryInGBLimit | 컨테이너에서 사용할 수 있는 최대 메모리 양(GB)입니다. 추가 정보: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
int |
DataPathAssetReference
이름 | 묘사 | 값 |
---|---|---|
datastoreId | 자산이 있는 데이터 저장소의 ARM 리소스 ID입니다. | 문자열 |
길 | 데이터 저장소의 파일/디렉터리의 경로입니다. | 문자열 |
referenceType | [필수] 자산 참조의 형식을 지정합니다. | 'DataPath'(필수) |
IdAssetReference
이름 | 묘사 | 값 |
---|---|---|
assetId | [필수] 자산의 ARM 리소스 ID입니다. | 문자열 제약 조건: 패턴 = [a-zA-Z0-9_] (필수) |
referenceType | [필수] 자산 참조의 형식을 지정합니다. | 'Id'(필수) |
K8SOnlineDeployment
이름 | 묘사 | 값 |
---|---|---|
containerResourceRequirements | 온라인 배포 내의 각 컨테이너 인스턴스에 대한 리소스 요구 사항입니다. | ContainerResourceRequirements |
endpointComputeType | [필수] 엔드포인트의 컴퓨팅 형식입니다. | 'K8S'(필수) |
ManagedOnlineDeployment
이름 | 묘사 | 값 |
---|---|---|
endpointComputeType | [필수] 엔드포인트의 컴퓨팅 형식입니다. | 'Managed'(필수) |
instanceType | 컴퓨팅 인스턴스 유형입니다. | 문자열 |
readinessProbe | 배포 컨테이너 활동성/준비 상태 프로브 구성. | ProbeSettings |
ManualScaleSettings
이름 | 묘사 | 값 |
---|---|---|
instanceCount | 이 배포에 대한 인스턴스 수가 수정되었습니다. | int |
scaleType | [필수] 배포 크기 조정 알고리즘의 유형 | 'Manual'(필수) |
Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments
이름 | 묘사 | 값 |
---|---|---|
신원 | 리소스와 연결된 서비스 ID입니다. | ResourceIdentity |
종류 | 포털/도구/등에서 동일한 형식의 리소스에 대해 다른 UX 환경을 렌더링하는 데 사용되는 메타데이터입니다. | 문자열 |
위치 | 리소스가 있는 지리적 위치 | string(필수) |
이름 | 리소스 이름 | 문자열 제약 조건: 패턴 = ^[a-zA-Z0-9][a-zA-Z0-9\-_]{0,254}$ (필수) |
parent_id | 이 리소스의 부모인 리소스의 ID입니다. | 형식의 리소스 ID: 작업 영역/onlineEndpoints |
속성 | [필수] 엔터티의 추가 특성입니다. | OnlineDeployment(필수) |
태그 | 리소스 태그 | 태그 이름 및 값의 사전입니다. |
형 | 리소스 종류 | "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2021-03-01-preview" |
OnlineDeployment
이름 | 묘사 | 값 |
---|---|---|
appInsightsEnabled | true이면 Application Insights 로깅을 사용하도록 설정합니다. | bool |
codeConfiguration | 엔드포인트 배포에 대한 코드 구성입니다. | codeConfiguration |
묘사 | 엔드포인트 배포에 대한 설명입니다. | 문자열 |
endpointComputeType | K8SOnlineDeployment |
'K8S' 'Managed'(필수) |
environmentId | 엔드포인트 배포에 대한 환경 사양의 ARM 리소스 ID입니다. | 문자열 |
environmentVariables | 배포에 대한 환경 변수 구성입니다. | OnlineDeploymentEnvironmentVariables |
livenessProbe | 배포 컨테이너 활동성/준비 상태 프로브 구성. | ProbeSettings |
모델 | 엔드포인트 배포에 대한 모델 자산에 대한 참조입니다. | assetReferenceBase |
속성 | 속성 사전입니다. 속성을 추가할 수 있지만 제거하거나 변경할 수는 없습니다. | OnlineDeploymentProperties |
requestSettings | 온라인 배포 점수 매기기 요청 구성 | OnlineRequestSettings |
scaleSettings | 온라인 배포 크기 조정 구성. | OnlineScaleSettings |
OnlineDeploymentEnvironmentVariables
이름 | 묘사 | 값 |
---|
OnlineDeploymentProperties
이름 | 묘사 | 값 |
---|
OnlineRequestSettings
이름 | 묘사 | 값 |
---|---|---|
maxConcurrentRequestsPerInstance | 이 배포에 대해 한 번에 큐에 대기할 수 있는 요청 수입니다. | int |
maxQueueWait | ISO 8601 형식의 최대 큐 대기 시간입니다. 밀리초 정밀도를 지원합니다. | 문자열 |
requestTimeout | ISO 8601 형식의 요청 시간 제한입니다. 밀리초 정밀도를 지원합니다. | 문자열 |
OnlineScaleSettings
이름 | 묘사 | 값 |
---|---|---|
maxInstances | 이 배포의 최대 인스턴스 수입니다. | int |
minInstances | 이 배포에 대한 최소 인스턴스 수입니다. | int |
scaleType | AutoScaleSettings |
'Auto' 'Manual'(필수) |
OutputPathAssetReference
이름 | 묘사 | 값 |
---|---|---|
jobId | 작업의 ARM 리소스 ID입니다. | 문자열 |
길 | 작업 출력에 있는 파일/디렉터리의 경로입니다. | 문자열 |
referenceType | [필수] 자산 참조의 형식을 지정합니다. | 'OutputPath'(필수) |
ProbeSettings
이름 | 묘사 | 값 |
---|---|---|
failureThreshold | 비정상 상태를 반환하기 전에 허용할 실패 횟수입니다. | int |
initialDelay | ISO 8601 형식의 첫 번째 프로브 앞의 지연입니다. | 문자열 |
마침표 | ISO 8601 형식의 프로브 간 시간입니다. | 문자열 |
successThreshold | 정상 상태를 반환하기 전에 성공한 프로브의 수입니다. | int |
타임 아웃 | ISO 8601 형식의 프로브 시간 제한입니다. | 문자열 |
ResourceIdentity
이름 | 묘사 | 값 |
---|---|---|
형 | ResourceIdentity 형식의 값을 정의합니다. | 'None' 'SystemAssigned' 'SystemAssigned,UserAssigned' 'UserAssigned' |
userAssignedIdentities | 사용자 할당 ID의 사전, 키는 UAI의 ARM 리소스 ID입니다. | resourceIdentityUserAssignedIdentities |
ResourceIdentityUserAssignedIdentities
이름 | 묘사 | 값 |
---|
TrackedResourceTags
이름 | 묘사 | 값 |
---|
UserAssignedIdentityMeta
이름 | 묘사 | 값 |
---|---|---|
clientId | Aka 애플리케이션 ID는 초기 프로비저닝 중에 애플리케이션 및 서비스 주체에 연결된 Azure AD에서 생성된 고유 식별자입니다. | 문자열 |
principalId | Azure 리소스에 대한 역할 기반 액세스 권한을 부여하는 데 사용되는 관리 ID에 대한 서비스 주체 개체의 개체 ID입니다. | 문자열 |