다음을 통해 공유


Microsoft.MachineLearningServices 작업 영역/onlineEndpoints/deployments 2023-06-01-preview

Bicep 리소스 정의

작업 영역/onlineEndpoints/deployments 리소스 종류는 다음을 대상으로 하는 작업으로 배포할 수 있습니다.

각 API 버전에서 변경된 속성 목록은 변경 로그참조하세요.

리소스 형식

Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments 리소스를 만들려면 템플릿에 다음 Bicep을 추가합니다.

resource symbolicname 'Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2023-06-01-preview' = {
  parent: resourceSymbolicName
  identity: {
    type: 'string'
    userAssignedIdentities: {
      {customized property}: {}
    }
  }
  kind: 'string'
  location: 'string'
  name: 'string'
  properties: {
    appInsightsEnabled: bool
    codeConfiguration: {
      codeId: 'string'
      scoringScript: 'string'
    }
    dataCollector: {
      collections: {
        {customized property}: {
          clientId: 'string'
          dataCollectionMode: 'string'
          dataId: 'string'
          samplingRate: int
        }
      }
      requestLogging: {
        captureHeaders: [
          'string'
        ]
      }
      rollingRate: 'string'
    }
    description: 'string'
    egressPublicNetworkAccess: 'string'
    environmentId: 'string'
    environmentVariables: {
      {customized property}: 'string'
    }
    instanceType: 'string'
    livenessProbe: {
      failureThreshold: int
      initialDelay: 'string'
      period: 'string'
      successThreshold: int
      timeout: 'string'
    }
    model: 'string'
    modelMountPath: 'string'
    properties: {
      {customized property}: 'string'
    }
    readinessProbe: {
      failureThreshold: int
      initialDelay: 'string'
      period: 'string'
      successThreshold: int
      timeout: 'string'
    }
    requestSettings: {
      maxConcurrentRequestsPerInstance: int
      maxQueueWait: 'string'
      requestTimeout: 'string'
    }
    scaleSettings: {
      scaleType: 'string'
      // For remaining properties, see OnlineScaleSettings objects
    }
    endpointComputeType: 'string'
    // For remaining properties, see OnlineDeploymentProperties objects
  }
  sku: {
    capacity: int
    family: 'string'
    name: 'string'
    size: 'string'
    tier: 'string'
  }
  tags: {
    {customized property}: 'string'
  }
}

OnlineScaleSettings 개체

scaleType 속성을 설정하여 개체 유형을 지정합니다.

기본경우 다음을 사용합니다.

{
  scaleType: 'Default'
}

TargetUtilization경우 다음을 사용합니다.

{
  maxInstances: int
  minInstances: int
  pollingInterval: 'string'
  scaleType: 'TargetUtilization'
  targetUtilizationPercentage: int
}

OnlineDeploymentProperties 개체

endpointComputeType 속성을 설정하여 개체 유형을 지정합니다.

kubernetes경우 다음을 사용합니다.

{
  containerResourceRequirements: {
    containerResourceLimits: {
      cpu: 'string'
      gpu: 'string'
      memory: 'string'
    }
    containerResourceRequests: {
      cpu: 'string'
      gpu: 'string'
      memory: 'string'
    }
  }
  endpointComputeType: 'Kubernetes'
}

관리되는경우 다음을 사용합니다.

{
  endpointComputeType: 'Managed'
}

속성 값

CodeConfiguration

이름 묘사
codeId 코드 자산의 ARM 리소스 ID입니다. 문자열
scoringScript [필수] 시작할 때 실행할 스크립트입니다. 예. "score.py" 문자열

제약 조건:
최소 길이 = 1
패턴 = [a-zA-Z0-9_](필수)

수집

이름 묘사
clientId Blob Storage에 대한 로깅을 수집하는 데 사용되는 msi 클라이언트 ID입니다. null인 경우 백 엔드는 인증할 등록된 엔드포인트 ID를 선택합니다. 문자열
dataCollectionMode 데이터 수집을 사용하거나 사용하지 않도록 설정합니다. '사용 안 함'
'Enabled'
dataId 데이터 자산 arm 리소스 ID입니다. 클라이언트 쪽에서는 데이터 자산이 Blob Storage를 가리키도록 하고 백 엔드는 Blob Storage에 데이터를 수집합니다. 문자열
samplingRate 컬렉션에 대한 샘플링 속도입니다. 샘플링 속도 1.0은 기본적으로 100% 데이터를 수집한다는 것을 의미합니다. int

ContainerResourceRequirements

이름 묘사
containerResourceLimits 컨테이너 리소스 제한 정보: ContainerResourceSettings
containerResourceRequests 컨테이너 리소스 요청 정보: ContainerResourceSettings

ContainerResourceSettings

이름 묘사
cpu(cpu) 컨테이너에 대한 vCPU 요청/제한 수입니다. 추가 정보:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
문자열
gpu 컨테이너에 대한 Nvidia GPU 카드 요청/제한 수입니다. 추가 정보:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
문자열
기억 컨테이너에 대한 메모리 크기 요청/제한입니다. 추가 정보:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
문자열

DataCollector

이름 묘사
컬렉션 [필수] 컬렉션 구성입니다. 각 컬렉션에는 모델 데이터를 수집하기 위한 자체 구성이 있으며 컬렉션 이름은 임의의 문자열일 수 있습니다.
모델 데이터 수집기는 페이로드 로깅 또는 사용자 지정 로깅 또는 둘 다에 사용할 수 있습니다. 컬렉션 요청 및 응답은 페이로드 로깅을 위해 예약되고, 다른 요청은 사용자 지정 로깅용입니다.
DataCollectorCollections(필수)
requestLogging mdc에 대한 요청 로깅 구성에는 모든 컬렉션에 대한 고급 로깅 설정이 포함됩니다. 선택 사항입니다. RequestLogging
rollingRate 모델 데이터가 Blob Storage에 수집되는 경우 단일 Blob 파일에서 모든 데이터를 로깅하지 않도록 데이터를 다른 경로로 롤백해야 합니다.
롤링 속도가 시간인 경우 모든 데이터가 Blob 경로 /yyyy/MM/dd/HH/에 수집됩니다.
날짜인 경우 모든 데이터가 Blob 경로 /yyyy/MM/dd/에서 수집됩니다.
롤링 경로의 다른 이점은 모델 모니터링 UI가 데이터의 시간 범위를 매우 빠르게 선택할 수 있다는 것입니다.
'Day'
'Hour'
'Minute'
'월'
'Year'

DataCollectorCollections

이름 묘사

DefaultScaleSettings

이름 묘사
scaleType [필수] 배포 크기 조정 알고리즘의 유형 'Default'(필수)

EndpointDeploymentPropertiesBaseEnvironmentVariables

이름 묘사

EndpointDeploymentPropertiesBaseProperties

이름 묘사

KubernetesOnlineDeployment

이름 묘사
containerResourceRequirements 컨테이너(cpu 및 메모리)에 대한 리소스 요구 사항입니다. ContainerResourceRequirements
endpointComputeType [필수] 엔드포인트의 컴퓨팅 형식입니다. 'Kubernetes'(필수)

ManagedOnlineDeployment

이름 묘사
endpointComputeType [필수] 엔드포인트의 컴퓨팅 형식입니다. 'Managed'(필수)

ManagedServiceIdentity

이름 묘사
관리 서비스 ID의 유형입니다(SystemAssigned 및 UserAssigned 형식이 모두 허용되는 경우). 'None'
'SystemAssigned'
'SystemAssigned,UserAssigned'
'UserAssigned'(필수)
userAssignedIdentities 리소스와 연결된 사용자 할당 ID 집합입니다. userAssignedIdentities 사전 키는 '/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName} 형식의 ARM 리소스 ID입니다. 사전 값은 요청에서 빈 개체({})일 수 있습니다. UserAssignedIdentities

Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments

이름 묘사
신원 관리 서비스 ID(시스템 할당 및/또는 사용자 할당 ID) ManagedServiceIdentity
종류 포털/도구/등에서 동일한 형식의 리소스에 대해 다른 UX 환경을 렌더링하는 데 사용되는 메타데이터입니다. 문자열
위치 리소스가 있는 지리적 위치 string(필수)
이름 리소스 이름 문자열

제약 조건:
패턴 = ^[a-zA-Z0-9][a-zA-Z0-9\-_]{0,254}$(필수)
부모 Bicep에서 자식 리소스에 대한 부모 리소스를 지정할 수 있습니다. 자식 리소스가 부모 리소스 외부에서 선언된 경우에만 이 속성을 추가해야 합니다.

자세한 내용은 부모 리소스외부의 자식 리소스 참조하세요.
형식 리소스의 기호 이름: 작업 영역/onlineEndpoints
속성 [필수] 엔터티의 추가 특성입니다. OnlineDeploymentProperties(필수)
sku 자동 크기 조정을 위한 ARM 계약에 필요한 SKU 세부 정보입니다. Sku
태그 리소스 태그 태그 이름 및 값의 사전입니다. 템플릿 태그를 참조하세요.

OnlineDeploymentProperties

이름 묘사
appInsightsEnabled true이면 Application Insights 로깅을 사용하도록 설정합니다. bool
codeConfiguration 엔드포인트 배포에 대한 코드 구성입니다. codeConfiguration
dataCollector mdc 구성은 null일 때 mdc를 사용하지 않도록 설정합니다. DataCollector
묘사 엔드포인트 배포에 대한 설명입니다. 문자열
egressPublicNetworkAccess 사용하도록 설정된 경우 송신 공용 네트워크 액세스를 허용합니다. 사용하지 않도록 설정하면 보안 송신이 생성됩니다. 기본값: 사용 '사용 안 함'
'Enabled'
endpointComputeType KubernetesOnlineDeployment형식에 대해 'Kubernetes'로 설정합니다. ManagedOnlineDeployment형식에 대해 'Managed'로 설정합니다. 'Kubernetes'
'Managed'(필수)
environmentId 엔드포인트 배포에 대한 환경 사양의 ARM 리소스 ID입니다. 문자열
environmentVariables 배포에 대한 환경 변수 구성입니다. EndpointDeploymentPropertiesBaseEnvironmentVariables
instanceType 컴퓨팅 인스턴스 유형입니다. 문자열
livenessProbe 활동성 프로브는 컨테이너의 상태를 정기적으로 모니터링합니다. ProbeSettings
모델 모델의 URI 경로입니다. 문자열
modelMountPath 사용자 지정 컨테이너에 모델을 탑재할 경로입니다. 문자열
속성 속성 사전입니다. 속성을 추가할 수 있지만 제거하거나 변경할 수는 없습니다. EndpointDeploymentPropertiesBaseProperties
readinessProbe 준비 상태 프로브는 컨테이너가 트래픽을 처리할 준비가 되었는지 확인합니다. 속성 및 기본값은 활동성 프로브와 동일합니다. ProbeSettings
requestSettings 배포에 대한 요청 설정입니다. OnlineRequestSettings
scaleSettings 배포에 대한 크기 조정 설정입니다.
null이거나 제공되지 않은 경우
기본적으로 KubernetesOnlineDeployment에 대한 TargetUtilizationScaleSettings로 설정됩니다.
ManagedOnlineDeployment에 대한 DefaultScaleSettings로
OnlineScaleSettings

OnlineRequestSettings

이름 묘사
maxConcurrentRequestsPerInstance 배포당 허용되는 노드당 최대 동시 요청 수입니다. 기본값은 1입니다. int
maxQueueWait 요청이 ISO 8601 형식으로 큐에 유지되는 최대 시간입니다.
기본값은 500ms입니다.
문자열
requestTimeout ISO 8601 형식의 채점 시간 제한입니다.
기본값은 5000ms입니다.
문자열

OnlineScaleSettings

이름 묘사
scaleType DefaultScaleSettings형식에 대해 'Default'로 설정합니다. TargetUtilizationScaleSettings형식 'TargetUtilization'으로 설정합니다. '기본값'
'TargetUtilization'(필수)

ProbeSettings

이름 묘사
failureThreshold 비정상 상태를 반환하기 전에 허용할 실패 횟수입니다. int
initialDelay ISO 8601 형식의 첫 번째 프로브 앞의 지연입니다. 문자열
마침표 ISO 8601 형식의 프로브 간 시간입니다. 문자열
successThreshold 정상 상태를 반환하기 전에 성공한 프로브의 수입니다. int
타임 아웃 ISO 8601 형식의 프로브 시간 제한입니다. 문자열

RequestLogging

이름 묘사
captureHeaders 페이로드 로깅의 경우 기본적으로 페이로드만 수집합니다. 고객이 지정된 헤더를 수집하려는 경우 백 엔드가 페이로드와 함께 해당 헤더를 수집하도록 captureHeaders에서 설정할 수 있습니다. string[]

Sku

이름 묘사
용량 SKU가 스케일 아웃/인을 지원하는 경우 용량 정수가 포함되어야 합니다. 리소스에 대해 스케일 아웃/인이 불가능한 경우 생략할 수 있습니다. int
가족 서비스에 여러 세대의 하드웨어가 있는 경우 동일한 SKU에 대해 여기에서 캡처할 수 있습니다. 문자열
이름 SKU의 이름입니다. 예 - P3. 일반적으로 letter+number 코드입니다. string(필수)
크기 SKU 크기입니다. 이름 필드가 계층과 다른 값의 조합인 경우 독립 실행형 코드입니다. 문자열
계층 이 필드는 서비스에 둘 이상의 계층이 있지만 PUT에는 필요하지 않은 경우 리소스 공급자가 구현해야 합니다. '기본'
'무료'
'프리미엄'
'Standard'

TargetUtilizationScaleSettings

이름 묘사
maxInstances 배포를 확장할 수 있는 최대 인스턴스 수입니다. 할당량은 max_instances 예약됩니다. int
minInstances 항상 존재할 최소 인스턴스 수입니다. int
pollingInterval ISO 8691 형식의 폴링 간격입니다. 전체 자릿수가 초인 기간만 지원합니다. 문자열
scaleType [필수] 배포 크기 조정 알고리즘의 유형 'TargetUtilization'(필수)
targetUtilizationPercentage 자동 크기 조정기용 대상 CPU 사용량입니다. int

TrackedResourceTags

이름 묘사

UserAssignedIdentities

이름 묘사

UserAssignedIdentity

이름 묘사

ARM 템플릿 리소스 정의

작업 영역/onlineEndpoints/deployments 리소스 종류는 다음을 대상으로 하는 작업으로 배포할 수 있습니다.

각 API 버전에서 변경된 속성 목록은 변경 로그참조하세요.

리소스 형식

Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments 리소스를 만들려면 템플릿에 다음 JSON을 추가합니다.

{
  "type": "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments",
  "apiVersion": "2023-06-01-preview",
  "name": "string",
  "identity": {
    "type": "string",
    "userAssignedIdentities": {
      "{customized property}": {
      }
    }
  },
  "kind": "string",
  "location": "string",
  "properties": {
    "appInsightsEnabled": "bool",
    "codeConfiguration": {
      "codeId": "string",
      "scoringScript": "string"
    },
    "dataCollector": {
      "collections": {
        "{customized property}": {
          "clientId": "string",
          "dataCollectionMode": "string",
          "dataId": "string",
          "samplingRate": "int"
        }
      },
      "requestLogging": {
        "captureHeaders": [ "string" ]
      },
      "rollingRate": "string"
    },
    "description": "string",
    "egressPublicNetworkAccess": "string",
    "environmentId": "string",
    "environmentVariables": {
      "{customized property}": "string"
    },
    "instanceType": "string",
    "livenessProbe": {
      "failureThreshold": "int",
      "initialDelay": "string",
      "period": "string",
      "successThreshold": "int",
      "timeout": "string"
    },
    "model": "string",
    "modelMountPath": "string",
    "properties": {
      "{customized property}": "string"
    },
    "readinessProbe": {
      "failureThreshold": "int",
      "initialDelay": "string",
      "period": "string",
      "successThreshold": "int",
      "timeout": "string"
    },
    "requestSettings": {
      "maxConcurrentRequestsPerInstance": "int",
      "maxQueueWait": "string",
      "requestTimeout": "string"
    },
    "scaleSettings": {
      "scaleType": "string"
      // For remaining properties, see OnlineScaleSettings objects
    },
    "endpointComputeType": "string"
    // For remaining properties, see OnlineDeploymentProperties objects
  },
  "sku": {
    "capacity": "int",
    "family": "string",
    "name": "string",
    "size": "string",
    "tier": "string"
  },
  "tags": {
    "{customized property}": "string"
  }
}

OnlineScaleSettings 개체

scaleType 속성을 설정하여 개체 유형을 지정합니다.

기본경우 다음을 사용합니다.

{
  "scaleType": "Default"
}

TargetUtilization경우 다음을 사용합니다.

{
  "maxInstances": "int",
  "minInstances": "int",
  "pollingInterval": "string",
  "scaleType": "TargetUtilization",
  "targetUtilizationPercentage": "int"
}

OnlineDeploymentProperties 개체

endpointComputeType 속성을 설정하여 개체 유형을 지정합니다.

kubernetes경우 다음을 사용합니다.

{
  "containerResourceRequirements": {
    "containerResourceLimits": {
      "cpu": "string",
      "gpu": "string",
      "memory": "string"
    },
    "containerResourceRequests": {
      "cpu": "string",
      "gpu": "string",
      "memory": "string"
    }
  },
  "endpointComputeType": "Kubernetes"
}

관리되는경우 다음을 사용합니다.

{
  "endpointComputeType": "Managed"
}

속성 값

CodeConfiguration

이름 묘사
codeId 코드 자산의 ARM 리소스 ID입니다. 문자열
scoringScript [필수] 시작할 때 실행할 스크립트입니다. 예. "score.py" 문자열

제약 조건:
최소 길이 = 1
패턴 = [a-zA-Z0-9_](필수)

수집

이름 묘사
clientId Blob Storage에 대한 로깅을 수집하는 데 사용되는 msi 클라이언트 ID입니다. null인 경우 백 엔드는 인증할 등록된 엔드포인트 ID를 선택합니다. 문자열
dataCollectionMode 데이터 수집을 사용하거나 사용하지 않도록 설정합니다. '사용 안 함'
'Enabled'
dataId 데이터 자산 arm 리소스 ID입니다. 클라이언트 쪽에서는 데이터 자산이 Blob Storage를 가리키도록 하고 백 엔드는 Blob Storage에 데이터를 수집합니다. 문자열
samplingRate 컬렉션에 대한 샘플링 속도입니다. 샘플링 속도 1.0은 기본적으로 100% 데이터를 수집한다는 것을 의미합니다. int

ContainerResourceRequirements

이름 묘사
containerResourceLimits 컨테이너 리소스 제한 정보: ContainerResourceSettings
containerResourceRequests 컨테이너 리소스 요청 정보: ContainerResourceSettings

ContainerResourceSettings

이름 묘사
cpu(cpu) 컨테이너에 대한 vCPU 요청/제한 수입니다. 추가 정보:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
문자열
gpu 컨테이너에 대한 Nvidia GPU 카드 요청/제한 수입니다. 추가 정보:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
문자열
기억 컨테이너에 대한 메모리 크기 요청/제한입니다. 추가 정보:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
문자열

DataCollector

이름 묘사
컬렉션 [필수] 컬렉션 구성입니다. 각 컬렉션에는 모델 데이터를 수집하기 위한 자체 구성이 있으며 컬렉션 이름은 임의의 문자열일 수 있습니다.
모델 데이터 수집기는 페이로드 로깅 또는 사용자 지정 로깅 또는 둘 다에 사용할 수 있습니다. 컬렉션 요청 및 응답은 페이로드 로깅을 위해 예약되고, 다른 요청은 사용자 지정 로깅용입니다.
DataCollectorCollections(필수)
requestLogging mdc에 대한 요청 로깅 구성에는 모든 컬렉션에 대한 고급 로깅 설정이 포함됩니다. 선택 사항입니다. RequestLogging
rollingRate 모델 데이터가 Blob Storage에 수집되는 경우 단일 Blob 파일에서 모든 데이터를 로깅하지 않도록 데이터를 다른 경로로 롤백해야 합니다.
롤링 속도가 시간인 경우 모든 데이터가 Blob 경로 /yyyy/MM/dd/HH/에 수집됩니다.
날짜인 경우 모든 데이터가 Blob 경로 /yyyy/MM/dd/에서 수집됩니다.
롤링 경로의 다른 이점은 모델 모니터링 UI가 데이터의 시간 범위를 매우 빠르게 선택할 수 있다는 것입니다.
'Day'
'Hour'
'Minute'
'월'
'Year'

DataCollectorCollections

이름 묘사

DefaultScaleSettings

이름 묘사
scaleType [필수] 배포 크기 조정 알고리즘의 유형 'Default'(필수)

EndpointDeploymentPropertiesBaseEnvironmentVariables

이름 묘사

EndpointDeploymentPropertiesBaseProperties

이름 묘사

KubernetesOnlineDeployment

이름 묘사
containerResourceRequirements 컨테이너(cpu 및 메모리)에 대한 리소스 요구 사항입니다. ContainerResourceRequirements
endpointComputeType [필수] 엔드포인트의 컴퓨팅 형식입니다. 'Kubernetes'(필수)

ManagedOnlineDeployment

이름 묘사
endpointComputeType [필수] 엔드포인트의 컴퓨팅 형식입니다. 'Managed'(필수)

ManagedServiceIdentity

이름 묘사
관리 서비스 ID의 유형입니다(SystemAssigned 및 UserAssigned 형식이 모두 허용되는 경우). 'None'
'SystemAssigned'
'SystemAssigned,UserAssigned'
'UserAssigned'(필수)
userAssignedIdentities 리소스와 연결된 사용자 할당 ID 집합입니다. userAssignedIdentities 사전 키는 '/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName} 형식의 ARM 리소스 ID입니다. 사전 값은 요청에서 빈 개체({})일 수 있습니다. UserAssignedIdentities

Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments

이름 묘사
apiVersion api 버전 '2023-06-01-preview'
신원 관리 서비스 ID(시스템 할당 및/또는 사용자 할당 ID) ManagedServiceIdentity
종류 포털/도구/등에서 동일한 형식의 리소스에 대해 다른 UX 환경을 렌더링하는 데 사용되는 메타데이터입니다. 문자열
위치 리소스가 있는 지리적 위치 string(필수)
이름 리소스 이름 문자열

제약 조건:
패턴 = ^[a-zA-Z0-9][a-zA-Z0-9\-_]{0,254}$(필수)
속성 [필수] 엔터티의 추가 특성입니다. OnlineDeploymentProperties(필수)
sku 자동 크기 조정을 위한 ARM 계약에 필요한 SKU 세부 정보입니다. Sku
태그 리소스 태그 태그 이름 및 값의 사전입니다. 템플릿 태그를 참조하세요.
리소스 종류 'Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments'

OnlineDeploymentProperties

이름 묘사
appInsightsEnabled true이면 Application Insights 로깅을 사용하도록 설정합니다. bool
codeConfiguration 엔드포인트 배포에 대한 코드 구성입니다. codeConfiguration
dataCollector mdc 구성은 null일 때 mdc를 사용하지 않도록 설정합니다. DataCollector
묘사 엔드포인트 배포에 대한 설명입니다. 문자열
egressPublicNetworkAccess 사용하도록 설정된 경우 송신 공용 네트워크 액세스를 허용합니다. 사용하지 않도록 설정하면 보안 송신이 생성됩니다. 기본값: 사용 '사용 안 함'
'Enabled'
endpointComputeType KubernetesOnlineDeployment형식에 대해 'Kubernetes'로 설정합니다. ManagedOnlineDeployment형식에 대해 'Managed'로 설정합니다. 'Kubernetes'
'Managed'(필수)
environmentId 엔드포인트 배포에 대한 환경 사양의 ARM 리소스 ID입니다. 문자열
environmentVariables 배포에 대한 환경 변수 구성입니다. EndpointDeploymentPropertiesBaseEnvironmentVariables
instanceType 컴퓨팅 인스턴스 유형입니다. 문자열
livenessProbe 활동성 프로브는 컨테이너의 상태를 정기적으로 모니터링합니다. ProbeSettings
모델 모델의 URI 경로입니다. 문자열
modelMountPath 사용자 지정 컨테이너에 모델을 탑재할 경로입니다. 문자열
속성 속성 사전입니다. 속성을 추가할 수 있지만 제거하거나 변경할 수는 없습니다. EndpointDeploymentPropertiesBaseProperties
readinessProbe 준비 상태 프로브는 컨테이너가 트래픽을 처리할 준비가 되었는지 확인합니다. 속성 및 기본값은 활동성 프로브와 동일합니다. ProbeSettings
requestSettings 배포에 대한 요청 설정입니다. OnlineRequestSettings
scaleSettings 배포에 대한 크기 조정 설정입니다.
null이거나 제공되지 않은 경우
기본적으로 KubernetesOnlineDeployment에 대한 TargetUtilizationScaleSettings로 설정됩니다.
ManagedOnlineDeployment에 대한 DefaultScaleSettings로
OnlineScaleSettings

OnlineRequestSettings

이름 묘사
maxConcurrentRequestsPerInstance 배포당 허용되는 노드당 최대 동시 요청 수입니다. 기본값은 1입니다. int
maxQueueWait 요청이 ISO 8601 형식으로 큐에 유지되는 최대 시간입니다.
기본값은 500ms입니다.
문자열
requestTimeout ISO 8601 형식의 채점 시간 제한입니다.
기본값은 5000ms입니다.
문자열

OnlineScaleSettings

이름 묘사
scaleType DefaultScaleSettings형식에 대해 'Default'로 설정합니다. TargetUtilizationScaleSettings형식 'TargetUtilization'으로 설정합니다. '기본값'
'TargetUtilization'(필수)

ProbeSettings

이름 묘사
failureThreshold 비정상 상태를 반환하기 전에 허용할 실패 횟수입니다. int
initialDelay ISO 8601 형식의 첫 번째 프로브 앞의 지연입니다. 문자열
마침표 ISO 8601 형식의 프로브 간 시간입니다. 문자열
successThreshold 정상 상태를 반환하기 전에 성공한 프로브의 수입니다. int
타임 아웃 ISO 8601 형식의 프로브 시간 제한입니다. 문자열

RequestLogging

이름 묘사
captureHeaders 페이로드 로깅의 경우 기본적으로 페이로드만 수집합니다. 고객이 지정된 헤더를 수집하려는 경우 백 엔드가 페이로드와 함께 해당 헤더를 수집하도록 captureHeaders에서 설정할 수 있습니다. string[]

Sku

이름 묘사
용량 SKU가 스케일 아웃/인을 지원하는 경우 용량 정수가 포함되어야 합니다. 리소스에 대해 스케일 아웃/인이 불가능한 경우 생략할 수 있습니다. int
가족 서비스에 여러 세대의 하드웨어가 있는 경우 동일한 SKU에 대해 여기에서 캡처할 수 있습니다. 문자열
이름 SKU의 이름입니다. 예 - P3. 일반적으로 letter+number 코드입니다. string(필수)
크기 SKU 크기입니다. 이름 필드가 계층과 다른 값의 조합인 경우 독립 실행형 코드입니다. 문자열
계층 이 필드는 서비스에 둘 이상의 계층이 있지만 PUT에는 필요하지 않은 경우 리소스 공급자가 구현해야 합니다. '기본'
'무료'
'프리미엄'
'Standard'

TargetUtilizationScaleSettings

이름 묘사
maxInstances 배포를 확장할 수 있는 최대 인스턴스 수입니다. 할당량은 max_instances 예약됩니다. int
minInstances 항상 존재할 최소 인스턴스 수입니다. int
pollingInterval ISO 8691 형식의 폴링 간격입니다. 전체 자릿수가 초인 기간만 지원합니다. 문자열
scaleType [필수] 배포 크기 조정 알고리즘의 유형 'TargetUtilization'(필수)
targetUtilizationPercentage 자동 크기 조정기용 대상 CPU 사용량입니다. int

TrackedResourceTags

이름 묘사

UserAssignedIdentities

이름 묘사

UserAssignedIdentity

이름 묘사

Terraform(AzAPI 공급자) 리소스 정의

작업 영역/onlineEndpoints/deployments 리소스 종류는 다음을 대상으로 하는 작업으로 배포할 수 있습니다.

  • 리소스 그룹

각 API 버전에서 변경된 속성 목록은 변경 로그참조하세요.

리소스 형식

Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments 리소스를 만들려면 템플릿에 다음 Terraform을 추가합니다.

resource "azapi_resource" "symbolicname" {
  type = "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2023-06-01-preview"
  name = "string"
  identity = {
    type = "string"
    userAssignedIdentities = {
      {customized property} = {
      }
    }
  }
  kind = "string"
  location = "string"
  sku = {
    capacity = int
    family = "string"
    name = "string"
    size = "string"
    tier = "string"
  }
  tags = {
    {customized property} = "string"
  }
  body = jsonencode({
    properties = {
      appInsightsEnabled = bool
      codeConfiguration = {
        codeId = "string"
        scoringScript = "string"
      }
      dataCollector = {
        collections = {
          {customized property} = {
            clientId = "string"
            dataCollectionMode = "string"
            dataId = "string"
            samplingRate = int
          }
        }
        requestLogging = {
          captureHeaders = [
            "string"
          ]
        }
        rollingRate = "string"
      }
      description = "string"
      egressPublicNetworkAccess = "string"
      environmentId = "string"
      environmentVariables = {
        {customized property} = "string"
      }
      instanceType = "string"
      livenessProbe = {
        failureThreshold = int
        initialDelay = "string"
        period = "string"
        successThreshold = int
        timeout = "string"
      }
      model = "string"
      modelMountPath = "string"
      properties = {
        {customized property} = "string"
      }
      readinessProbe = {
        failureThreshold = int
        initialDelay = "string"
        period = "string"
        successThreshold = int
        timeout = "string"
      }
      requestSettings = {
        maxConcurrentRequestsPerInstance = int
        maxQueueWait = "string"
        requestTimeout = "string"
      }
      scaleSettings = {
        scaleType = "string"
        // For remaining properties, see OnlineScaleSettings objects
      }
      endpointComputeType = "string"
      // For remaining properties, see OnlineDeploymentProperties objects
    }
  })
}

OnlineScaleSettings 개체

scaleType 속성을 설정하여 개체 유형을 지정합니다.

기본경우 다음을 사용합니다.

{
  scaleType = "Default"
}

TargetUtilization경우 다음을 사용합니다.

{
  maxInstances = int
  minInstances = int
  pollingInterval = "string"
  scaleType = "TargetUtilization"
  targetUtilizationPercentage = int
}

OnlineDeploymentProperties 개체

endpointComputeType 속성을 설정하여 개체 유형을 지정합니다.

kubernetes경우 다음을 사용합니다.

{
  containerResourceRequirements = {
    containerResourceLimits = {
      cpu = "string"
      gpu = "string"
      memory = "string"
    }
    containerResourceRequests = {
      cpu = "string"
      gpu = "string"
      memory = "string"
    }
  }
  endpointComputeType = "Kubernetes"
}

관리되는경우 다음을 사용합니다.

{
  endpointComputeType = "Managed"
}

속성 값

CodeConfiguration

이름 묘사
codeId 코드 자산의 ARM 리소스 ID입니다. 문자열
scoringScript [필수] 시작할 때 실행할 스크립트입니다. 예. "score.py" 문자열

제약 조건:
최소 길이 = 1
패턴 = [a-zA-Z0-9_](필수)

수집

이름 묘사
clientId Blob Storage에 대한 로깅을 수집하는 데 사용되는 msi 클라이언트 ID입니다. null인 경우 백 엔드는 인증할 등록된 엔드포인트 ID를 선택합니다. 문자열
dataCollectionMode 데이터 수집을 사용하거나 사용하지 않도록 설정합니다. '사용 안 함'
'Enabled'
dataId 데이터 자산 arm 리소스 ID입니다. 클라이언트 쪽에서는 데이터 자산이 Blob Storage를 가리키도록 하고 백 엔드는 Blob Storage에 데이터를 수집합니다. 문자열
samplingRate 컬렉션에 대한 샘플링 속도입니다. 샘플링 속도 1.0은 기본적으로 100% 데이터를 수집한다는 것을 의미합니다. int

ContainerResourceRequirements

이름 묘사
containerResourceLimits 컨테이너 리소스 제한 정보: ContainerResourceSettings
containerResourceRequests 컨테이너 리소스 요청 정보: ContainerResourceSettings

ContainerResourceSettings

이름 묘사
cpu(cpu) 컨테이너에 대한 vCPU 요청/제한 수입니다. 추가 정보:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
문자열
gpu 컨테이너에 대한 Nvidia GPU 카드 요청/제한 수입니다. 추가 정보:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
문자열
기억 컨테이너에 대한 메모리 크기 요청/제한입니다. 추가 정보:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
문자열

DataCollector

이름 묘사
컬렉션 [필수] 컬렉션 구성입니다. 각 컬렉션에는 모델 데이터를 수집하기 위한 자체 구성이 있으며 컬렉션 이름은 임의의 문자열일 수 있습니다.
모델 데이터 수집기는 페이로드 로깅 또는 사용자 지정 로깅 또는 둘 다에 사용할 수 있습니다. 컬렉션 요청 및 응답은 페이로드 로깅을 위해 예약되고, 다른 요청은 사용자 지정 로깅용입니다.
DataCollectorCollections(필수)
requestLogging mdc에 대한 요청 로깅 구성에는 모든 컬렉션에 대한 고급 로깅 설정이 포함됩니다. 선택 사항입니다. RequestLogging
rollingRate 모델 데이터가 Blob Storage에 수집되는 경우 단일 Blob 파일에서 모든 데이터를 로깅하지 않도록 데이터를 다른 경로로 롤백해야 합니다.
롤링 속도가 시간인 경우 모든 데이터가 Blob 경로 /yyyy/MM/dd/HH/에 수집됩니다.
날짜인 경우 모든 데이터가 Blob 경로 /yyyy/MM/dd/에서 수집됩니다.
롤링 경로의 다른 이점은 모델 모니터링 UI가 데이터의 시간 범위를 매우 빠르게 선택할 수 있다는 것입니다.
'Day'
'Hour'
'Minute'
'월'
'Year'

DataCollectorCollections

이름 묘사

DefaultScaleSettings

이름 묘사
scaleType [필수] 배포 크기 조정 알고리즘의 유형 'Default'(필수)

EndpointDeploymentPropertiesBaseEnvironmentVariables

이름 묘사

EndpointDeploymentPropertiesBaseProperties

이름 묘사

KubernetesOnlineDeployment

이름 묘사
containerResourceRequirements 컨테이너(cpu 및 메모리)에 대한 리소스 요구 사항입니다. ContainerResourceRequirements
endpointComputeType [필수] 엔드포인트의 컴퓨팅 형식입니다. 'Kubernetes'(필수)

ManagedOnlineDeployment

이름 묘사
endpointComputeType [필수] 엔드포인트의 컴퓨팅 형식입니다. 'Managed'(필수)

ManagedServiceIdentity

이름 묘사
관리 서비스 ID의 유형입니다(SystemAssigned 및 UserAssigned 형식이 모두 허용되는 경우). 'None'
'SystemAssigned'
'SystemAssigned,UserAssigned'
'UserAssigned'(필수)
userAssignedIdentities 리소스와 연결된 사용자 할당 ID 집합입니다. userAssignedIdentities 사전 키는 '/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName} 형식의 ARM 리소스 ID입니다. 사전 값은 요청에서 빈 개체({})일 수 있습니다. UserAssignedIdentities

Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments

이름 묘사
신원 관리 서비스 ID(시스템 할당 및/또는 사용자 할당 ID) ManagedServiceIdentity
종류 포털/도구/등에서 동일한 형식의 리소스에 대해 다른 UX 환경을 렌더링하는 데 사용되는 메타데이터입니다. 문자열
위치 리소스가 있는 지리적 위치 string(필수)
이름 리소스 이름 문자열

제약 조건:
패턴 = ^[a-zA-Z0-9][a-zA-Z0-9\-_]{0,254}$(필수)
parent_id 이 리소스의 부모인 리소스의 ID입니다. 형식의 리소스 ID: 작업 영역/onlineEndpoints
속성 [필수] 엔터티의 추가 특성입니다. OnlineDeploymentProperties(필수)
sku 자동 크기 조정을 위한 ARM 계약에 필요한 SKU 세부 정보입니다. Sku
태그 리소스 태그 태그 이름 및 값의 사전입니다.
리소스 종류 "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2023-06-01-preview"

OnlineDeploymentProperties

이름 묘사
appInsightsEnabled true이면 Application Insights 로깅을 사용하도록 설정합니다. bool
codeConfiguration 엔드포인트 배포에 대한 코드 구성입니다. codeConfiguration
dataCollector mdc 구성은 null일 때 mdc를 사용하지 않도록 설정합니다. DataCollector
묘사 엔드포인트 배포에 대한 설명입니다. 문자열
egressPublicNetworkAccess 사용하도록 설정된 경우 송신 공용 네트워크 액세스를 허용합니다. 사용하지 않도록 설정하면 보안 송신이 생성됩니다. 기본값: 사용 '사용 안 함'
'Enabled'
endpointComputeType KubernetesOnlineDeployment형식에 대해 'Kubernetes'로 설정합니다. ManagedOnlineDeployment형식에 대해 'Managed'로 설정합니다. 'Kubernetes'
'Managed'(필수)
environmentId 엔드포인트 배포에 대한 환경 사양의 ARM 리소스 ID입니다. 문자열
environmentVariables 배포에 대한 환경 변수 구성입니다. EndpointDeploymentPropertiesBaseEnvironmentVariables
instanceType 컴퓨팅 인스턴스 유형입니다. 문자열
livenessProbe 활동성 프로브는 컨테이너의 상태를 정기적으로 모니터링합니다. ProbeSettings
모델 모델의 URI 경로입니다. 문자열
modelMountPath 사용자 지정 컨테이너에 모델을 탑재할 경로입니다. 문자열
속성 속성 사전입니다. 속성을 추가할 수 있지만 제거하거나 변경할 수는 없습니다. EndpointDeploymentPropertiesBaseProperties
readinessProbe 준비 상태 프로브는 컨테이너가 트래픽을 처리할 준비가 되었는지 확인합니다. 속성 및 기본값은 활동성 프로브와 동일합니다. ProbeSettings
requestSettings 배포에 대한 요청 설정입니다. OnlineRequestSettings
scaleSettings 배포에 대한 크기 조정 설정입니다.
null이거나 제공되지 않은 경우
기본적으로 KubernetesOnlineDeployment에 대한 TargetUtilizationScaleSettings로 설정됩니다.
ManagedOnlineDeployment에 대한 DefaultScaleSettings로
OnlineScaleSettings

OnlineRequestSettings

이름 묘사
maxConcurrentRequestsPerInstance 배포당 허용되는 노드당 최대 동시 요청 수입니다. 기본값은 1입니다. int
maxQueueWait 요청이 ISO 8601 형식으로 큐에 유지되는 최대 시간입니다.
기본값은 500ms입니다.
문자열
requestTimeout ISO 8601 형식의 채점 시간 제한입니다.
기본값은 5000ms입니다.
문자열

OnlineScaleSettings

이름 묘사
scaleType DefaultScaleSettings형식에 대해 'Default'로 설정합니다. TargetUtilizationScaleSettings형식 'TargetUtilization'으로 설정합니다. '기본값'
'TargetUtilization'(필수)

ProbeSettings

이름 묘사
failureThreshold 비정상 상태를 반환하기 전에 허용할 실패 횟수입니다. int
initialDelay ISO 8601 형식의 첫 번째 프로브 앞의 지연입니다. 문자열
마침표 ISO 8601 형식의 프로브 간 시간입니다. 문자열
successThreshold 정상 상태를 반환하기 전에 성공한 프로브의 수입니다. int
타임 아웃 ISO 8601 형식의 프로브 시간 제한입니다. 문자열

RequestLogging

이름 묘사
captureHeaders 페이로드 로깅의 경우 기본적으로 페이로드만 수집합니다. 고객이 지정된 헤더를 수집하려는 경우 백 엔드가 페이로드와 함께 해당 헤더를 수집하도록 captureHeaders에서 설정할 수 있습니다. string[]

Sku

이름 묘사
용량 SKU가 스케일 아웃/인을 지원하는 경우 용량 정수가 포함되어야 합니다. 리소스에 대해 스케일 아웃/인이 불가능한 경우 생략할 수 있습니다. int
가족 서비스에 여러 세대의 하드웨어가 있는 경우 동일한 SKU에 대해 여기에서 캡처할 수 있습니다. 문자열
이름 SKU의 이름입니다. 예 - P3. 일반적으로 letter+number 코드입니다. string(필수)
크기 SKU 크기입니다. 이름 필드가 계층과 다른 값의 조합인 경우 독립 실행형 코드입니다. 문자열
계층 이 필드는 서비스에 둘 이상의 계층이 있지만 PUT에는 필요하지 않은 경우 리소스 공급자가 구현해야 합니다. '기본'
'무료'
'프리미엄'
'Standard'

TargetUtilizationScaleSettings

이름 묘사
maxInstances 배포를 확장할 수 있는 최대 인스턴스 수입니다. 할당량은 max_instances 예약됩니다. int
minInstances 항상 존재할 최소 인스턴스 수입니다. int
pollingInterval ISO 8691 형식의 폴링 간격입니다. 전체 자릿수가 초인 기간만 지원합니다. 문자열
scaleType [필수] 배포 크기 조정 알고리즘의 유형 'TargetUtilization'(필수)
targetUtilizationPercentage 자동 크기 조정기용 대상 CPU 사용량입니다. int

TrackedResourceTags

이름 묘사

UserAssignedIdentities

이름 묘사

UserAssignedIdentity

이름 묘사