Поделиться через


Рабочие области Microsoft.MachineLearningServices/onlineEndpoints/deployments 2023-10-01

Определение ресурсов Bicep

Тип ресурсов рабочих областей/onlineEndpoints/deployments можно развернуть с помощью операций, предназначенных для следующих операций:

Список измененных свойств в каждой версии API см. в журнала изменений.

Формат ресурса

Чтобы создать ресурс Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments, добавьте следующий Bicep в шаблон.

resource symbolicname 'Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2023-10-01' = {
  identity: {
    type: 'string'
    userAssignedIdentities: {
      {customized property}: {}
    }
  }
  kind: 'string'
  location: 'string'
  name: 'string'
  properties: {
    appInsightsEnabled: bool
    codeConfiguration: {
      codeId: 'string'
      scoringScript: 'string'
    }
    description: 'string'
    egressPublicNetworkAccess: 'string'
    environmentId: 'string'
    environmentVariables: {
      {customized property}: 'string'
    }
    instanceType: 'string'
    livenessProbe: {
      failureThreshold: int
      initialDelay: 'string'
      period: 'string'
      successThreshold: int
      timeout: 'string'
    }
    model: 'string'
    modelMountPath: 'string'
    properties: {
      {customized property}: 'string'
    }
    readinessProbe: {
      failureThreshold: int
      initialDelay: 'string'
      period: 'string'
      successThreshold: int
      timeout: 'string'
    }
    requestSettings: {
      maxConcurrentRequestsPerInstance: int
      maxQueueWait: 'string'
      requestTimeout: 'string'
    }
    scaleSettings: {
      scaleType: 'string'
      // For remaining properties, see OnlineScaleSettings objects
    }
    endpointComputeType: 'string'
    // For remaining properties, see OnlineDeploymentProperties objects
  }
  sku: {
    capacity: int
    family: 'string'
    name: 'string'
    size: 'string'
    tier: 'string'
  }
  tags: {
    {customized property}: 'string'
  }
}

Объекты OnlineDeploymentProperties

Задайте свойство endpointComputeType, чтобы указать тип объекта.

Для Kubernetesиспользуйте:

{
  containerResourceRequirements: {
    containerResourceLimits: {
      cpu: 'string'
      gpu: 'string'
      memory: 'string'
    }
    containerResourceRequests: {
      cpu: 'string'
      gpu: 'string'
      memory: 'string'
    }
  }
  endpointComputeType: 'Kubernetes'
}

Для управляемыхиспользуйте:

{
  endpointComputeType: 'Managed'
}

Объекты OnlineScaleSettings

Задайте свойство scaleType, чтобы указать тип объекта.

Для по умолчаниюиспользуйте:

{
  scaleType: 'Default'
}

Для TargetUtilizationиспользуйте:

{
  maxInstances: int
  minInstances: int
  pollingInterval: 'string'
  scaleType: 'TargetUtilization'
  targetUtilizationPercentage: int
}

Значения свойств

CodeConfiguration

Имя Описание Ценность
codeId Идентификатор ресурса ARM ресурса ресурса кода. струна
оценкаScript [Обязательный] Скрипт, выполняемый при запуске. Например. "score.py" струна

Ограничения целостности:
Минимальная длина = 1
Pattern = [a-zA-Z0-9_] (обязательно)

ContainerResourceRequirements

Имя Описание Ценность
containerResourceLimits Сведения об ограничении ресурсов контейнера: ContainerResourceSettings
containerResourceRequests Сведения о запросе ресурса контейнера: ContainerResourceSettings

ContainerResourceSettings

Имя Описание Ценность
ЦПУ Количество запросов и ограничений виртуальных ЦП для контейнера. Дополнительные сведения:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
струна
Графический процессор Количество запросов и ограничений карт NVIDIA GPU для контейнера. Дополнительные сведения:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
струна
память Запрос или ограничение размера памяти для контейнера. Дополнительные сведения:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
струна

DefaultScaleSettings

Имя Описание Ценность
scaleType [Обязательный] Тип алгоритма масштабирования развертывания Default (обязательно)

EndpointDeploymentPropertiesBaseEnvironmentVariables

Имя Описание Ценность

EndpointDeploymentPropertiesBaseProperties

Имя Описание Ценность

KubernetesOnlineDeployment

Имя Описание Ценность
containerResourceRequirements Требования к ресурсам для контейнера (ЦП и памяти). ContainerResourceRequirements
endpointComputeType [Обязательный] Тип вычислений конечной точки. Kubernetes (обязательно)

ManagedOnlineDeployment

Имя Описание Ценность
endpointComputeType [Обязательный] Тип вычислений конечной точки. Managed (обязательный)

ManagedServiceIdentity

Имя Описание Ценность
тип Тип управляемого удостоверения службы (где разрешены типы SystemAssigned и UserAssigned). "Нет"
SystemAssigned
SystemAssigned, UserAssigned
UserAssigned (обязательно)
userAssignedIdentities Набор назначенных пользователем удостоверений, связанных с ресурсом. Ключи словаря userAssignedIdentities будут идентификаторами ресурсов ARM в форме: "/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. Значения словаря могут быть пустыми объектами ({}) в запросах. UserAssignedIdentities

Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments

Имя Описание Ценность
тождество Управляемое удостоверение службы (назначенные системой удостоверения и (или) назначенные пользователем удостоверения ManagedServiceIdentity
добрый Метаданные, используемые порталом или инструментом и т. д., для отображения различных интерфейсов пользовательского интерфейса для ресурсов одного типа. струна
местоположение Географическое расположение, в котором находится ресурс строка (обязательно)
имя Имя ресурса струна

Ограничения целостности:
Pattern = ^[a-zA-Z0-9][a-zA-Z0-9\-_]{0,254}$ (обязательно)
родитель В Bicep можно указать родительский ресурс для дочернего ресурса. Это свойство необходимо добавить, только если дочерний ресурс объявлен за пределами родительского ресурса.

Дополнительные сведения см. в разделе Дочерний ресурс за пределами родительского ресурса.
Символьное имя ресурса типа: рабочих областей/onlineEndpoints
свойства [Обязательный] Дополнительные атрибуты сущности. OnlineDeploymentProperties (обязательно)
SKU Сведения о SKU, необходимые для контракта ARM для автомасштабирования. SKU
Теги Теги ресурсов Словарь имен и значений тегов. См. теги в шаблонах

OnlineDeploymentProperties

Имя Описание Ценность
appInsightsEnabled Если значение true, включает ведение журнала Application Insights. bool
codeConfiguration Конфигурация кода для развертывания конечной точки. CodeConfiguration
описание Описание развертывания конечной точки. струна
исходящий трафикPublicNetworkAccess Если этот параметр включен, разрешите исходящий доступ к общедоступной сети. При отключении это приведет к созданию безопасного исходящего трафика. Значение по умолчанию: включено. "Отключено"
"Включено"
endpointComputeType Установите значение Kubernetes для типа KubernetesOnlineDeployment. Установите значение Managed для типа ManagedOnlineDeployment. Kubernetes
Managed (обязательный)
environmentId Идентификатор ресурса ARM или AssetId спецификации среды для развертывания конечной точки. струна
environmentVariables Конфигурация переменных среды для развертывания. EndpointDeploymentPropertiesBaseEnvironmentVariables
instanceType Тип вычислительного экземпляра. струна
livenessProbe Проба динамической активности регулярно отслеживает работоспособность контейнера. ProbeSettings
модель Путь URI к модели. струна
modelMountPath Путь к подключению модели в пользовательском контейнере. струна
свойства Словарь свойств. Свойства можно добавлять, но не удалять или изменять. EndpointDeploymentPropertiesBaseProperties
готовностьProbe Проверка готовности проверяет, готов ли контейнер обслуживать трафик. Свойства и значения по умолчанию совпадают с пробой активности. ProbeSettings
requestSettings Параметры запроса для развертывания. OnlineRequestSettings
scaleSettings Параметры масштабирования развертывания.
Если значение равно null или не указано,
По умолчанию значение TargetUtilizationScaleSettings для KubernetesOnlineDeployment
и значение DefaultScaleSettings для ManagedOnlineDeployment.
OnlineScaleSettings

OnlineRequestSettings

Имя Описание Ценность
maxConcurrentRequestsPerInstance Количество одновременных запросов на узел, разрешенных для каждого развертывания. Значение по умолчанию — 1. int
maxQueueWait (Не рекомендуется использовать для управляемых конечных точек в Интернете) Максимальное время пребывания запроса в очереди в формате ISO 8601.
Значение по умолчанию — 500 мс.
(Теперь увеличьте request_timeout_ms для учета любых задержек сети или очередей)
струна
requestTimeout Время ожидания оценки в формате ISO 8601.
Значение по умолчанию — 5000 мс.
струна

OnlineScaleSettings

Имя Описание Ценность
scaleType Установите значение Default для типа DefaultScaleSettings. Установите значение TargetUtilization для типа TargetUtilizationScaleSettings. По умолчанию
TargetUtilization (обязательный)

ПробыSettings

Имя Описание Ценность
failureThreshold Количество сбоев, которые необходимо разрешить, прежде чем возвращать неработоспособное состояние. int
initialDelay Задержка перед первой пробой в формате ISO 8601. струна
период Продолжительность времени между пробами в формате ISO 8601. струна
successThreshold Количество успешных проб перед возвратом работоспособного состояния. int
Времени ожидания Время ожидания пробы в формате ISO 8601. струна

Sku

Имя Описание Ценность
способность Если номер SKU поддерживает горизонтальное масштабирование или в, то целое число емкости должно быть включено. Если горизонтальное масштабирование невозможно для ресурса, это может быть опущено. int
семья Если служба имеет разные поколения оборудования для одного номера SKU, это можно записать здесь. струна
имя Имя номера SKU. Ex - P3. Обычно это код буквы и числа строка (обязательно)
размер Размер номера SKU. Если поле имени является сочетанием уровня и другого значения, это будет автономный код. струна
ярус Это поле необходимо реализовать поставщиком ресурсов, если служба имеет несколько уровней, но не требуется для PUT. "Базовый"
"Бесплатный"
"Премиум"
"Стандартный"

TargetUtilizationScaleSettings

Имя Описание Ценность
maxInstances Максимальное количество экземпляров, в которых развертывание может масштабироваться. Квота будет зарезервирована для max_instances. int
minInstances Минимальное количество экземпляров, которые всегда должны присутствовать. int
pollingInterval Интервал опроса в формате ISO 8691. Поддерживается только длительность с точностью до секунд. струна
scaleType [Обязательный] Тип алгоритма масштабирования развертывания TargetUtilization (обязательный)
targetUtilizationPercentage Целевое использование ЦП для автомасштабирования. int

TrackedResourceTags

Имя Описание Ценность

UserAssignedIdentities

Имя Описание Ценность

UserAssignedIdentity

Имя Описание Ценность

Определение ресурса шаблона ARM

Тип ресурсов рабочих областей/onlineEndpoints/deployments можно развернуть с помощью операций, предназначенных для следующих операций:

Список измененных свойств в каждой версии API см. в журнала изменений.

Формат ресурса

Чтобы создать ресурс Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments, добавьте следующий код JSON в шаблон.

{
  "type": "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments",
  "apiVersion": "2023-10-01",
  "name": "string",
  "identity": {
    "type": "string",
    "userAssignedIdentities": {
      "{customized property}": {
      }
    }
  },
  "kind": "string",
  "location": "string",
  "properties": {
    "appInsightsEnabled": "bool",
    "codeConfiguration": {
      "codeId": "string",
      "scoringScript": "string"
    },
    "description": "string",
    "egressPublicNetworkAccess": "string",
    "environmentId": "string",
    "environmentVariables": {
      "{customized property}": "string"
    },
    "instanceType": "string",
    "livenessProbe": {
      "failureThreshold": "int",
      "initialDelay": "string",
      "period": "string",
      "successThreshold": "int",
      "timeout": "string"
    },
    "model": "string",
    "modelMountPath": "string",
    "properties": {
      "{customized property}": "string"
    },
    "readinessProbe": {
      "failureThreshold": "int",
      "initialDelay": "string",
      "period": "string",
      "successThreshold": "int",
      "timeout": "string"
    },
    "requestSettings": {
      "maxConcurrentRequestsPerInstance": "int",
      "maxQueueWait": "string",
      "requestTimeout": "string"
    },
    "scaleSettings": {
      "scaleType": "string"
      // For remaining properties, see OnlineScaleSettings objects
    },
    "endpointComputeType": "string"
    // For remaining properties, see OnlineDeploymentProperties objects
  },
  "sku": {
    "capacity": "int",
    "family": "string",
    "name": "string",
    "size": "string",
    "tier": "string"
  },
  "tags": {
    "{customized property}": "string"
  }
}

Объекты OnlineDeploymentProperties

Задайте свойство endpointComputeType, чтобы указать тип объекта.

Для Kubernetesиспользуйте:

{
  "containerResourceRequirements": {
    "containerResourceLimits": {
      "cpu": "string",
      "gpu": "string",
      "memory": "string"
    },
    "containerResourceRequests": {
      "cpu": "string",
      "gpu": "string",
      "memory": "string"
    }
  },
  "endpointComputeType": "Kubernetes"
}

Для управляемыхиспользуйте:

{
  "endpointComputeType": "Managed"
}

Объекты OnlineScaleSettings

Задайте свойство scaleType, чтобы указать тип объекта.

Для по умолчаниюиспользуйте:

{
  "scaleType": "Default"
}

Для TargetUtilizationиспользуйте:

{
  "maxInstances": "int",
  "minInstances": "int",
  "pollingInterval": "string",
  "scaleType": "TargetUtilization",
  "targetUtilizationPercentage": "int"
}

Значения свойств

CodeConfiguration

Имя Описание Ценность
codeId Идентификатор ресурса ARM ресурса ресурса кода. струна
оценкаScript [Обязательный] Скрипт, выполняемый при запуске. Например. "score.py" струна

Ограничения целостности:
Минимальная длина = 1
Pattern = [a-zA-Z0-9_] (обязательно)

ContainerResourceRequirements

Имя Описание Ценность
containerResourceLimits Сведения об ограничении ресурсов контейнера: ContainerResourceSettings
containerResourceRequests Сведения о запросе ресурса контейнера: ContainerResourceSettings

ContainerResourceSettings

Имя Описание Ценность
ЦПУ Количество запросов и ограничений виртуальных ЦП для контейнера. Дополнительные сведения:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
струна
Графический процессор Количество запросов и ограничений карт NVIDIA GPU для контейнера. Дополнительные сведения:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
струна
память Запрос или ограничение размера памяти для контейнера. Дополнительные сведения:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
струна

DefaultScaleSettings

Имя Описание Ценность
scaleType [Обязательный] Тип алгоритма масштабирования развертывания Default (обязательно)

EndpointDeploymentPropertiesBaseEnvironmentVariables

Имя Описание Ценность

EndpointDeploymentPropertiesBaseProperties

Имя Описание Ценность

KubernetesOnlineDeployment

Имя Описание Ценность
containerResourceRequirements Требования к ресурсам для контейнера (ЦП и памяти). ContainerResourceRequirements
endpointComputeType [Обязательный] Тип вычислений конечной точки. Kubernetes (обязательно)

ManagedOnlineDeployment

Имя Описание Ценность
endpointComputeType [Обязательный] Тип вычислений конечной точки. Managed (обязательный)

ManagedServiceIdentity

Имя Описание Ценность
тип Тип управляемого удостоверения службы (где разрешены типы SystemAssigned и UserAssigned). "Нет"
SystemAssigned
SystemAssigned, UserAssigned
UserAssigned (обязательно)
userAssignedIdentities Набор назначенных пользователем удостоверений, связанных с ресурсом. Ключи словаря userAssignedIdentities будут идентификаторами ресурсов ARM в форме: "/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. Значения словаря могут быть пустыми объектами ({}) в запросах. UserAssignedIdentities

Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments

Имя Описание Ценность
apiVersion Версия API '2023-10-01'
тождество Управляемое удостоверение службы (назначенные системой удостоверения и (или) назначенные пользователем удостоверения ManagedServiceIdentity
добрый Метаданные, используемые порталом или инструментом и т. д., для отображения различных интерфейсов пользовательского интерфейса для ресурсов одного типа. струна
местоположение Географическое расположение, в котором находится ресурс строка (обязательно)
имя Имя ресурса струна

Ограничения целостности:
Pattern = ^[a-zA-Z0-9][a-zA-Z0-9\-_]{0,254}$ (обязательно)
свойства [Обязательный] Дополнительные атрибуты сущности. OnlineDeploymentProperties (обязательно)
SKU Сведения о SKU, необходимые для контракта ARM для автомасштабирования. SKU
Теги Теги ресурсов Словарь имен и значений тегов. См. теги в шаблонах
тип Тип ресурса "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments"

OnlineDeploymentProperties

Имя Описание Ценность
appInsightsEnabled Если значение true, включает ведение журнала Application Insights. bool
codeConfiguration Конфигурация кода для развертывания конечной точки. CodeConfiguration
описание Описание развертывания конечной точки. струна
исходящий трафикPublicNetworkAccess Если этот параметр включен, разрешите исходящий доступ к общедоступной сети. При отключении это приведет к созданию безопасного исходящего трафика. Значение по умолчанию: включено. "Отключено"
"Включено"
endpointComputeType Установите значение Kubernetes для типа KubernetesOnlineDeployment. Установите значение Managed для типа ManagedOnlineDeployment. Kubernetes
Managed (обязательный)
environmentId Идентификатор ресурса ARM или AssetId спецификации среды для развертывания конечной точки. струна
environmentVariables Конфигурация переменных среды для развертывания. EndpointDeploymentPropertiesBaseEnvironmentVariables
instanceType Тип вычислительного экземпляра. струна
livenessProbe Проба динамической активности регулярно отслеживает работоспособность контейнера. ProbeSettings
модель Путь URI к модели. струна
modelMountPath Путь к подключению модели в пользовательском контейнере. струна
свойства Словарь свойств. Свойства можно добавлять, но не удалять или изменять. EndpointDeploymentPropertiesBaseProperties
готовностьProbe Проверка готовности проверяет, готов ли контейнер обслуживать трафик. Свойства и значения по умолчанию совпадают с пробой активности. ProbeSettings
requestSettings Параметры запроса для развертывания. OnlineRequestSettings
scaleSettings Параметры масштабирования развертывания.
Если значение равно null или не указано,
По умолчанию значение TargetUtilizationScaleSettings для KubernetesOnlineDeployment
и значение DefaultScaleSettings для ManagedOnlineDeployment.
OnlineScaleSettings

OnlineRequestSettings

Имя Описание Ценность
maxConcurrentRequestsPerInstance Количество одновременных запросов на узел, разрешенных для каждого развертывания. Значение по умолчанию — 1. int
maxQueueWait (Не рекомендуется использовать для управляемых конечных точек в Интернете) Максимальное время пребывания запроса в очереди в формате ISO 8601.
Значение по умолчанию — 500 мс.
(Теперь увеличьте request_timeout_ms для учета любых задержек сети или очередей)
струна
requestTimeout Время ожидания оценки в формате ISO 8601.
Значение по умолчанию — 5000 мс.
струна

OnlineScaleSettings

Имя Описание Ценность
scaleType Установите значение Default для типа DefaultScaleSettings. Установите значение TargetUtilization для типа TargetUtilizationScaleSettings. По умолчанию
TargetUtilization (обязательный)

ПробыSettings

Имя Описание Ценность
failureThreshold Количество сбоев, которые необходимо разрешить, прежде чем возвращать неработоспособное состояние. int
initialDelay Задержка перед первой пробой в формате ISO 8601. струна
период Продолжительность времени между пробами в формате ISO 8601. струна
successThreshold Количество успешных проб перед возвратом работоспособного состояния. int
Времени ожидания Время ожидания пробы в формате ISO 8601. струна

Sku

Имя Описание Ценность
способность Если номер SKU поддерживает горизонтальное масштабирование или в, то целое число емкости должно быть включено. Если горизонтальное масштабирование невозможно для ресурса, это может быть опущено. int
семья Если служба имеет разные поколения оборудования для одного номера SKU, это можно записать здесь. струна
имя Имя номера SKU. Ex - P3. Обычно это код буквы и числа строка (обязательно)
размер Размер номера SKU. Если поле имени является сочетанием уровня и другого значения, это будет автономный код. струна
ярус Это поле необходимо реализовать поставщиком ресурсов, если служба имеет несколько уровней, но не требуется для PUT. "Базовый"
"Бесплатный"
"Премиум"
"Стандартный"

TargetUtilizationScaleSettings

Имя Описание Ценность
maxInstances Максимальное количество экземпляров, в которых развертывание может масштабироваться. Квота будет зарезервирована для max_instances. int
minInstances Минимальное количество экземпляров, которые всегда должны присутствовать. int
pollingInterval Интервал опроса в формате ISO 8691. Поддерживается только длительность с точностью до секунд. струна
scaleType [Обязательный] Тип алгоритма масштабирования развертывания TargetUtilization (обязательный)
targetUtilizationPercentage Целевое использование ЦП для автомасштабирования. int

TrackedResourceTags

Имя Описание Ценность

UserAssignedIdentities

Имя Описание Ценность

UserAssignedIdentity

Имя Описание Ценность

Определение ресурса Terraform (поставщик AzAPI)

Тип ресурсов рабочих областей/onlineEndpoints/deployments можно развернуть с помощью операций, предназначенных для следующих операций:

  • групп ресурсов

Список измененных свойств в каждой версии API см. в журнала изменений.

Формат ресурса

Чтобы создать ресурс Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments, добавьте следующий объект Terraform в шаблон.

resource "azapi_resource" "symbolicname" {
  type = "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2023-10-01"
  name = "string"
  identity = {
    type = "string"
    userAssignedIdentities = {
      {customized property} = {
      }
    }
  }
  kind = "string"
  location = "string"
  body = jsonencode({
    properties = {
      appInsightsEnabled = bool
      codeConfiguration = {
        codeId = "string"
        scoringScript = "string"
      }
      description = "string"
      egressPublicNetworkAccess = "string"
      environmentId = "string"
      environmentVariables = {
        {customized property} = "string"
      }
      instanceType = "string"
      livenessProbe = {
        failureThreshold = int
        initialDelay = "string"
        period = "string"
        successThreshold = int
        timeout = "string"
      }
      model = "string"
      modelMountPath = "string"
      properties = {
        {customized property} = "string"
      }
      readinessProbe = {
        failureThreshold = int
        initialDelay = "string"
        period = "string"
        successThreshold = int
        timeout = "string"
      }
      requestSettings = {
        maxConcurrentRequestsPerInstance = int
        maxQueueWait = "string"
        requestTimeout = "string"
      }
      scaleSettings = {
        scaleType = "string"
        // For remaining properties, see OnlineScaleSettings objects
      }
      endpointComputeType = "string"
      // For remaining properties, see OnlineDeploymentProperties objects
    }
  })
  sku = {
    capacity = int
    family = "string"
    name = "string"
    size = "string"
    tier = "string"
  }
  tags = {
    {customized property} = "string"
  }
}

Объекты OnlineDeploymentProperties

Задайте свойство endpointComputeType, чтобы указать тип объекта.

Для Kubernetesиспользуйте:

{
  containerResourceRequirements = {
    containerResourceLimits = {
      cpu = "string"
      gpu = "string"
      memory = "string"
    }
    containerResourceRequests = {
      cpu = "string"
      gpu = "string"
      memory = "string"
    }
  }
  endpointComputeType = "Kubernetes"
}

Для управляемыхиспользуйте:

{
  endpointComputeType = "Managed"
}

Объекты OnlineScaleSettings

Задайте свойство scaleType, чтобы указать тип объекта.

Для по умолчаниюиспользуйте:

{
  scaleType = "Default"
}

Для TargetUtilizationиспользуйте:

{
  maxInstances = int
  minInstances = int
  pollingInterval = "string"
  scaleType = "TargetUtilization"
  targetUtilizationPercentage = int
}

Значения свойств

CodeConfiguration

Имя Описание Ценность
codeId Идентификатор ресурса ARM ресурса ресурса кода. струна
оценкаScript [Обязательный] Скрипт, выполняемый при запуске. Например. "score.py" струна

Ограничения целостности:
Минимальная длина = 1
Pattern = [a-zA-Z0-9_] (обязательно)

ContainerResourceRequirements

Имя Описание Ценность
containerResourceLimits Сведения об ограничении ресурсов контейнера: ContainerResourceSettings
containerResourceRequests Сведения о запросе ресурса контейнера: ContainerResourceSettings

ContainerResourceSettings

Имя Описание Ценность
ЦПУ Количество запросов и ограничений виртуальных ЦП для контейнера. Дополнительные сведения:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
струна
Графический процессор Количество запросов и ограничений карт NVIDIA GPU для контейнера. Дополнительные сведения:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
струна
память Запрос или ограничение размера памяти для контейнера. Дополнительные сведения:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
струна

DefaultScaleSettings

Имя Описание Ценность
scaleType [Обязательный] Тип алгоритма масштабирования развертывания Default (обязательно)

EndpointDeploymentPropertiesBaseEnvironmentVariables

Имя Описание Ценность

EndpointDeploymentPropertiesBaseProperties

Имя Описание Ценность

KubernetesOnlineDeployment

Имя Описание Ценность
containerResourceRequirements Требования к ресурсам для контейнера (ЦП и памяти). ContainerResourceRequirements
endpointComputeType [Обязательный] Тип вычислений конечной точки. Kubernetes (обязательно)

ManagedOnlineDeployment

Имя Описание Ценность
endpointComputeType [Обязательный] Тип вычислений конечной точки. Managed (обязательный)

ManagedServiceIdentity

Имя Описание Ценность
тип Тип управляемого удостоверения службы (где разрешены типы SystemAssigned и UserAssigned). "Нет"
SystemAssigned
SystemAssigned, UserAssigned
UserAssigned (обязательно)
userAssignedIdentities Набор назначенных пользователем удостоверений, связанных с ресурсом. Ключи словаря userAssignedIdentities будут идентификаторами ресурсов ARM в форме: "/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. Значения словаря могут быть пустыми объектами ({}) в запросах. UserAssignedIdentities

Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments

Имя Описание Ценность
тождество Управляемое удостоверение службы (назначенные системой удостоверения и (или) назначенные пользователем удостоверения ManagedServiceIdentity
добрый Метаданные, используемые порталом или инструментом и т. д., для отображения различных интерфейсов пользовательского интерфейса для ресурсов одного типа. струна
местоположение Географическое расположение, в котором находится ресурс строка (обязательно)
имя Имя ресурса струна

Ограничения целостности:
Pattern = ^[a-zA-Z0-9][a-zA-Z0-9\-_]{0,254}$ (обязательно)
parent_id Идентификатор ресурса, который является родительским для этого ресурса. Идентификатор ресурса типа: рабочих областей/onlineEndpoints
свойства [Обязательный] Дополнительные атрибуты сущности. OnlineDeploymentProperties (обязательно)
SKU Сведения о SKU, необходимые для контракта ARM для автомасштабирования. SKU
Теги Теги ресурсов Словарь имен и значений тегов.
тип Тип ресурса "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2023-10-01"

OnlineDeploymentProperties

Имя Описание Ценность
appInsightsEnabled Если значение true, включает ведение журнала Application Insights. bool
codeConfiguration Конфигурация кода для развертывания конечной точки. CodeConfiguration
описание Описание развертывания конечной точки. струна
исходящий трафикPublicNetworkAccess Если этот параметр включен, разрешите исходящий доступ к общедоступной сети. При отключении это приведет к созданию безопасного исходящего трафика. Значение по умолчанию: включено. "Отключено"
"Включено"
endpointComputeType Установите значение Kubernetes для типа KubernetesOnlineDeployment. Установите значение Managed для типа ManagedOnlineDeployment. Kubernetes
Managed (обязательный)
environmentId Идентификатор ресурса ARM или AssetId спецификации среды для развертывания конечной точки. струна
environmentVariables Конфигурация переменных среды для развертывания. EndpointDeploymentPropertiesBaseEnvironmentVariables
instanceType Тип вычислительного экземпляра. струна
livenessProbe Проба динамической активности регулярно отслеживает работоспособность контейнера. ProbeSettings
модель Путь URI к модели. струна
modelMountPath Путь к подключению модели в пользовательском контейнере. струна
свойства Словарь свойств. Свойства можно добавлять, но не удалять или изменять. EndpointDeploymentPropertiesBaseProperties
готовностьProbe Проверка готовности проверяет, готов ли контейнер обслуживать трафик. Свойства и значения по умолчанию совпадают с пробой активности. ProbeSettings
requestSettings Параметры запроса для развертывания. OnlineRequestSettings
scaleSettings Параметры масштабирования развертывания.
Если значение равно null или не указано,
По умолчанию значение TargetUtilizationScaleSettings для KubernetesOnlineDeployment
и значение DefaultScaleSettings для ManagedOnlineDeployment.
OnlineScaleSettings

OnlineRequestSettings

Имя Описание Ценность
maxConcurrentRequestsPerInstance Количество одновременных запросов на узел, разрешенных для каждого развертывания. Значение по умолчанию — 1. int
maxQueueWait (Не рекомендуется использовать для управляемых конечных точек в Интернете) Максимальное время пребывания запроса в очереди в формате ISO 8601.
Значение по умолчанию — 500 мс.
(Теперь увеличьте request_timeout_ms для учета любых задержек сети или очередей)
струна
requestTimeout Время ожидания оценки в формате ISO 8601.
Значение по умолчанию — 5000 мс.
струна

OnlineScaleSettings

Имя Описание Ценность
scaleType Установите значение Default для типа DefaultScaleSettings. Установите значение TargetUtilization для типа TargetUtilizationScaleSettings. По умолчанию
TargetUtilization (обязательный)

ПробыSettings

Имя Описание Ценность
failureThreshold Количество сбоев, которые необходимо разрешить, прежде чем возвращать неработоспособное состояние. int
initialDelay Задержка перед первой пробой в формате ISO 8601. струна
период Продолжительность времени между пробами в формате ISO 8601. струна
successThreshold Количество успешных проб перед возвратом работоспособного состояния. int
Времени ожидания Время ожидания пробы в формате ISO 8601. струна

Sku

Имя Описание Ценность
способность Если номер SKU поддерживает горизонтальное масштабирование или в, то целое число емкости должно быть включено. Если горизонтальное масштабирование невозможно для ресурса, это может быть опущено. int
семья Если служба имеет разные поколения оборудования для одного номера SKU, это можно записать здесь. струна
имя Имя номера SKU. Ex - P3. Обычно это код буквы и числа строка (обязательно)
размер Размер номера SKU. Если поле имени является сочетанием уровня и другого значения, это будет автономный код. струна
ярус Это поле необходимо реализовать поставщиком ресурсов, если служба имеет несколько уровней, но не требуется для PUT. "Базовый"
"Бесплатный"
"Премиум"
"Стандартный"

TargetUtilizationScaleSettings

Имя Описание Ценность
maxInstances Максимальное количество экземпляров, в которых развертывание может масштабироваться. Квота будет зарезервирована для max_instances. int
minInstances Минимальное количество экземпляров, которые всегда должны присутствовать. int
pollingInterval Интервал опроса в формате ISO 8691. Поддерживается только длительность с точностью до секунд. струна
scaleType [Обязательный] Тип алгоритма масштабирования развертывания TargetUtilization (обязательный)
targetUtilizationPercentage Целевое использование ЦП для автомасштабирования. int

TrackedResourceTags

Имя Описание Ценность

UserAssignedIdentities

Имя Описание Ценность

UserAssignedIdentity

Имя Описание Ценность