Áreas de trabajo de Microsoft.MachineLearningServices/onlineEndpoints/deployments 2021-03-01-preview
- Último
- 2024-10-01
- 2024-10-01-preview
- 2024-07-01-preview
- 2024-04-01
- 2024-04-01-preview
- 2024-01-01-preview
- 2023-10-01
- 2023-08-01-preview
- 2023-06-01-preview
- 2023-04-01
- 2023-04-01-preview
- 2023-02-01-preview
- 2022-12-01-preview
- 2022-10-01
- 2022-10-01-preview
- 2022-06-01-preview
- 2022-05-01
- 2022-02-01-preview
- 2021-03-01-preview
Definición de recursos de Bicep
El tipo de recurso workspaces/onlineEndpoints/deployments se puede implementar con operaciones destinadas a:
- grupos de recursos: consulte comandos de implementación de grupos de recursos
Para obtener una lista de las propiedades modificadas en cada versión de API, consulte registro de cambios.
Formato de recurso
Para crear un recurso Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments, agregue el siguiente bicep a la plantilla.
resource symbolicname 'Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2021-03-01-preview' = {
parent: resourceSymbolicName
identity: {
type: 'string'
userAssignedIdentities: {
{customized property}: {
clientId: 'string'
principalId: 'string'
}
}
}
kind: 'string'
location: 'string'
name: 'string'
properties: {
appInsightsEnabled: bool
codeConfiguration: {
codeId: 'string'
scoringScript: 'string'
}
description: 'string'
environmentId: 'string'
environmentVariables: {
{customized property}: 'string'
}
livenessProbe: {
failureThreshold: int
initialDelay: 'string'
period: 'string'
successThreshold: int
timeout: 'string'
}
model: {
referenceType: 'string'
// For remaining properties, see AssetReferenceBase objects
}
properties: {
{customized property}: 'string'
}
requestSettings: {
maxConcurrentRequestsPerInstance: int
maxQueueWait: 'string'
requestTimeout: 'string'
}
scaleSettings: {
maxInstances: int
minInstances: int
scaleType: 'string'
// For remaining properties, see OnlineScaleSettings objects
}
endpointComputeType: 'string'
// For remaining properties, see OnlineDeployment objects
}
tags: {
{customized property}: 'string'
}
}
Objetos OnlineDeployment
Establezca la propiedad endpointComputeType para especificar el tipo de objeto.
Para K8S, use:
{
containerResourceRequirements: {
cpu: int
cpuLimit: int
fpga: int
gpu: int
memoryInGB: int
memoryInGBLimit: int
}
endpointComputeType: 'K8S'
}
Para managed, use:
{
endpointComputeType: 'Managed'
instanceType: 'string'
readinessProbe: {
failureThreshold: int
initialDelay: 'string'
period: 'string'
successThreshold: int
timeout: 'string'
}
}
Objetos OnlineScaleSettings
Establezca la propiedad scaleType para especificar el tipo de objeto.
Para Auto, use:
{
pollingInterval: 'string'
scaleType: 'Auto'
targetUtilizationPercentage: int
}
Para manual, use:
{
instanceCount: int
scaleType: 'Manual'
}
Objetos AssetReferenceBase
Establezca la propiedad referenceType para especificar el tipo de objeto.
Para DataPath, use:
{
datastoreId: 'string'
path: 'string'
referenceType: 'DataPath'
}
Para id., use:
{
assetId: 'string'
referenceType: 'Id'
}
Para OutputPath, use:
{
jobId: 'string'
path: 'string'
referenceType: 'OutputPath'
}
Valores de propiedad
AssetReferenceBase
Nombre | Descripción | Valor |
---|---|---|
referenceType | Establezca en "DataPath" para el tipo DataPathAssetReference. Establezca en "Id" para el tipo IdAssetReference. Establezca en "OutputPath" para el tipo OutputPathAssetReference. | 'DataPath' 'Id' 'OutputPath' (obligatorio) |
AutoScaleSettings
Nombre | Descripción | Valor |
---|---|---|
pollingInterval | Intervalo de sondeo en formato ISO 8691. Solo admite la duración con una precisión tan baja como Segundos. | cuerda |
scaleType | [Obligatorio] Tipo de algoritmo de escalado de implementación | 'Auto' (obligatorio) |
targetUtilizationPercentage | Uso de CPU de destino para el escalador automático. | Int |
CodeConfiguration
Nombre | Descripción | Valor |
---|---|---|
codeId | Identificador de recurso de ARM del recurso de código. | cuerda |
scoringScript | [Obligatorio] Script que se va a ejecutar al iniciarse. Eg. "score.py" | cuerda Restricciones: Longitud mínima = 1 Patrón = [a-zA-Z0-9_] (obligatorio) |
ContainerResourceRequirements
Nombre | Descripción | Valor |
---|---|---|
CPU | Cantidad mínima de núcleos de CPU que va a usar el contenedor. Más información: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
Int |
cpuLimit | Cantidad máxima de núcleos de CPU que el contenedor permite usar. Más información: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
Int |
fpga | Número de dispositivos PCIE de FPGA expuestos al contenedor. Debe ser múltiplo de 2. | Int |
Gpu | Número de núcleos de GPU en el contenedor. | Int |
memoryInGB | Cantidad mínima de memoria (en GB) que usará el contenedor. Más información: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
Int |
memoryInGBLimit | El contenedor permite usar la cantidad máxima de memoria (en GB). Más información: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
Int |
DataPathAssetReference
Nombre | Descripción | Valor |
---|---|---|
datastoreId | Identificador de recurso de ARM del almacén de datos donde se encuentra el recurso. | cuerda |
camino | Ruta de acceso del archivo o directorio en el almacén de datos. | cuerda |
referenceType | [Obligatorio] Especifica el tipo de referencia de recurso. | 'DataPath' (obligatorio) |
IdAssetReference
Nombre | Descripción | Valor |
---|---|---|
assetId | [Obligatorio] Identificador de recurso de ARM del recurso. | cuerda Restricciones: Patrón = [a-zA-Z0-9_] (obligatorio) |
referenceType | [Obligatorio] Especifica el tipo de referencia de recurso. | 'Id' (obligatorio) |
K8SOnlineDeployment
Nombre | Descripción | Valor |
---|---|---|
containerResourceRequirements | Requisitos de recursos para cada instancia de contenedor dentro de una implementación en línea. | containerResourceRequirements |
endpointComputeType | [Obligatorio] Tipo de proceso del punto de conexión. | 'K8S' (obligatorio) |
ManagedOnlineDeployment
Nombre | Descripción | Valor |
---|---|---|
endpointComputeType | [Obligatorio] Tipo de proceso del punto de conexión. | "Administrado" (obligatorio) |
instanceType | Tipo de instancia de proceso. | cuerda |
readinessProbe | Configuración del sondeo de preparación y ejecución del contenedor de implementación. | probeSettings |
ManualScaleSettings
Nombre | Descripción | Valor |
---|---|---|
instanceCount | Número fijo de instancias para esta implementación. | Int |
scaleType | [Obligatorio] Tipo de algoritmo de escalado de implementación | 'Manual' (obligatorio) |
Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments
Nombre | Descripción | Valor |
---|---|---|
identidad | Identidad de servicio asociada a un recurso. | resourceIdentity |
amable | Metadatos usados por el portal,herramientas/etcetera para representar experiencias de experiencia de usuario diferentes para los recursos del mismo tipo. | cuerda |
ubicación | Ubicación geográfica donde reside el recurso | string (obligatorio) |
nombre | El nombre del recurso | cuerda Restricciones: Patrón = ^[a-zA-Z0-9][a-zA-Z0-9\-_]{0,254}$ (obligatorio) |
padre | En Bicep, puede especificar el recurso primario para un recurso secundario. Solo tiene que agregar esta propiedad cuando el recurso secundario se declara fuera del recurso primario. Para obtener más información, consulte recurso secundario fuera del recurso primario. |
Nombre simbólico del recurso de tipo: áreas de trabajo/onlineEndpoints |
Propiedades | [Obligatorio] Atributos adicionales de la entidad. | OnlineDeployment (obligatorio) |
Etiquetas | Etiquetas del recurso | Diccionario de nombres y valores de etiqueta. Consulte etiquetas de en plantillas |
OnlineDeployment
Nombre | Descripción | Valor |
---|---|---|
appInsightsEnabled | Si es true, habilita el registro de Application Insights. | Bool |
codeConfiguration | Configuración de código para la implementación del punto de conexión. | CodeConfiguration |
descripción | Descripción de la implementación del punto de conexión. | cuerda |
endpointComputeType | Establezca en "K8S" para el tipo K8SOnlineDeployment. Establezca en "Administrado" para el tipo ManagedOnlineDeployment. | 'K8S' "Administrado" (obligatorio) |
environmentId | Identificador de recurso de ARM de la especificación del entorno para la implementación del punto de conexión. | cuerda |
environmentVariables | Configuración de variables de entorno para la implementación. | OnlineDeploymentEnvironmentVariables |
livenessProbe | Configuración del sondeo de preparación y ejecución del contenedor de implementación. | probeSettings |
modelo | Referencia al recurso de modelo para la implementación del punto de conexión. | AssetReferenceBase |
Propiedades | Diccionario de propiedades. Se pueden agregar propiedades, pero no se pueden quitar ni modificar. | OnlineDeploymentProperties |
requestSettings | Configuración de solicitudes de puntuación de implementación en línea. | |
scaleSettings | Configuración de escalado de implementación en línea. | |
OnlineDeploymentEnvironmentVariables
Nombre | Descripción | Valor |
---|
OnlineDeploymentProperties
Nombre | Descripción | Valor |
---|
OnlineRequestSettings
Nombre | Descripción | Valor |
---|---|---|
maxConcurrentRequestsPerInstance | Número de solicitudes que se pueden poner en cola a la vez para esta implementación. | Int |
maxQueueWait | Tiempo máximo de espera de cola en formato ISO 8601. Admite precisión de milisegundos. | cuerda |
requestTimeout | Tiempo de espera de solicitud en formato ISO 8601. Admite precisión de milisegundos. | cuerda |
OnlineScaleSettings
Nombre | Descripción | Valor |
---|---|---|
maxInstances | Número máximo de instancias para esta implementación. | Int |
minInstances | Número mínimo de instancias para esta implementación. | Int |
scaleType | Establezca en "Auto" para el tipo AutoScaleSettings. Establezca en "Manual" para el tipo ManualScaleSettings. | 'Auto' 'Manual' (obligatorio) |
OutputPathAssetReference
Nombre | Descripción | Valor |
---|---|---|
jobId | Identificador de recurso de ARM del trabajo. | cuerda |
camino | Ruta de acceso del archivo o directorio en la salida del trabajo. | cuerda |
referenceType | [Obligatorio] Especifica el tipo de referencia de recurso. | 'OutputPath' (obligatorio) |
ProbeSettings
Nombre | Descripción | Valor |
---|---|---|
failureThreshold | Número de errores que se deben permitir antes de devolver un estado incorrecto. | Int |
initialDelay | Retraso antes del primer sondeo en formato ISO 8601. | cuerda |
periodo | El período de tiempo entre sondeos en formato ISO 8601. | cuerda |
successThreshold | Número de sondeos correctos antes de devolver un estado correcto. | Int |
interrupción | Tiempo de espera del sondeo en formato ISO 8601. | cuerda |
ResourceIdentity
ResourceIdentityUserAssignedIdentities
Nombre | Descripción | Valor |
---|
TrackedResourceTags
Nombre | Descripción | Valor |
---|
UserAssignedIdentityMeta
Nombre | Descripción | Valor |
---|---|---|
clientId | También conocido como identificador de aplicación, un identificador único generado por Azure AD que está vinculado a una aplicación y una entidad de servicio durante su aprovisionamiento inicial. | cuerda |
principalId | Identificador de objeto del objeto de entidad de servicio de la identidad administrada que se usa para conceder acceso basado en roles a un recurso de Azure. | cuerda |
Definición de recursos de plantilla de ARM
El tipo de recurso workspaces/onlineEndpoints/deployments se puede implementar con operaciones destinadas a:
- grupos de recursos: consulte comandos de implementación de grupos de recursos
Para obtener una lista de las propiedades modificadas en cada versión de API, consulte registro de cambios.
Formato de recurso
Para crear un recurso Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments, agregue el siguiente JSON a la plantilla.
{
"type": "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments",
"apiVersion": "2021-03-01-preview",
"name": "string",
"identity": {
"type": "string",
"userAssignedIdentities": {
"{customized property}": {
"clientId": "string",
"principalId": "string"
}
}
},
"kind": "string",
"location": "string",
"properties": {
"appInsightsEnabled": "bool",
"codeConfiguration": {
"codeId": "string",
"scoringScript": "string"
},
"description": "string",
"environmentId": "string",
"environmentVariables": {
"{customized property}": "string"
},
"livenessProbe": {
"failureThreshold": "int",
"initialDelay": "string",
"period": "string",
"successThreshold": "int",
"timeout": "string"
},
"model": {
"referenceType": "string"
// For remaining properties, see AssetReferenceBase objects
},
"properties": {
"{customized property}": "string"
},
"requestSettings": {
"maxConcurrentRequestsPerInstance": "int",
"maxQueueWait": "string",
"requestTimeout": "string"
},
"scaleSettings": {
"maxInstances": "int",
"minInstances": "int",
"scaleType": "string"
// For remaining properties, see OnlineScaleSettings objects
},
"endpointComputeType": "string"
// For remaining properties, see OnlineDeployment objects
},
"tags": {
"{customized property}": "string"
}
}
Objetos OnlineDeployment
Establezca la propiedad endpointComputeType para especificar el tipo de objeto.
Para K8S, use:
{
"containerResourceRequirements": {
"cpu": "int",
"cpuLimit": "int",
"fpga": "int",
"gpu": "int",
"memoryInGB": "int",
"memoryInGBLimit": "int"
},
"endpointComputeType": "K8S"
}
Para managed, use:
{
"endpointComputeType": "Managed",
"instanceType": "string",
"readinessProbe": {
"failureThreshold": "int",
"initialDelay": "string",
"period": "string",
"successThreshold": "int",
"timeout": "string"
}
}
Objetos OnlineScaleSettings
Establezca la propiedad scaleType para especificar el tipo de objeto.
Para Auto, use:
{
"pollingInterval": "string",
"scaleType": "Auto",
"targetUtilizationPercentage": "int"
}
Para manual, use:
{
"instanceCount": "int",
"scaleType": "Manual"
}
Objetos AssetReferenceBase
Establezca la propiedad referenceType para especificar el tipo de objeto.
Para DataPath, use:
{
"datastoreId": "string",
"path": "string",
"referenceType": "DataPath"
}
Para id., use:
{
"assetId": "string",
"referenceType": "Id"
}
Para OutputPath, use:
{
"jobId": "string",
"path": "string",
"referenceType": "OutputPath"
}
Valores de propiedad
AssetReferenceBase
Nombre | Descripción | Valor |
---|---|---|
referenceType | Establezca en "DataPath" para el tipo DataPathAssetReference. Establezca en "Id" para el tipo IdAssetReference. Establezca en "OutputPath" para el tipo OutputPathAssetReference. | 'DataPath' 'Id' 'OutputPath' (obligatorio) |
AutoScaleSettings
Nombre | Descripción | Valor |
---|---|---|
pollingInterval | Intervalo de sondeo en formato ISO 8691. Solo admite la duración con una precisión tan baja como Segundos. | cuerda |
scaleType | [Obligatorio] Tipo de algoritmo de escalado de implementación | 'Auto' (obligatorio) |
targetUtilizationPercentage | Uso de CPU de destino para el escalador automático. | Int |
CodeConfiguration
Nombre | Descripción | Valor |
---|---|---|
codeId | Identificador de recurso de ARM del recurso de código. | cuerda |
scoringScript | [Obligatorio] Script que se va a ejecutar al iniciarse. Eg. "score.py" | cuerda Restricciones: Longitud mínima = 1 Patrón = [a-zA-Z0-9_] (obligatorio) |
ContainerResourceRequirements
Nombre | Descripción | Valor |
---|---|---|
CPU | Cantidad mínima de núcleos de CPU que va a usar el contenedor. Más información: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
Int |
cpuLimit | Cantidad máxima de núcleos de CPU que el contenedor permite usar. Más información: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
Int |
fpga | Número de dispositivos PCIE de FPGA expuestos al contenedor. Debe ser múltiplo de 2. | Int |
Gpu | Número de núcleos de GPU en el contenedor. | Int |
memoryInGB | Cantidad mínima de memoria (en GB) que usará el contenedor. Más información: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
Int |
memoryInGBLimit | El contenedor permite usar la cantidad máxima de memoria (en GB). Más información: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
Int |
DataPathAssetReference
Nombre | Descripción | Valor |
---|---|---|
datastoreId | Identificador de recurso de ARM del almacén de datos donde se encuentra el recurso. | cuerda |
camino | Ruta de acceso del archivo o directorio en el almacén de datos. | cuerda |
referenceType | [Obligatorio] Especifica el tipo de referencia de recurso. | 'DataPath' (obligatorio) |
IdAssetReference
Nombre | Descripción | Valor |
---|---|---|
assetId | [Obligatorio] Identificador de recurso de ARM del recurso. | cuerda Restricciones: Patrón = [a-zA-Z0-9_] (obligatorio) |
referenceType | [Obligatorio] Especifica el tipo de referencia de recurso. | 'Id' (obligatorio) |
K8SOnlineDeployment
Nombre | Descripción | Valor |
---|---|---|
containerResourceRequirements | Requisitos de recursos para cada instancia de contenedor dentro de una implementación en línea. | containerResourceRequirements |
endpointComputeType | [Obligatorio] Tipo de proceso del punto de conexión. | 'K8S' (obligatorio) |
ManagedOnlineDeployment
Nombre | Descripción | Valor |
---|---|---|
endpointComputeType | [Obligatorio] Tipo de proceso del punto de conexión. | "Administrado" (obligatorio) |
instanceType | Tipo de instancia de proceso. | cuerda |
readinessProbe | Configuración del sondeo de preparación y ejecución del contenedor de implementación. | probeSettings |
ManualScaleSettings
Nombre | Descripción | Valor |
---|---|---|
instanceCount | Número fijo de instancias para esta implementación. | Int |
scaleType | [Obligatorio] Tipo de algoritmo de escalado de implementación | 'Manual' (obligatorio) |
Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments
Nombre | Descripción | Valor |
---|---|---|
apiVersion | La versión de api | '2021-03-01-preview' |
identidad | Identidad de servicio asociada a un recurso. | resourceIdentity |
amable | Metadatos usados por el portal,herramientas/etcetera para representar experiencias de experiencia de usuario diferentes para los recursos del mismo tipo. | cuerda |
ubicación | Ubicación geográfica donde reside el recurso | string (obligatorio) |
nombre | El nombre del recurso | cuerda Restricciones: Patrón = ^[a-zA-Z0-9][a-zA-Z0-9\-_]{0,254}$ (obligatorio) |
Propiedades | [Obligatorio] Atributos adicionales de la entidad. | OnlineDeployment (obligatorio) |
Etiquetas | Etiquetas del recurso | Diccionario de nombres y valores de etiqueta. Consulte etiquetas de en plantillas |
tipo | El tipo de recurso | 'Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments' |
OnlineDeployment
Nombre | Descripción | Valor |
---|---|---|
appInsightsEnabled | Si es true, habilita el registro de Application Insights. | Bool |
codeConfiguration | Configuración de código para la implementación del punto de conexión. | CodeConfiguration |
descripción | Descripción de la implementación del punto de conexión. | cuerda |
endpointComputeType | Establezca en "K8S" para el tipo K8SOnlineDeployment. Establezca en "Administrado" para el tipo ManagedOnlineDeployment. | 'K8S' "Administrado" (obligatorio) |
environmentId | Identificador de recurso de ARM de la especificación del entorno para la implementación del punto de conexión. | cuerda |
environmentVariables | Configuración de variables de entorno para la implementación. | OnlineDeploymentEnvironmentVariables |
livenessProbe | Configuración del sondeo de preparación y ejecución del contenedor de implementación. | probeSettings |
modelo | Referencia al recurso de modelo para la implementación del punto de conexión. | AssetReferenceBase |
Propiedades | Diccionario de propiedades. Se pueden agregar propiedades, pero no se pueden quitar ni modificar. | OnlineDeploymentProperties |
requestSettings | Configuración de solicitudes de puntuación de implementación en línea. | |
scaleSettings | Configuración de escalado de implementación en línea. | |
OnlineDeploymentEnvironmentVariables
Nombre | Descripción | Valor |
---|
OnlineDeploymentProperties
Nombre | Descripción | Valor |
---|
OnlineRequestSettings
Nombre | Descripción | Valor |
---|---|---|
maxConcurrentRequestsPerInstance | Número de solicitudes que se pueden poner en cola a la vez para esta implementación. | Int |
maxQueueWait | Tiempo máximo de espera de cola en formato ISO 8601. Admite precisión de milisegundos. | cuerda |
requestTimeout | Tiempo de espera de solicitud en formato ISO 8601. Admite precisión de milisegundos. | cuerda |
OnlineScaleSettings
Nombre | Descripción | Valor |
---|---|---|
maxInstances | Número máximo de instancias para esta implementación. | Int |
minInstances | Número mínimo de instancias para esta implementación. | Int |
scaleType | Establezca en "Auto" para el tipo AutoScaleSettings. Establezca en "Manual" para el tipo ManualScaleSettings. | 'Auto' 'Manual' (obligatorio) |
OutputPathAssetReference
Nombre | Descripción | Valor |
---|---|---|
jobId | Identificador de recurso de ARM del trabajo. | cuerda |
camino | Ruta de acceso del archivo o directorio en la salida del trabajo. | cuerda |
referenceType | [Obligatorio] Especifica el tipo de referencia de recurso. | 'OutputPath' (obligatorio) |
ProbeSettings
Nombre | Descripción | Valor |
---|---|---|
failureThreshold | Número de errores que se deben permitir antes de devolver un estado incorrecto. | Int |
initialDelay | Retraso antes del primer sondeo en formato ISO 8601. | cuerda |
periodo | El período de tiempo entre sondeos en formato ISO 8601. | cuerda |
successThreshold | Número de sondeos correctos antes de devolver un estado correcto. | Int |
interrupción | Tiempo de espera del sondeo en formato ISO 8601. | cuerda |
ResourceIdentity
ResourceIdentityUserAssignedIdentities
Nombre | Descripción | Valor |
---|
TrackedResourceTags
Nombre | Descripción | Valor |
---|
UserAssignedIdentityMeta
Nombre | Descripción | Valor |
---|---|---|
clientId | También conocido como identificador de aplicación, un identificador único generado por Azure AD que está vinculado a una aplicación y una entidad de servicio durante su aprovisionamiento inicial. | cuerda |
principalId | Identificador de objeto del objeto de entidad de servicio de la identidad administrada que se usa para conceder acceso basado en roles a un recurso de Azure. | cuerda |
Definición de recursos de Terraform (proveedor AzAPI)
El tipo de recurso workspaces/onlineEndpoints/deployments se puede implementar con operaciones destinadas a:
- grupos de recursos de
Para obtener una lista de las propiedades modificadas en cada versión de API, consulte registro de cambios.
Formato de recurso
Para crear un recurso Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments, agregue el siguiente terraform a la plantilla.
resource "azapi_resource" "symbolicname" {
type = "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2021-03-01-preview"
name = "string"
identity = {
type = "string"
userAssignedIdentities = {
{customized property} = {
clientId = "string"
principalId = "string"
}
}
}
kind = "string"
location = "string"
tags = {
{customized property} = "string"
}
body = jsonencode({
properties = {
appInsightsEnabled = bool
codeConfiguration = {
codeId = "string"
scoringScript = "string"
}
description = "string"
environmentId = "string"
environmentVariables = {
{customized property} = "string"
}
livenessProbe = {
failureThreshold = int
initialDelay = "string"
period = "string"
successThreshold = int
timeout = "string"
}
model = {
referenceType = "string"
// For remaining properties, see AssetReferenceBase objects
}
properties = {
{customized property} = "string"
}
requestSettings = {
maxConcurrentRequestsPerInstance = int
maxQueueWait = "string"
requestTimeout = "string"
}
scaleSettings = {
maxInstances = int
minInstances = int
scaleType = "string"
// For remaining properties, see OnlineScaleSettings objects
}
endpointComputeType = "string"
// For remaining properties, see OnlineDeployment objects
}
})
}
Objetos OnlineDeployment
Establezca la propiedad endpointComputeType para especificar el tipo de objeto.
Para K8S, use:
{
containerResourceRequirements = {
cpu = int
cpuLimit = int
fpga = int
gpu = int
memoryInGB = int
memoryInGBLimit = int
}
endpointComputeType = "K8S"
}
Para managed, use:
{
endpointComputeType = "Managed"
instanceType = "string"
readinessProbe = {
failureThreshold = int
initialDelay = "string"
period = "string"
successThreshold = int
timeout = "string"
}
}
Objetos OnlineScaleSettings
Establezca la propiedad scaleType para especificar el tipo de objeto.
Para Auto, use:
{
pollingInterval = "string"
scaleType = "Auto"
targetUtilizationPercentage = int
}
Para manual, use:
{
instanceCount = int
scaleType = "Manual"
}
Objetos AssetReferenceBase
Establezca la propiedad referenceType para especificar el tipo de objeto.
Para DataPath, use:
{
datastoreId = "string"
path = "string"
referenceType = "DataPath"
}
Para id., use:
{
assetId = "string"
referenceType = "Id"
}
Para OutputPath, use:
{
jobId = "string"
path = "string"
referenceType = "OutputPath"
}
Valores de propiedad
AssetReferenceBase
Nombre | Descripción | Valor |
---|---|---|
referenceType | Establezca en "DataPath" para el tipo DataPathAssetReference. Establezca en "Id" para el tipo IdAssetReference. Establezca en "OutputPath" para el tipo OutputPathAssetReference. | 'DataPath' 'Id' 'OutputPath' (obligatorio) |
AutoScaleSettings
Nombre | Descripción | Valor |
---|---|---|
pollingInterval | Intervalo de sondeo en formato ISO 8691. Solo admite la duración con una precisión tan baja como Segundos. | cuerda |
scaleType | [Obligatorio] Tipo de algoritmo de escalado de implementación | 'Auto' (obligatorio) |
targetUtilizationPercentage | Uso de CPU de destino para el escalador automático. | Int |
CodeConfiguration
Nombre | Descripción | Valor |
---|---|---|
codeId | Identificador de recurso de ARM del recurso de código. | cuerda |
scoringScript | [Obligatorio] Script que se va a ejecutar al iniciarse. Eg. "score.py" | cuerda Restricciones: Longitud mínima = 1 Patrón = [a-zA-Z0-9_] (obligatorio) |
ContainerResourceRequirements
Nombre | Descripción | Valor |
---|---|---|
CPU | Cantidad mínima de núcleos de CPU que va a usar el contenedor. Más información: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
Int |
cpuLimit | Cantidad máxima de núcleos de CPU que el contenedor permite usar. Más información: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
Int |
fpga | Número de dispositivos PCIE de FPGA expuestos al contenedor. Debe ser múltiplo de 2. | Int |
Gpu | Número de núcleos de GPU en el contenedor. | Int |
memoryInGB | Cantidad mínima de memoria (en GB) que usará el contenedor. Más información: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
Int |
memoryInGBLimit | El contenedor permite usar la cantidad máxima de memoria (en GB). Más información: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
Int |
DataPathAssetReference
Nombre | Descripción | Valor |
---|---|---|
datastoreId | Identificador de recurso de ARM del almacén de datos donde se encuentra el recurso. | cuerda |
camino | Ruta de acceso del archivo o directorio en el almacén de datos. | cuerda |
referenceType | [Obligatorio] Especifica el tipo de referencia de recurso. | 'DataPath' (obligatorio) |
IdAssetReference
Nombre | Descripción | Valor |
---|---|---|
assetId | [Obligatorio] Identificador de recurso de ARM del recurso. | cuerda Restricciones: Patrón = [a-zA-Z0-9_] (obligatorio) |
referenceType | [Obligatorio] Especifica el tipo de referencia de recurso. | 'Id' (obligatorio) |
K8SOnlineDeployment
Nombre | Descripción | Valor |
---|---|---|
containerResourceRequirements | Requisitos de recursos para cada instancia de contenedor dentro de una implementación en línea. | containerResourceRequirements |
endpointComputeType | [Obligatorio] Tipo de proceso del punto de conexión. | 'K8S' (obligatorio) |
ManagedOnlineDeployment
Nombre | Descripción | Valor |
---|---|---|
endpointComputeType | [Obligatorio] Tipo de proceso del punto de conexión. | "Administrado" (obligatorio) |
instanceType | Tipo de instancia de proceso. | cuerda |
readinessProbe | Configuración del sondeo de preparación y ejecución del contenedor de implementación. | probeSettings |
ManualScaleSettings
Nombre | Descripción | Valor |
---|---|---|
instanceCount | Número fijo de instancias para esta implementación. | Int |
scaleType | [Obligatorio] Tipo de algoritmo de escalado de implementación | 'Manual' (obligatorio) |
Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments
Nombre | Descripción | Valor |
---|---|---|
identidad | Identidad de servicio asociada a un recurso. | resourceIdentity |
amable | Metadatos usados por el portal,herramientas/etcetera para representar experiencias de experiencia de usuario diferentes para los recursos del mismo tipo. | cuerda |
ubicación | Ubicación geográfica donde reside el recurso | string (obligatorio) |
nombre | El nombre del recurso | cuerda Restricciones: Patrón = ^[a-zA-Z0-9][a-zA-Z0-9\-_]{0,254}$ (obligatorio) |
parent_id | Identificador del recurso que es el elemento primario de este recurso. | Identificador del recurso de tipo: áreas de trabajo/onlineEndpoints |
Propiedades | [Obligatorio] Atributos adicionales de la entidad. | OnlineDeployment (obligatorio) |
Etiquetas | Etiquetas del recurso | Diccionario de nombres y valores de etiqueta. |
tipo | El tipo de recurso | "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2021-03-01-preview" |
OnlineDeployment
Nombre | Descripción | Valor |
---|---|---|
appInsightsEnabled | Si es true, habilita el registro de Application Insights. | Bool |
codeConfiguration | Configuración de código para la implementación del punto de conexión. | CodeConfiguration |
descripción | Descripción de la implementación del punto de conexión. | cuerda |
endpointComputeType | Establezca en "K8S" para el tipo K8SOnlineDeployment. Establezca en "Administrado" para el tipo ManagedOnlineDeployment. | 'K8S' "Administrado" (obligatorio) |
environmentId | Identificador de recurso de ARM de la especificación del entorno para la implementación del punto de conexión. | cuerda |
environmentVariables | Configuración de variables de entorno para la implementación. | OnlineDeploymentEnvironmentVariables |
livenessProbe | Configuración del sondeo de preparación y ejecución del contenedor de implementación. | probeSettings |
modelo | Referencia al recurso de modelo para la implementación del punto de conexión. | AssetReferenceBase |
Propiedades | Diccionario de propiedades. Se pueden agregar propiedades, pero no se pueden quitar ni modificar. | OnlineDeploymentProperties |
requestSettings | Configuración de solicitudes de puntuación de implementación en línea. | |
scaleSettings | Configuración de escalado de implementación en línea. | |
OnlineDeploymentEnvironmentVariables
Nombre | Descripción | Valor |
---|
OnlineDeploymentProperties
Nombre | Descripción | Valor |
---|
OnlineRequestSettings
Nombre | Descripción | Valor |
---|---|---|
maxConcurrentRequestsPerInstance | Número de solicitudes que se pueden poner en cola a la vez para esta implementación. | Int |
maxQueueWait | Tiempo máximo de espera de cola en formato ISO 8601. Admite precisión de milisegundos. | cuerda |
requestTimeout | Tiempo de espera de solicitud en formato ISO 8601. Admite precisión de milisegundos. | cuerda |
OnlineScaleSettings
Nombre | Descripción | Valor |
---|---|---|
maxInstances | Número máximo de instancias para esta implementación. | Int |
minInstances | Número mínimo de instancias para esta implementación. | Int |
scaleType | Establezca en "Auto" para el tipo AutoScaleSettings. Establezca en "Manual" para el tipo ManualScaleSettings. | 'Auto' 'Manual' (obligatorio) |
OutputPathAssetReference
Nombre | Descripción | Valor |
---|---|---|
jobId | Identificador de recurso de ARM del trabajo. | cuerda |
camino | Ruta de acceso del archivo o directorio en la salida del trabajo. | cuerda |
referenceType | [Obligatorio] Especifica el tipo de referencia de recurso. | 'OutputPath' (obligatorio) |
ProbeSettings
Nombre | Descripción | Valor |
---|---|---|
failureThreshold | Número de errores que se deben permitir antes de devolver un estado incorrecto. | Int |
initialDelay | Retraso antes del primer sondeo en formato ISO 8601. | cuerda |
periodo | El período de tiempo entre sondeos en formato ISO 8601. | cuerda |
successThreshold | Número de sondeos correctos antes de devolver un estado correcto. | Int |
interrupción | Tiempo de espera del sondeo en formato ISO 8601. | cuerda |
ResourceIdentity
ResourceIdentityUserAssignedIdentities
Nombre | Descripción | Valor |
---|
TrackedResourceTags
Nombre | Descripción | Valor |
---|
UserAssignedIdentityMeta
Nombre | Descripción | Valor |
---|---|---|
clientId | También conocido como identificador de aplicación, un identificador único generado por Azure AD que está vinculado a una aplicación y una entidad de servicio durante su aprovisionamiento inicial. | cuerda |
principalId | Identificador de objeto del objeto de entidad de servicio de la identidad administrada que se usa para conceder acceso basado en roles a un recurso de Azure. | cuerda |