Compartir a través de


Áreas de trabajo de Microsoft.MachineLearningServices/onlineEndpoints/deployments 2021-03-01-preview

Definición de recursos de Bicep

El tipo de recurso workspaces/onlineEndpoints/deployments se puede implementar con operaciones destinadas a:

Para obtener una lista de las propiedades modificadas en cada versión de API, consulte registro de cambios.

Formato de recurso

Para crear un recurso Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments, agregue el siguiente bicep a la plantilla.

resource symbolicname 'Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2021-03-01-preview' = {
  parent: resourceSymbolicName
  identity: {
    type: 'string'
    userAssignedIdentities: {
      {customized property}: {
        clientId: 'string'
        principalId: 'string'
      }
    }
  }
  kind: 'string'
  location: 'string'
  name: 'string'
  properties: {
    appInsightsEnabled: bool
    codeConfiguration: {
      codeId: 'string'
      scoringScript: 'string'
    }
    description: 'string'
    environmentId: 'string'
    environmentVariables: {
      {customized property}: 'string'
    }
    livenessProbe: {
      failureThreshold: int
      initialDelay: 'string'
      period: 'string'
      successThreshold: int
      timeout: 'string'
    }
    model: {
      referenceType: 'string'
      // For remaining properties, see AssetReferenceBase objects
    }
    properties: {
      {customized property}: 'string'
    }
    requestSettings: {
      maxConcurrentRequestsPerInstance: int
      maxQueueWait: 'string'
      requestTimeout: 'string'
    }
    scaleSettings: {
      maxInstances: int
      minInstances: int
      scaleType: 'string'
      // For remaining properties, see OnlineScaleSettings objects
    }
    endpointComputeType: 'string'
    // For remaining properties, see OnlineDeployment objects
  }
  tags: {
    {customized property}: 'string'
  }
}

Objetos OnlineDeployment

Establezca la propiedad endpointComputeType para especificar el tipo de objeto.

Para K8S, use:

{
  containerResourceRequirements: {
    cpu: int
    cpuLimit: int
    fpga: int
    gpu: int
    memoryInGB: int
    memoryInGBLimit: int
  }
  endpointComputeType: 'K8S'
}

Para managed, use:

{
  endpointComputeType: 'Managed'
  instanceType: 'string'
  readinessProbe: {
    failureThreshold: int
    initialDelay: 'string'
    period: 'string'
    successThreshold: int
    timeout: 'string'
  }
}

Objetos OnlineScaleSettings

Establezca la propiedad scaleType para especificar el tipo de objeto.

Para Auto, use:

{
  pollingInterval: 'string'
  scaleType: 'Auto'
  targetUtilizationPercentage: int
}

Para manual, use:

{
  instanceCount: int
  scaleType: 'Manual'
}

Objetos AssetReferenceBase

Establezca la propiedad referenceType para especificar el tipo de objeto.

Para DataPath, use:

{
  datastoreId: 'string'
  path: 'string'
  referenceType: 'DataPath'
}

Para id., use:

{
  assetId: 'string'
  referenceType: 'Id'
}

Para OutputPath, use:

{
  jobId: 'string'
  path: 'string'
  referenceType: 'OutputPath'
}

Valores de propiedad

AssetReferenceBase

Nombre Descripción Valor
referenceType Establezca en "DataPath" para el tipo DataPathAssetReference. Establezca en "Id" para el tipo IdAssetReference. Establezca en "OutputPath" para el tipo OutputPathAssetReference. 'DataPath'
'Id'
'OutputPath' (obligatorio)

AutoScaleSettings

Nombre Descripción Valor
pollingInterval Intervalo de sondeo en formato ISO 8691. Solo admite la duración con una precisión tan baja como Segundos. cuerda
scaleType [Obligatorio] Tipo de algoritmo de escalado de implementación 'Auto' (obligatorio)
targetUtilizationPercentage Uso de CPU de destino para el escalador automático. Int

CodeConfiguration

Nombre Descripción Valor
codeId Identificador de recurso de ARM del recurso de código. cuerda
scoringScript [Obligatorio] Script que se va a ejecutar al iniciarse. Eg. "score.py" cuerda

Restricciones:
Longitud mínima = 1
Patrón = [a-zA-Z0-9_] (obligatorio)

ContainerResourceRequirements

Nombre Descripción Valor
CPU Cantidad mínima de núcleos de CPU que va a usar el contenedor. Más información:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
Int
cpuLimit Cantidad máxima de núcleos de CPU que el contenedor permite usar. Más información:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
Int
fpga Número de dispositivos PCIE de FPGA expuestos al contenedor. Debe ser múltiplo de 2. Int
Gpu Número de núcleos de GPU en el contenedor. Int
memoryInGB Cantidad mínima de memoria (en GB) que usará el contenedor. Más información:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
Int
memoryInGBLimit El contenedor permite usar la cantidad máxima de memoria (en GB). Más información:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
Int

DataPathAssetReference

Nombre Descripción Valor
datastoreId Identificador de recurso de ARM del almacén de datos donde se encuentra el recurso. cuerda
camino Ruta de acceso del archivo o directorio en el almacén de datos. cuerda
referenceType [Obligatorio] Especifica el tipo de referencia de recurso. 'DataPath' (obligatorio)

IdAssetReference

Nombre Descripción Valor
assetId [Obligatorio] Identificador de recurso de ARM del recurso. cuerda

Restricciones:
Patrón = [a-zA-Z0-9_] (obligatorio)
referenceType [Obligatorio] Especifica el tipo de referencia de recurso. 'Id' (obligatorio)

K8SOnlineDeployment

Nombre Descripción Valor
containerResourceRequirements Requisitos de recursos para cada instancia de contenedor dentro de una implementación en línea. containerResourceRequirements
endpointComputeType [Obligatorio] Tipo de proceso del punto de conexión. 'K8S' (obligatorio)

ManagedOnlineDeployment

Nombre Descripción Valor
endpointComputeType [Obligatorio] Tipo de proceso del punto de conexión. "Administrado" (obligatorio)
instanceType Tipo de instancia de proceso. cuerda
readinessProbe Configuración del sondeo de preparación y ejecución del contenedor de implementación. probeSettings

ManualScaleSettings

Nombre Descripción Valor
instanceCount Número fijo de instancias para esta implementación. Int
scaleType [Obligatorio] Tipo de algoritmo de escalado de implementación 'Manual' (obligatorio)

Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments

Nombre Descripción Valor
identidad Identidad de servicio asociada a un recurso. resourceIdentity
amable Metadatos usados por el portal,herramientas/etcetera para representar experiencias de experiencia de usuario diferentes para los recursos del mismo tipo. cuerda
ubicación Ubicación geográfica donde reside el recurso string (obligatorio)
nombre El nombre del recurso cuerda

Restricciones:
Patrón = ^[a-zA-Z0-9][a-zA-Z0-9\-_]{0,254}$ (obligatorio)
padre En Bicep, puede especificar el recurso primario para un recurso secundario. Solo tiene que agregar esta propiedad cuando el recurso secundario se declara fuera del recurso primario.

Para obtener más información, consulte recurso secundario fuera del recurso primario.
Nombre simbólico del recurso de tipo: áreas de trabajo/onlineEndpoints
Propiedades [Obligatorio] Atributos adicionales de la entidad. OnlineDeployment (obligatorio)
Etiquetas Etiquetas del recurso Diccionario de nombres y valores de etiqueta. Consulte etiquetas de en plantillas

OnlineDeployment

Nombre Descripción Valor
appInsightsEnabled Si es true, habilita el registro de Application Insights. Bool
codeConfiguration Configuración de código para la implementación del punto de conexión. CodeConfiguration
descripción Descripción de la implementación del punto de conexión. cuerda
endpointComputeType Establezca en "K8S" para el tipo K8SOnlineDeployment. Establezca en "Administrado" para el tipo ManagedOnlineDeployment. 'K8S'
"Administrado" (obligatorio)
environmentId Identificador de recurso de ARM de la especificación del entorno para la implementación del punto de conexión. cuerda
environmentVariables Configuración de variables de entorno para la implementación. OnlineDeploymentEnvironmentVariables
livenessProbe Configuración del sondeo de preparación y ejecución del contenedor de implementación. probeSettings
modelo Referencia al recurso de modelo para la implementación del punto de conexión. AssetReferenceBase
Propiedades Diccionario de propiedades. Se pueden agregar propiedades, pero no se pueden quitar ni modificar. OnlineDeploymentProperties
requestSettings Configuración de solicitudes de puntuación de implementación en línea. OnlineRequestSettings
scaleSettings Configuración de escalado de implementación en línea. OnlineScaleSettings

OnlineDeploymentEnvironmentVariables

Nombre Descripción Valor

OnlineDeploymentProperties

Nombre Descripción Valor

OnlineRequestSettings

Nombre Descripción Valor
maxConcurrentRequestsPerInstance Número de solicitudes que se pueden poner en cola a la vez para esta implementación. Int
maxQueueWait Tiempo máximo de espera de cola en formato ISO 8601. Admite precisión de milisegundos. cuerda
requestTimeout Tiempo de espera de solicitud en formato ISO 8601. Admite precisión de milisegundos. cuerda

OnlineScaleSettings

Nombre Descripción Valor
maxInstances Número máximo de instancias para esta implementación. Int
minInstances Número mínimo de instancias para esta implementación. Int
scaleType Establezca en "Auto" para el tipo AutoScaleSettings. Establezca en "Manual" para el tipo ManualScaleSettings. 'Auto'
'Manual' (obligatorio)

OutputPathAssetReference

Nombre Descripción Valor
jobId Identificador de recurso de ARM del trabajo. cuerda
camino Ruta de acceso del archivo o directorio en la salida del trabajo. cuerda
referenceType [Obligatorio] Especifica el tipo de referencia de recurso. 'OutputPath' (obligatorio)

ProbeSettings

Nombre Descripción Valor
failureThreshold Número de errores que se deben permitir antes de devolver un estado incorrecto. Int
initialDelay Retraso antes del primer sondeo en formato ISO 8601. cuerda
periodo El período de tiempo entre sondeos en formato ISO 8601. cuerda
successThreshold Número de sondeos correctos antes de devolver un estado correcto. Int
interrupción Tiempo de espera del sondeo en formato ISO 8601. cuerda

ResourceIdentity

Nombre Descripción Valor
tipo Define valores para el tipo de ResourceIdentity. 'Ninguno'
'SystemAssigned'
'SystemAssigned,UserAssigned'
'UserAssigned'
userAssignedIdentities Diccionario de identidades asignadas por el usuario, la clave es el identificador de recurso arm de la UAI. ResourceIdentityUserAssignedIdentities

ResourceIdentityUserAssignedIdentities

Nombre Descripción Valor

TrackedResourceTags

Nombre Descripción Valor

UserAssignedIdentityMeta

Nombre Descripción Valor
clientId También conocido como identificador de aplicación, un identificador único generado por Azure AD que está vinculado a una aplicación y una entidad de servicio durante su aprovisionamiento inicial. cuerda
principalId Identificador de objeto del objeto de entidad de servicio de la identidad administrada que se usa para conceder acceso basado en roles a un recurso de Azure. cuerda

Definición de recursos de plantilla de ARM

El tipo de recurso workspaces/onlineEndpoints/deployments se puede implementar con operaciones destinadas a:

Para obtener una lista de las propiedades modificadas en cada versión de API, consulte registro de cambios.

Formato de recurso

Para crear un recurso Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments, agregue el siguiente JSON a la plantilla.

{
  "type": "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments",
  "apiVersion": "2021-03-01-preview",
  "name": "string",
  "identity": {
    "type": "string",
    "userAssignedIdentities": {
      "{customized property}": {
        "clientId": "string",
        "principalId": "string"
      }
    }
  },
  "kind": "string",
  "location": "string",
  "properties": {
    "appInsightsEnabled": "bool",
    "codeConfiguration": {
      "codeId": "string",
      "scoringScript": "string"
    },
    "description": "string",
    "environmentId": "string",
    "environmentVariables": {
      "{customized property}": "string"
    },
    "livenessProbe": {
      "failureThreshold": "int",
      "initialDelay": "string",
      "period": "string",
      "successThreshold": "int",
      "timeout": "string"
    },
    "model": {
      "referenceType": "string"
      // For remaining properties, see AssetReferenceBase objects
    },
    "properties": {
      "{customized property}": "string"
    },
    "requestSettings": {
      "maxConcurrentRequestsPerInstance": "int",
      "maxQueueWait": "string",
      "requestTimeout": "string"
    },
    "scaleSettings": {
      "maxInstances": "int",
      "minInstances": "int",
      "scaleType": "string"
      // For remaining properties, see OnlineScaleSettings objects
    },
    "endpointComputeType": "string"
    // For remaining properties, see OnlineDeployment objects
  },
  "tags": {
    "{customized property}": "string"
  }
}

Objetos OnlineDeployment

Establezca la propiedad endpointComputeType para especificar el tipo de objeto.

Para K8S, use:

{
  "containerResourceRequirements": {
    "cpu": "int",
    "cpuLimit": "int",
    "fpga": "int",
    "gpu": "int",
    "memoryInGB": "int",
    "memoryInGBLimit": "int"
  },
  "endpointComputeType": "K8S"
}

Para managed, use:

{
  "endpointComputeType": "Managed",
  "instanceType": "string",
  "readinessProbe": {
    "failureThreshold": "int",
    "initialDelay": "string",
    "period": "string",
    "successThreshold": "int",
    "timeout": "string"
  }
}

Objetos OnlineScaleSettings

Establezca la propiedad scaleType para especificar el tipo de objeto.

Para Auto, use:

{
  "pollingInterval": "string",
  "scaleType": "Auto",
  "targetUtilizationPercentage": "int"
}

Para manual, use:

{
  "instanceCount": "int",
  "scaleType": "Manual"
}

Objetos AssetReferenceBase

Establezca la propiedad referenceType para especificar el tipo de objeto.

Para DataPath, use:

{
  "datastoreId": "string",
  "path": "string",
  "referenceType": "DataPath"
}

Para id., use:

{
  "assetId": "string",
  "referenceType": "Id"
}

Para OutputPath, use:

{
  "jobId": "string",
  "path": "string",
  "referenceType": "OutputPath"
}

Valores de propiedad

AssetReferenceBase

Nombre Descripción Valor
referenceType Establezca en "DataPath" para el tipo DataPathAssetReference. Establezca en "Id" para el tipo IdAssetReference. Establezca en "OutputPath" para el tipo OutputPathAssetReference. 'DataPath'
'Id'
'OutputPath' (obligatorio)

AutoScaleSettings

Nombre Descripción Valor
pollingInterval Intervalo de sondeo en formato ISO 8691. Solo admite la duración con una precisión tan baja como Segundos. cuerda
scaleType [Obligatorio] Tipo de algoritmo de escalado de implementación 'Auto' (obligatorio)
targetUtilizationPercentage Uso de CPU de destino para el escalador automático. Int

CodeConfiguration

Nombre Descripción Valor
codeId Identificador de recurso de ARM del recurso de código. cuerda
scoringScript [Obligatorio] Script que se va a ejecutar al iniciarse. Eg. "score.py" cuerda

Restricciones:
Longitud mínima = 1
Patrón = [a-zA-Z0-9_] (obligatorio)

ContainerResourceRequirements

Nombre Descripción Valor
CPU Cantidad mínima de núcleos de CPU que va a usar el contenedor. Más información:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
Int
cpuLimit Cantidad máxima de núcleos de CPU que el contenedor permite usar. Más información:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
Int
fpga Número de dispositivos PCIE de FPGA expuestos al contenedor. Debe ser múltiplo de 2. Int
Gpu Número de núcleos de GPU en el contenedor. Int
memoryInGB Cantidad mínima de memoria (en GB) que usará el contenedor. Más información:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
Int
memoryInGBLimit El contenedor permite usar la cantidad máxima de memoria (en GB). Más información:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
Int

DataPathAssetReference

Nombre Descripción Valor
datastoreId Identificador de recurso de ARM del almacén de datos donde se encuentra el recurso. cuerda
camino Ruta de acceso del archivo o directorio en el almacén de datos. cuerda
referenceType [Obligatorio] Especifica el tipo de referencia de recurso. 'DataPath' (obligatorio)

IdAssetReference

Nombre Descripción Valor
assetId [Obligatorio] Identificador de recurso de ARM del recurso. cuerda

Restricciones:
Patrón = [a-zA-Z0-9_] (obligatorio)
referenceType [Obligatorio] Especifica el tipo de referencia de recurso. 'Id' (obligatorio)

K8SOnlineDeployment

Nombre Descripción Valor
containerResourceRequirements Requisitos de recursos para cada instancia de contenedor dentro de una implementación en línea. containerResourceRequirements
endpointComputeType [Obligatorio] Tipo de proceso del punto de conexión. 'K8S' (obligatorio)

ManagedOnlineDeployment

Nombre Descripción Valor
endpointComputeType [Obligatorio] Tipo de proceso del punto de conexión. "Administrado" (obligatorio)
instanceType Tipo de instancia de proceso. cuerda
readinessProbe Configuración del sondeo de preparación y ejecución del contenedor de implementación. probeSettings

ManualScaleSettings

Nombre Descripción Valor
instanceCount Número fijo de instancias para esta implementación. Int
scaleType [Obligatorio] Tipo de algoritmo de escalado de implementación 'Manual' (obligatorio)

Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments

Nombre Descripción Valor
apiVersion La versión de api '2021-03-01-preview'
identidad Identidad de servicio asociada a un recurso. resourceIdentity
amable Metadatos usados por el portal,herramientas/etcetera para representar experiencias de experiencia de usuario diferentes para los recursos del mismo tipo. cuerda
ubicación Ubicación geográfica donde reside el recurso string (obligatorio)
nombre El nombre del recurso cuerda

Restricciones:
Patrón = ^[a-zA-Z0-9][a-zA-Z0-9\-_]{0,254}$ (obligatorio)
Propiedades [Obligatorio] Atributos adicionales de la entidad. OnlineDeployment (obligatorio)
Etiquetas Etiquetas del recurso Diccionario de nombres y valores de etiqueta. Consulte etiquetas de en plantillas
tipo El tipo de recurso 'Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments'

OnlineDeployment

Nombre Descripción Valor
appInsightsEnabled Si es true, habilita el registro de Application Insights. Bool
codeConfiguration Configuración de código para la implementación del punto de conexión. CodeConfiguration
descripción Descripción de la implementación del punto de conexión. cuerda
endpointComputeType Establezca en "K8S" para el tipo K8SOnlineDeployment. Establezca en "Administrado" para el tipo ManagedOnlineDeployment. 'K8S'
"Administrado" (obligatorio)
environmentId Identificador de recurso de ARM de la especificación del entorno para la implementación del punto de conexión. cuerda
environmentVariables Configuración de variables de entorno para la implementación. OnlineDeploymentEnvironmentVariables
livenessProbe Configuración del sondeo de preparación y ejecución del contenedor de implementación. probeSettings
modelo Referencia al recurso de modelo para la implementación del punto de conexión. AssetReferenceBase
Propiedades Diccionario de propiedades. Se pueden agregar propiedades, pero no se pueden quitar ni modificar. OnlineDeploymentProperties
requestSettings Configuración de solicitudes de puntuación de implementación en línea. OnlineRequestSettings
scaleSettings Configuración de escalado de implementación en línea. OnlineScaleSettings

OnlineDeploymentEnvironmentVariables

Nombre Descripción Valor

OnlineDeploymentProperties

Nombre Descripción Valor

OnlineRequestSettings

Nombre Descripción Valor
maxConcurrentRequestsPerInstance Número de solicitudes que se pueden poner en cola a la vez para esta implementación. Int
maxQueueWait Tiempo máximo de espera de cola en formato ISO 8601. Admite precisión de milisegundos. cuerda
requestTimeout Tiempo de espera de solicitud en formato ISO 8601. Admite precisión de milisegundos. cuerda

OnlineScaleSettings

Nombre Descripción Valor
maxInstances Número máximo de instancias para esta implementación. Int
minInstances Número mínimo de instancias para esta implementación. Int
scaleType Establezca en "Auto" para el tipo AutoScaleSettings. Establezca en "Manual" para el tipo ManualScaleSettings. 'Auto'
'Manual' (obligatorio)

OutputPathAssetReference

Nombre Descripción Valor
jobId Identificador de recurso de ARM del trabajo. cuerda
camino Ruta de acceso del archivo o directorio en la salida del trabajo. cuerda
referenceType [Obligatorio] Especifica el tipo de referencia de recurso. 'OutputPath' (obligatorio)

ProbeSettings

Nombre Descripción Valor
failureThreshold Número de errores que se deben permitir antes de devolver un estado incorrecto. Int
initialDelay Retraso antes del primer sondeo en formato ISO 8601. cuerda
periodo El período de tiempo entre sondeos en formato ISO 8601. cuerda
successThreshold Número de sondeos correctos antes de devolver un estado correcto. Int
interrupción Tiempo de espera del sondeo en formato ISO 8601. cuerda

ResourceIdentity

Nombre Descripción Valor
tipo Define valores para el tipo de ResourceIdentity. 'Ninguno'
'SystemAssigned'
'SystemAssigned,UserAssigned'
'UserAssigned'
userAssignedIdentities Diccionario de identidades asignadas por el usuario, la clave es el identificador de recurso arm de la UAI. ResourceIdentityUserAssignedIdentities

ResourceIdentityUserAssignedIdentities

Nombre Descripción Valor

TrackedResourceTags

Nombre Descripción Valor

UserAssignedIdentityMeta

Nombre Descripción Valor
clientId También conocido como identificador de aplicación, un identificador único generado por Azure AD que está vinculado a una aplicación y una entidad de servicio durante su aprovisionamiento inicial. cuerda
principalId Identificador de objeto del objeto de entidad de servicio de la identidad administrada que se usa para conceder acceso basado en roles a un recurso de Azure. cuerda

Definición de recursos de Terraform (proveedor AzAPI)

El tipo de recurso workspaces/onlineEndpoints/deployments se puede implementar con operaciones destinadas a:

  • grupos de recursos de

Para obtener una lista de las propiedades modificadas en cada versión de API, consulte registro de cambios.

Formato de recurso

Para crear un recurso Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments, agregue el siguiente terraform a la plantilla.

resource "azapi_resource" "symbolicname" {
  type = "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2021-03-01-preview"
  name = "string"
  identity = {
    type = "string"
    userAssignedIdentities = {
      {customized property} = {
        clientId = "string"
        principalId = "string"
      }
    }
  }
  kind = "string"
  location = "string"
  tags = {
    {customized property} = "string"
  }
  body = jsonencode({
    properties = {
      appInsightsEnabled = bool
      codeConfiguration = {
        codeId = "string"
        scoringScript = "string"
      }
      description = "string"
      environmentId = "string"
      environmentVariables = {
        {customized property} = "string"
      }
      livenessProbe = {
        failureThreshold = int
        initialDelay = "string"
        period = "string"
        successThreshold = int
        timeout = "string"
      }
      model = {
        referenceType = "string"
        // For remaining properties, see AssetReferenceBase objects
      }
      properties = {
        {customized property} = "string"
      }
      requestSettings = {
        maxConcurrentRequestsPerInstance = int
        maxQueueWait = "string"
        requestTimeout = "string"
      }
      scaleSettings = {
        maxInstances = int
        minInstances = int
        scaleType = "string"
        // For remaining properties, see OnlineScaleSettings objects
      }
      endpointComputeType = "string"
      // For remaining properties, see OnlineDeployment objects
    }
  })
}

Objetos OnlineDeployment

Establezca la propiedad endpointComputeType para especificar el tipo de objeto.

Para K8S, use:

{
  containerResourceRequirements = {
    cpu = int
    cpuLimit = int
    fpga = int
    gpu = int
    memoryInGB = int
    memoryInGBLimit = int
  }
  endpointComputeType = "K8S"
}

Para managed, use:

{
  endpointComputeType = "Managed"
  instanceType = "string"
  readinessProbe = {
    failureThreshold = int
    initialDelay = "string"
    period = "string"
    successThreshold = int
    timeout = "string"
  }
}

Objetos OnlineScaleSettings

Establezca la propiedad scaleType para especificar el tipo de objeto.

Para Auto, use:

{
  pollingInterval = "string"
  scaleType = "Auto"
  targetUtilizationPercentage = int
}

Para manual, use:

{
  instanceCount = int
  scaleType = "Manual"
}

Objetos AssetReferenceBase

Establezca la propiedad referenceType para especificar el tipo de objeto.

Para DataPath, use:

{
  datastoreId = "string"
  path = "string"
  referenceType = "DataPath"
}

Para id., use:

{
  assetId = "string"
  referenceType = "Id"
}

Para OutputPath, use:

{
  jobId = "string"
  path = "string"
  referenceType = "OutputPath"
}

Valores de propiedad

AssetReferenceBase

Nombre Descripción Valor
referenceType Establezca en "DataPath" para el tipo DataPathAssetReference. Establezca en "Id" para el tipo IdAssetReference. Establezca en "OutputPath" para el tipo OutputPathAssetReference. 'DataPath'
'Id'
'OutputPath' (obligatorio)

AutoScaleSettings

Nombre Descripción Valor
pollingInterval Intervalo de sondeo en formato ISO 8691. Solo admite la duración con una precisión tan baja como Segundos. cuerda
scaleType [Obligatorio] Tipo de algoritmo de escalado de implementación 'Auto' (obligatorio)
targetUtilizationPercentage Uso de CPU de destino para el escalador automático. Int

CodeConfiguration

Nombre Descripción Valor
codeId Identificador de recurso de ARM del recurso de código. cuerda
scoringScript [Obligatorio] Script que se va a ejecutar al iniciarse. Eg. "score.py" cuerda

Restricciones:
Longitud mínima = 1
Patrón = [a-zA-Z0-9_] (obligatorio)

ContainerResourceRequirements

Nombre Descripción Valor
CPU Cantidad mínima de núcleos de CPU que va a usar el contenedor. Más información:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
Int
cpuLimit Cantidad máxima de núcleos de CPU que el contenedor permite usar. Más información:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
Int
fpga Número de dispositivos PCIE de FPGA expuestos al contenedor. Debe ser múltiplo de 2. Int
Gpu Número de núcleos de GPU en el contenedor. Int
memoryInGB Cantidad mínima de memoria (en GB) que usará el contenedor. Más información:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
Int
memoryInGBLimit El contenedor permite usar la cantidad máxima de memoria (en GB). Más información:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
Int

DataPathAssetReference

Nombre Descripción Valor
datastoreId Identificador de recurso de ARM del almacén de datos donde se encuentra el recurso. cuerda
camino Ruta de acceso del archivo o directorio en el almacén de datos. cuerda
referenceType [Obligatorio] Especifica el tipo de referencia de recurso. 'DataPath' (obligatorio)

IdAssetReference

Nombre Descripción Valor
assetId [Obligatorio] Identificador de recurso de ARM del recurso. cuerda

Restricciones:
Patrón = [a-zA-Z0-9_] (obligatorio)
referenceType [Obligatorio] Especifica el tipo de referencia de recurso. 'Id' (obligatorio)

K8SOnlineDeployment

Nombre Descripción Valor
containerResourceRequirements Requisitos de recursos para cada instancia de contenedor dentro de una implementación en línea. containerResourceRequirements
endpointComputeType [Obligatorio] Tipo de proceso del punto de conexión. 'K8S' (obligatorio)

ManagedOnlineDeployment

Nombre Descripción Valor
endpointComputeType [Obligatorio] Tipo de proceso del punto de conexión. "Administrado" (obligatorio)
instanceType Tipo de instancia de proceso. cuerda
readinessProbe Configuración del sondeo de preparación y ejecución del contenedor de implementación. probeSettings

ManualScaleSettings

Nombre Descripción Valor
instanceCount Número fijo de instancias para esta implementación. Int
scaleType [Obligatorio] Tipo de algoritmo de escalado de implementación 'Manual' (obligatorio)

Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments

Nombre Descripción Valor
identidad Identidad de servicio asociada a un recurso. resourceIdentity
amable Metadatos usados por el portal,herramientas/etcetera para representar experiencias de experiencia de usuario diferentes para los recursos del mismo tipo. cuerda
ubicación Ubicación geográfica donde reside el recurso string (obligatorio)
nombre El nombre del recurso cuerda

Restricciones:
Patrón = ^[a-zA-Z0-9][a-zA-Z0-9\-_]{0,254}$ (obligatorio)
parent_id Identificador del recurso que es el elemento primario de este recurso. Identificador del recurso de tipo: áreas de trabajo/onlineEndpoints
Propiedades [Obligatorio] Atributos adicionales de la entidad. OnlineDeployment (obligatorio)
Etiquetas Etiquetas del recurso Diccionario de nombres y valores de etiqueta.
tipo El tipo de recurso "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2021-03-01-preview"

OnlineDeployment

Nombre Descripción Valor
appInsightsEnabled Si es true, habilita el registro de Application Insights. Bool
codeConfiguration Configuración de código para la implementación del punto de conexión. CodeConfiguration
descripción Descripción de la implementación del punto de conexión. cuerda
endpointComputeType Establezca en "K8S" para el tipo K8SOnlineDeployment. Establezca en "Administrado" para el tipo ManagedOnlineDeployment. 'K8S'
"Administrado" (obligatorio)
environmentId Identificador de recurso de ARM de la especificación del entorno para la implementación del punto de conexión. cuerda
environmentVariables Configuración de variables de entorno para la implementación. OnlineDeploymentEnvironmentVariables
livenessProbe Configuración del sondeo de preparación y ejecución del contenedor de implementación. probeSettings
modelo Referencia al recurso de modelo para la implementación del punto de conexión. AssetReferenceBase
Propiedades Diccionario de propiedades. Se pueden agregar propiedades, pero no se pueden quitar ni modificar. OnlineDeploymentProperties
requestSettings Configuración de solicitudes de puntuación de implementación en línea. OnlineRequestSettings
scaleSettings Configuración de escalado de implementación en línea. OnlineScaleSettings

OnlineDeploymentEnvironmentVariables

Nombre Descripción Valor

OnlineDeploymentProperties

Nombre Descripción Valor

OnlineRequestSettings

Nombre Descripción Valor
maxConcurrentRequestsPerInstance Número de solicitudes que se pueden poner en cola a la vez para esta implementación. Int
maxQueueWait Tiempo máximo de espera de cola en formato ISO 8601. Admite precisión de milisegundos. cuerda
requestTimeout Tiempo de espera de solicitud en formato ISO 8601. Admite precisión de milisegundos. cuerda

OnlineScaleSettings

Nombre Descripción Valor
maxInstances Número máximo de instancias para esta implementación. Int
minInstances Número mínimo de instancias para esta implementación. Int
scaleType Establezca en "Auto" para el tipo AutoScaleSettings. Establezca en "Manual" para el tipo ManualScaleSettings. 'Auto'
'Manual' (obligatorio)

OutputPathAssetReference

Nombre Descripción Valor
jobId Identificador de recurso de ARM del trabajo. cuerda
camino Ruta de acceso del archivo o directorio en la salida del trabajo. cuerda
referenceType [Obligatorio] Especifica el tipo de referencia de recurso. 'OutputPath' (obligatorio)

ProbeSettings

Nombre Descripción Valor
failureThreshold Número de errores que se deben permitir antes de devolver un estado incorrecto. Int
initialDelay Retraso antes del primer sondeo en formato ISO 8601. cuerda
periodo El período de tiempo entre sondeos en formato ISO 8601. cuerda
successThreshold Número de sondeos correctos antes de devolver un estado correcto. Int
interrupción Tiempo de espera del sondeo en formato ISO 8601. cuerda

ResourceIdentity

Nombre Descripción Valor
tipo Define valores para el tipo de ResourceIdentity. 'Ninguno'
'SystemAssigned'
'SystemAssigned,UserAssigned'
'UserAssigned'
userAssignedIdentities Diccionario de identidades asignadas por el usuario, la clave es el identificador de recurso arm de la UAI. ResourceIdentityUserAssignedIdentities

ResourceIdentityUserAssignedIdentities

Nombre Descripción Valor

TrackedResourceTags

Nombre Descripción Valor

UserAssignedIdentityMeta

Nombre Descripción Valor
clientId También conocido como identificador de aplicación, un identificador único generado por Azure AD que está vinculado a una aplicación y una entidad de servicio durante su aprovisionamiento inicial. cuerda
principalId Identificador de objeto del objeto de entidad de servicio de la identidad administrada que se usa para conceder acceso basado en roles a un recurso de Azure. cuerda