Delen via


Microsoft.MachineLearningServices-werkruimten/onlineEndpoints/deployments 2022-05-01

Bicep-resourcedefinitie

Het resourcetype werkruimten/onlineEndpoints/deployments kan worden geïmplementeerd met bewerkingen die zijn gericht op:

Zie logboek wijzigenvoor een lijst met gewijzigde eigenschappen in elke API-versie.

Resource-indeling

Als u een Resource microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments wilt maken, voegt u de volgende Bicep toe aan uw sjabloon.

resource symbolicname 'Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2022-05-01' = {
  parent: resourceSymbolicName
  identity: {
    type: 'string'
    userAssignedIdentities: {
      {customized property}: {}
    }
  }
  kind: 'string'
  location: 'string'
  name: 'string'
  properties: {
    appInsightsEnabled: bool
    codeConfiguration: {
      codeId: 'string'
      scoringScript: 'string'
    }
    description: 'string'
    environmentId: 'string'
    environmentVariables: {
      {customized property}: 'string'
    }
    instanceType: 'string'
    livenessProbe: {
      failureThreshold: int
      initialDelay: 'string'
      period: 'string'
      successThreshold: int
      timeout: 'string'
    }
    model: 'string'
    modelMountPath: 'string'
    properties: {
      {customized property}: 'string'
    }
    readinessProbe: {
      failureThreshold: int
      initialDelay: 'string'
      period: 'string'
      successThreshold: int
      timeout: 'string'
    }
    requestSettings: {
      maxConcurrentRequestsPerInstance: int
      maxQueueWait: 'string'
      requestTimeout: 'string'
    }
    scaleSettings: {
      scaleType: 'string'
      // For remaining properties, see OnlineScaleSettings objects
    }
    endpointComputeType: 'string'
    // For remaining properties, see OnlineDeploymentProperties objects
  }
  sku: {
    capacity: int
    family: 'string'
    name: 'string'
    size: 'string'
    tier: 'string'
  }
  tags: {
    {customized property}: 'string'
  }
}

OnlineDeploymentProperties-objecten

Stel de eigenschap endpointComputeType in om het type object op te geven.

Gebruik voor Kubernetes-:

{
  containerResourceRequirements: {
    containerResourceLimits: {
      cpu: 'string'
      gpu: 'string'
      memory: 'string'
    }
    containerResourceRequests: {
      cpu: 'string'
      gpu: 'string'
      memory: 'string'
    }
  }
  endpointComputeType: 'Kubernetes'
}

Gebruik voor Beheerde:

{
  endpointComputeType: 'Managed'
}

OnlineScaleSettings-objecten

Stel de eigenschap scaleType in om het type object op te geven.

Gebruik voor standaard:

{
  scaleType: 'Default'
}

Gebruik voor TargetUtilization:

{
  maxInstances: int
  minInstances: int
  pollingInterval: 'string'
  scaleType: 'TargetUtilization'
  targetUtilizationPercentage: int
}

Eigenschapswaarden

CodeConfiguration

Naam Beschrijving Waarde
codeId ARM-resource-id van de codeasset. snaar
scoringScript [Vereist] Het script dat moet worden uitgevoerd bij het opstarten. bijvoorbeeld "score.py" snaar

Beperkingen:
Minimale lengte = 1
Patroon = [a-zA-Z0-9_] (vereist)

ContainerResourceRequirements

Naam Beschrijving Waarde
containerResourceLimits Informatie over de limiet voor containerresources: ContainerResourceSettings-
containerResourceRequests Informatie over containerresourceaanvragen: ContainerResourceSettings-

ContainerResourceSettings

Naam Beschrijving Waarde
CPU Aantal vCPU's aanvraag/limiet voor container. Meer informatie:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
snaar
Gpu Aantal Nvidia GPU-kaarten aanvragen/limieten voor containers. Meer informatie:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
snaar
geheugen Aanvraag/limiet voor geheugengrootte voor container. Meer informatie:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
snaar

DefaultScaleSettings

Naam Beschrijving Waarde
scaleType [Vereist] Type algoritme voor het schalen van implementaties 'Standaard' (vereist)

EndpointDeploymentPropertiesBaseEnvironmentVariables

Naam Beschrijving Waarde

EndpointDeploymentPropertiesBaseProperties

Naam Beschrijving Waarde

KubernetesOnlineDeployment

Naam Beschrijving Waarde
containerResourceRequirements De resourcevereisten voor de container (cpu en geheugen). ContainerResourceRequirements
endpointComputeType [Vereist] Het rekentype van het eindpunt. 'Kubernetes' (vereist)

ManagedOnlineDeployment

Naam Beschrijving Waarde
endpointComputeType [Vereist] Het rekentype van het eindpunt. Beheerd (vereist)

ManagedServiceIdentity

Naam Beschrijving Waarde
type Type beheerde service-identiteit (waarbij zowel SystemAssigned- als UserAssigned-typen zijn toegestaan). 'Geen'
'SystemAssigned'
'SystemAssigned, UserAssigned'
UserAssigned (vereist)
userAssignedIdentities De set door de gebruiker toegewezen identiteiten die aan de resource zijn gekoppeld. De woordenlijstsleutels userAssignedIdentities zijn ARM-resource-id's in de vorm: /subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. De woordenlijstwaarden kunnen lege objecten ({}) zijn in aanvragen. UserAssignedId-entiteiten

Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments

Naam Beschrijving Waarde
identiteit Beheerde service-identiteit (door het systeem toegewezen en/of door de gebruiker toegewezen identiteiten) ManagedServiceIdentity-
soort Metagegevens die worden gebruikt door portal/tooling/etc om verschillende UX-ervaringen weer te geven voor resources van hetzelfde type. snaar
plaats De geografische locatie waar de resource zich bevindt tekenreeks (vereist)
naam De resourcenaam snaar

Beperkingen:
Patroon = ^[a-zA-Z0-9][a-zA-Z0-9\-_]{0,254}$ (vereist)
ouder In Bicep kunt u de bovenliggende resource voor een onderliggende resource opgeven. U hoeft deze eigenschap alleen toe te voegen wanneer de onderliggende resource buiten de bovenliggende resource wordt gedeclareerd.

Zie onderliggende resource buiten de bovenliggende resourcevoor meer informatie.
Symbolische naam voor resource van het type: werkruimten/onlineEndpoints
Eigenschappen [Vereist] Aanvullende kenmerken van de entiteit. OnlineDeploymentProperties (vereist)
Sku SKU-gegevens die vereist zijn voor een ARM-contract voor automatisch schalen. SKU-
Tags Resourcetags Woordenlijst met tagnamen en -waarden. Zie Tags in sjablonen

OnlineDeploymentProperties

Naam Beschrijving Waarde
appInsightsEnabled Indien waar, schakelt u Application Insights-logboekregistratie in. Bool
codeConfiguration Codeconfiguratie voor de eindpuntimplementatie. CodeConfiguration-
beschrijving Beschrijving van de eindpuntimplementatie. snaar
endpointComputeType Ingesteld op 'Kubernetes' voor het type KubernetesOnlineDeployment. Ingesteld op Beheerd voor type ManagedOnlineDeployment. 'Kubernetes'
Beheerd (vereist)
environmentId ARM-resource-id of AssetId van de omgevingsspecificatie voor de eindpuntimplementatie. snaar
environmentVariables Configuratie van omgevingsvariabelen voor de implementatie. EndpointDeploymentPropertiesBaseEnvironmentVariables
instanceType Type rekeninstantie. snaar
livenessProbe De livenesstest bewaakt regelmatig de status van de container. ProbeSettings
model Het URI-pad naar het model. snaar
modelMountPath Het pad voor het koppelen van het model in een aangepaste container. snaar
Eigenschappen Eigenschappenwoordenlijst. Eigenschappen kunnen worden toegevoegd, maar niet worden verwijderd of gewijzigd. EndpointDeploymentPropertiesBaseProperties
readinessProbe De gereedheidstest controleert of de container gereed is om verkeer te verwerken. De eigenschappen en standaardwaarden zijn hetzelfde als de livenesstest. ProbeSettings
requestSettings Aanvraaginstellingen voor de implementatie. OnlineRequestSettings
scaleSettings Schaalinstellingen voor de implementatie.
Als deze null is of niet is opgegeven,
standaard ingesteld op TargetUtilizationScaleSettings voor KubernetesOnlineDeployment
en naar DefaultScaleSettings voor ManagedOnlineDeployment.
OnlineScaleSettings-

OnlineRequestSettings

Naam Beschrijving Waarde
maxConcurrentRequestsPerInstance Het aantal maximaal gelijktijdige aanvragen per knooppunt dat per implementatie is toegestaan. De standaardwaarde is 1. Int
maxQueueWait De maximale tijdsduur voor een aanvraag blijft in de wachtrij in ISO 8601-indeling.
De standaardwaarde is 500 ms.
snaar
requestTimeout De time-out voor scoren in ISO 8601-indeling.
De standaardwaarde is 5000 ms.
snaar

OnlineScaleSettings

Naam Beschrijving Waarde
scaleType Ingesteld op Standaard voor het type DefaultScaleSettings. Ingesteld op TargetUtilization voor type TargetUtilizationScaleSettings. 'Standaard'
TargetUtilization (vereist)

ProbeSettings

Naam Beschrijving Waarde
failureThreshold Het aantal fouten dat moet worden toegestaan voordat een beschadigde status wordt geretourneerd. Int
initialDelay De vertraging vóór de eerste test in ISO 8601-indeling. snaar
periode De tijdsduur tussen tests in ISO 8601-indeling. snaar
successThreshold Het aantal geslaagde tests voordat een status in orde wordt geretourneerd. Int
Timeout De time-out van de test in ISO 8601-indeling. snaar

Sku

Naam Beschrijving Waarde
capaciteit Als de SKU uitschalen/inschalen ondersteunt, moet het gehele getal van de capaciteit worden opgenomen. Als uitschalen/inschalen niet mogelijk is voor de resource, kan dit worden weggelaten. Int
Familie Als de service verschillende generaties hardware heeft, voor dezelfde SKU, kan die hier worden vastgelegd. snaar
naam De naam van de SKU. Ex - P3. Dit is meestal een letter+cijfercode tekenreeks (vereist)
grootte De SKU-grootte. Wanneer het naamveld de combinatie van de laag en een andere waarde is, is dit de zelfstandige code. snaar
rang Dit veld moet worden geïmplementeerd door de resourceprovider als de service meer dan één laag heeft, maar niet vereist is voor een PUT. 'Basis'
'Gratis'
'Premium'
'Standaard'

TargetUtilizationScaleSettings

Naam Beschrijving Waarde
maxInstances Het maximum aantal exemplaren waarnaar de implementatie kan worden geschaald. Het quotum wordt gereserveerd voor max_instances. Int
minInstances Het minimale aantal exemplaren dat altijd aanwezig moet zijn. Int
pollingInterval Het polling-interval in ISO 8691-indeling. Ondersteunt alleen de duur met precisie zo laag als seconden. snaar
scaleType [Vereist] Type algoritme voor het schalen van implementaties TargetUtilization (vereist)
targetUtilizationPercentage Doel-CPU-gebruik voor de automatische schaalaanpassing. Int

TrackedResourceTags

Naam Beschrijving Waarde

UserAssignedIdentities

Naam Beschrijving Waarde

UserAssignedIdentity

Naam Beschrijving Waarde

Resourcedefinitie van ARM-sjabloon

Het resourcetype werkruimten/onlineEndpoints/deployments kan worden geïmplementeerd met bewerkingen die zijn gericht op:

Zie logboek wijzigenvoor een lijst met gewijzigde eigenschappen in elke API-versie.

Resource-indeling

Als u een Resource Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments wilt maken, voegt u de volgende JSON toe aan uw sjabloon.

{
  "type": "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments",
  "apiVersion": "2022-05-01",
  "name": "string",
  "identity": {
    "type": "string",
    "userAssignedIdentities": {
      "{customized property}": {
      }
    }
  },
  "kind": "string",
  "location": "string",
  "properties": {
    "appInsightsEnabled": "bool",
    "codeConfiguration": {
      "codeId": "string",
      "scoringScript": "string"
    },
    "description": "string",
    "environmentId": "string",
    "environmentVariables": {
      "{customized property}": "string"
    },
    "instanceType": "string",
    "livenessProbe": {
      "failureThreshold": "int",
      "initialDelay": "string",
      "period": "string",
      "successThreshold": "int",
      "timeout": "string"
    },
    "model": "string",
    "modelMountPath": "string",
    "properties": {
      "{customized property}": "string"
    },
    "readinessProbe": {
      "failureThreshold": "int",
      "initialDelay": "string",
      "period": "string",
      "successThreshold": "int",
      "timeout": "string"
    },
    "requestSettings": {
      "maxConcurrentRequestsPerInstance": "int",
      "maxQueueWait": "string",
      "requestTimeout": "string"
    },
    "scaleSettings": {
      "scaleType": "string"
      // For remaining properties, see OnlineScaleSettings objects
    },
    "endpointComputeType": "string"
    // For remaining properties, see OnlineDeploymentProperties objects
  },
  "sku": {
    "capacity": "int",
    "family": "string",
    "name": "string",
    "size": "string",
    "tier": "string"
  },
  "tags": {
    "{customized property}": "string"
  }
}

OnlineDeploymentProperties-objecten

Stel de eigenschap endpointComputeType in om het type object op te geven.

Gebruik voor Kubernetes-:

{
  "containerResourceRequirements": {
    "containerResourceLimits": {
      "cpu": "string",
      "gpu": "string",
      "memory": "string"
    },
    "containerResourceRequests": {
      "cpu": "string",
      "gpu": "string",
      "memory": "string"
    }
  },
  "endpointComputeType": "Kubernetes"
}

Gebruik voor Beheerde:

{
  "endpointComputeType": "Managed"
}

OnlineScaleSettings-objecten

Stel de eigenschap scaleType in om het type object op te geven.

Gebruik voor standaard:

{
  "scaleType": "Default"
}

Gebruik voor TargetUtilization:

{
  "maxInstances": "int",
  "minInstances": "int",
  "pollingInterval": "string",
  "scaleType": "TargetUtilization",
  "targetUtilizationPercentage": "int"
}

Eigenschapswaarden

CodeConfiguration

Naam Beschrijving Waarde
codeId ARM-resource-id van de codeasset. snaar
scoringScript [Vereist] Het script dat moet worden uitgevoerd bij het opstarten. bijvoorbeeld "score.py" snaar

Beperkingen:
Minimale lengte = 1
Patroon = [a-zA-Z0-9_] (vereist)

ContainerResourceRequirements

Naam Beschrijving Waarde
containerResourceLimits Informatie over de limiet voor containerresources: ContainerResourceSettings-
containerResourceRequests Informatie over containerresourceaanvragen: ContainerResourceSettings-

ContainerResourceSettings

Naam Beschrijving Waarde
CPU Aantal vCPU's aanvraag/limiet voor container. Meer informatie:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
snaar
Gpu Aantal Nvidia GPU-kaarten aanvragen/limieten voor containers. Meer informatie:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
snaar
geheugen Aanvraag/limiet voor geheugengrootte voor container. Meer informatie:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
snaar

DefaultScaleSettings

Naam Beschrijving Waarde
scaleType [Vereist] Type algoritme voor het schalen van implementaties 'Standaard' (vereist)

EndpointDeploymentPropertiesBaseEnvironmentVariables

Naam Beschrijving Waarde

EndpointDeploymentPropertiesBaseProperties

Naam Beschrijving Waarde

KubernetesOnlineDeployment

Naam Beschrijving Waarde
containerResourceRequirements De resourcevereisten voor de container (cpu en geheugen). ContainerResourceRequirements
endpointComputeType [Vereist] Het rekentype van het eindpunt. 'Kubernetes' (vereist)

ManagedOnlineDeployment

Naam Beschrijving Waarde
endpointComputeType [Vereist] Het rekentype van het eindpunt. Beheerd (vereist)

ManagedServiceIdentity

Naam Beschrijving Waarde
type Type beheerde service-identiteit (waarbij zowel SystemAssigned- als UserAssigned-typen zijn toegestaan). 'Geen'
'SystemAssigned'
'SystemAssigned, UserAssigned'
UserAssigned (vereist)
userAssignedIdentities De set door de gebruiker toegewezen identiteiten die aan de resource zijn gekoppeld. De woordenlijstsleutels userAssignedIdentities zijn ARM-resource-id's in de vorm: /subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. De woordenlijstwaarden kunnen lege objecten ({}) zijn in aanvragen. UserAssignedId-entiteiten

Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments

Naam Beschrijving Waarde
apiVersion De API-versie '2022-05-01'
identiteit Beheerde service-identiteit (door het systeem toegewezen en/of door de gebruiker toegewezen identiteiten) ManagedServiceIdentity-
soort Metagegevens die worden gebruikt door portal/tooling/etc om verschillende UX-ervaringen weer te geven voor resources van hetzelfde type. snaar
plaats De geografische locatie waar de resource zich bevindt tekenreeks (vereist)
naam De resourcenaam snaar

Beperkingen:
Patroon = ^[a-zA-Z0-9][a-zA-Z0-9\-_]{0,254}$ (vereist)
Eigenschappen [Vereist] Aanvullende kenmerken van de entiteit. OnlineDeploymentProperties (vereist)
Sku SKU-gegevens die vereist zijn voor een ARM-contract voor automatisch schalen. SKU-
Tags Resourcetags Woordenlijst met tagnamen en -waarden. Zie Tags in sjablonen
type Het resourcetype 'Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments'

OnlineDeploymentProperties

Naam Beschrijving Waarde
appInsightsEnabled Indien waar, schakelt u Application Insights-logboekregistratie in. Bool
codeConfiguration Codeconfiguratie voor de eindpuntimplementatie. CodeConfiguration-
beschrijving Beschrijving van de eindpuntimplementatie. snaar
endpointComputeType Ingesteld op 'Kubernetes' voor het type KubernetesOnlineDeployment. Ingesteld op Beheerd voor type ManagedOnlineDeployment. 'Kubernetes'
Beheerd (vereist)
environmentId ARM-resource-id of AssetId van de omgevingsspecificatie voor de eindpuntimplementatie. snaar
environmentVariables Configuratie van omgevingsvariabelen voor de implementatie. EndpointDeploymentPropertiesBaseEnvironmentVariables
instanceType Type rekeninstantie. snaar
livenessProbe De livenesstest bewaakt regelmatig de status van de container. ProbeSettings
model Het URI-pad naar het model. snaar
modelMountPath Het pad voor het koppelen van het model in een aangepaste container. snaar
Eigenschappen Eigenschappenwoordenlijst. Eigenschappen kunnen worden toegevoegd, maar niet worden verwijderd of gewijzigd. EndpointDeploymentPropertiesBaseProperties
readinessProbe De gereedheidstest controleert of de container gereed is om verkeer te verwerken. De eigenschappen en standaardwaarden zijn hetzelfde als de livenesstest. ProbeSettings
requestSettings Aanvraaginstellingen voor de implementatie. OnlineRequestSettings
scaleSettings Schaalinstellingen voor de implementatie.
Als deze null is of niet is opgegeven,
standaard ingesteld op TargetUtilizationScaleSettings voor KubernetesOnlineDeployment
en naar DefaultScaleSettings voor ManagedOnlineDeployment.
OnlineScaleSettings-

OnlineRequestSettings

Naam Beschrijving Waarde
maxConcurrentRequestsPerInstance Het aantal maximaal gelijktijdige aanvragen per knooppunt dat per implementatie is toegestaan. De standaardwaarde is 1. Int
maxQueueWait De maximale tijdsduur voor een aanvraag blijft in de wachtrij in ISO 8601-indeling.
De standaardwaarde is 500 ms.
snaar
requestTimeout De time-out voor scoren in ISO 8601-indeling.
De standaardwaarde is 5000 ms.
snaar

OnlineScaleSettings

Naam Beschrijving Waarde
scaleType Ingesteld op Standaard voor het type DefaultScaleSettings. Ingesteld op TargetUtilization voor type TargetUtilizationScaleSettings. 'Standaard'
TargetUtilization (vereist)

ProbeSettings

Naam Beschrijving Waarde
failureThreshold Het aantal fouten dat moet worden toegestaan voordat een beschadigde status wordt geretourneerd. Int
initialDelay De vertraging vóór de eerste test in ISO 8601-indeling. snaar
periode De tijdsduur tussen tests in ISO 8601-indeling. snaar
successThreshold Het aantal geslaagde tests voordat een status in orde wordt geretourneerd. Int
Timeout De time-out van de test in ISO 8601-indeling. snaar

Sku

Naam Beschrijving Waarde
capaciteit Als de SKU uitschalen/inschalen ondersteunt, moet het gehele getal van de capaciteit worden opgenomen. Als uitschalen/inschalen niet mogelijk is voor de resource, kan dit worden weggelaten. Int
Familie Als de service verschillende generaties hardware heeft, voor dezelfde SKU, kan die hier worden vastgelegd. snaar
naam De naam van de SKU. Ex - P3. Dit is meestal een letter+cijfercode tekenreeks (vereist)
grootte De SKU-grootte. Wanneer het naamveld de combinatie van de laag en een andere waarde is, is dit de zelfstandige code. snaar
rang Dit veld moet worden geïmplementeerd door de resourceprovider als de service meer dan één laag heeft, maar niet vereist is voor een PUT. 'Basis'
'Gratis'
'Premium'
'Standaard'

TargetUtilizationScaleSettings

Naam Beschrijving Waarde
maxInstances Het maximum aantal exemplaren waarnaar de implementatie kan worden geschaald. Het quotum wordt gereserveerd voor max_instances. Int
minInstances Het minimale aantal exemplaren dat altijd aanwezig moet zijn. Int
pollingInterval Het polling-interval in ISO 8691-indeling. Ondersteunt alleen de duur met precisie zo laag als seconden. snaar
scaleType [Vereist] Type algoritme voor het schalen van implementaties TargetUtilization (vereist)
targetUtilizationPercentage Doel-CPU-gebruik voor de automatische schaalaanpassing. Int

TrackedResourceTags

Naam Beschrijving Waarde

UserAssignedIdentities

Naam Beschrijving Waarde

UserAssignedIdentity

Naam Beschrijving Waarde

Resourcedefinitie van Terraform (AzAPI-provider)

Het resourcetype werkruimten/onlineEndpoints/deployments kan worden geïmplementeerd met bewerkingen die zijn gericht op:

  • resourcegroepen

Zie logboek wijzigenvoor een lijst met gewijzigde eigenschappen in elke API-versie.

Resource-indeling

Als u een Resource microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments wilt maken, voegt u de volgende Terraform toe aan uw sjabloon.

resource "azapi_resource" "symbolicname" {
  type = "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2022-05-01"
  name = "string"
  identity = {
    type = "string"
    userAssignedIdentities = {
      {customized property} = {
      }
    }
  }
  kind = "string"
  location = "string"
  sku = {
    capacity = int
    family = "string"
    name = "string"
    size = "string"
    tier = "string"
  }
  tags = {
    {customized property} = "string"
  }
  body = jsonencode({
    properties = {
      appInsightsEnabled = bool
      codeConfiguration = {
        codeId = "string"
        scoringScript = "string"
      }
      description = "string"
      environmentId = "string"
      environmentVariables = {
        {customized property} = "string"
      }
      instanceType = "string"
      livenessProbe = {
        failureThreshold = int
        initialDelay = "string"
        period = "string"
        successThreshold = int
        timeout = "string"
      }
      model = "string"
      modelMountPath = "string"
      properties = {
        {customized property} = "string"
      }
      readinessProbe = {
        failureThreshold = int
        initialDelay = "string"
        period = "string"
        successThreshold = int
        timeout = "string"
      }
      requestSettings = {
        maxConcurrentRequestsPerInstance = int
        maxQueueWait = "string"
        requestTimeout = "string"
      }
      scaleSettings = {
        scaleType = "string"
        // For remaining properties, see OnlineScaleSettings objects
      }
      endpointComputeType = "string"
      // For remaining properties, see OnlineDeploymentProperties objects
    }
  })
}

OnlineDeploymentProperties-objecten

Stel de eigenschap endpointComputeType in om het type object op te geven.

Gebruik voor Kubernetes-:

{
  containerResourceRequirements = {
    containerResourceLimits = {
      cpu = "string"
      gpu = "string"
      memory = "string"
    }
    containerResourceRequests = {
      cpu = "string"
      gpu = "string"
      memory = "string"
    }
  }
  endpointComputeType = "Kubernetes"
}

Gebruik voor Beheerde:

{
  endpointComputeType = "Managed"
}

OnlineScaleSettings-objecten

Stel de eigenschap scaleType in om het type object op te geven.

Gebruik voor standaard:

{
  scaleType = "Default"
}

Gebruik voor TargetUtilization:

{
  maxInstances = int
  minInstances = int
  pollingInterval = "string"
  scaleType = "TargetUtilization"
  targetUtilizationPercentage = int
}

Eigenschapswaarden

CodeConfiguration

Naam Beschrijving Waarde
codeId ARM-resource-id van de codeasset. snaar
scoringScript [Vereist] Het script dat moet worden uitgevoerd bij het opstarten. bijvoorbeeld "score.py" snaar

Beperkingen:
Minimale lengte = 1
Patroon = [a-zA-Z0-9_] (vereist)

ContainerResourceRequirements

Naam Beschrijving Waarde
containerResourceLimits Informatie over de limiet voor containerresources: ContainerResourceSettings-
containerResourceRequests Informatie over containerresourceaanvragen: ContainerResourceSettings-

ContainerResourceSettings

Naam Beschrijving Waarde
CPU Aantal vCPU's aanvraag/limiet voor container. Meer informatie:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
snaar
Gpu Aantal Nvidia GPU-kaarten aanvragen/limieten voor containers. Meer informatie:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
snaar
geheugen Aanvraag/limiet voor geheugengrootte voor container. Meer informatie:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
snaar

DefaultScaleSettings

Naam Beschrijving Waarde
scaleType [Vereist] Type algoritme voor het schalen van implementaties 'Standaard' (vereist)

EndpointDeploymentPropertiesBaseEnvironmentVariables

Naam Beschrijving Waarde

EndpointDeploymentPropertiesBaseProperties

Naam Beschrijving Waarde

KubernetesOnlineDeployment

Naam Beschrijving Waarde
containerResourceRequirements De resourcevereisten voor de container (cpu en geheugen). ContainerResourceRequirements
endpointComputeType [Vereist] Het rekentype van het eindpunt. 'Kubernetes' (vereist)

ManagedOnlineDeployment

Naam Beschrijving Waarde
endpointComputeType [Vereist] Het rekentype van het eindpunt. Beheerd (vereist)

ManagedServiceIdentity

Naam Beschrijving Waarde
type Type beheerde service-identiteit (waarbij zowel SystemAssigned- als UserAssigned-typen zijn toegestaan). 'Geen'
'SystemAssigned'
'SystemAssigned, UserAssigned'
UserAssigned (vereist)
userAssignedIdentities De set door de gebruiker toegewezen identiteiten die aan de resource zijn gekoppeld. De woordenlijstsleutels userAssignedIdentities zijn ARM-resource-id's in de vorm: /subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. De woordenlijstwaarden kunnen lege objecten ({}) zijn in aanvragen. UserAssignedId-entiteiten

Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments

Naam Beschrijving Waarde
identiteit Beheerde service-identiteit (door het systeem toegewezen en/of door de gebruiker toegewezen identiteiten) ManagedServiceIdentity-
soort Metagegevens die worden gebruikt door portal/tooling/etc om verschillende UX-ervaringen weer te geven voor resources van hetzelfde type. snaar
plaats De geografische locatie waar de resource zich bevindt tekenreeks (vereist)
naam De resourcenaam snaar

Beperkingen:
Patroon = ^[a-zA-Z0-9][a-zA-Z0-9\-_]{0,254}$ (vereist)
parent_id De id van de resource die het bovenliggende item voor deze resource is. Id voor resource van het type: werkruimten/onlineEndpoints
Eigenschappen [Vereist] Aanvullende kenmerken van de entiteit. OnlineDeploymentProperties (vereist)
Sku SKU-gegevens die vereist zijn voor een ARM-contract voor automatisch schalen. SKU-
Tags Resourcetags Woordenlijst met tagnamen en -waarden.
type Het resourcetype "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2022-05-01"

OnlineDeploymentProperties

Naam Beschrijving Waarde
appInsightsEnabled Indien waar, schakelt u Application Insights-logboekregistratie in. Bool
codeConfiguration Codeconfiguratie voor de eindpuntimplementatie. CodeConfiguration-
beschrijving Beschrijving van de eindpuntimplementatie. snaar
endpointComputeType Ingesteld op 'Kubernetes' voor het type KubernetesOnlineDeployment. Ingesteld op Beheerd voor type ManagedOnlineDeployment. 'Kubernetes'
Beheerd (vereist)
environmentId ARM-resource-id of AssetId van de omgevingsspecificatie voor de eindpuntimplementatie. snaar
environmentVariables Configuratie van omgevingsvariabelen voor de implementatie. EndpointDeploymentPropertiesBaseEnvironmentVariables
instanceType Type rekeninstantie. snaar
livenessProbe De livenesstest bewaakt regelmatig de status van de container. ProbeSettings
model Het URI-pad naar het model. snaar
modelMountPath Het pad voor het koppelen van het model in een aangepaste container. snaar
Eigenschappen Eigenschappenwoordenlijst. Eigenschappen kunnen worden toegevoegd, maar niet worden verwijderd of gewijzigd. EndpointDeploymentPropertiesBaseProperties
readinessProbe De gereedheidstest controleert of de container gereed is om verkeer te verwerken. De eigenschappen en standaardwaarden zijn hetzelfde als de livenesstest. ProbeSettings
requestSettings Aanvraaginstellingen voor de implementatie. OnlineRequestSettings
scaleSettings Schaalinstellingen voor de implementatie.
Als deze null is of niet is opgegeven,
standaard ingesteld op TargetUtilizationScaleSettings voor KubernetesOnlineDeployment
en naar DefaultScaleSettings voor ManagedOnlineDeployment.
OnlineScaleSettings-

OnlineRequestSettings

Naam Beschrijving Waarde
maxConcurrentRequestsPerInstance Het aantal maximaal gelijktijdige aanvragen per knooppunt dat per implementatie is toegestaan. De standaardwaarde is 1. Int
maxQueueWait De maximale tijdsduur voor een aanvraag blijft in de wachtrij in ISO 8601-indeling.
De standaardwaarde is 500 ms.
snaar
requestTimeout De time-out voor scoren in ISO 8601-indeling.
De standaardwaarde is 5000 ms.
snaar

OnlineScaleSettings

Naam Beschrijving Waarde
scaleType Ingesteld op Standaard voor het type DefaultScaleSettings. Ingesteld op TargetUtilization voor type TargetUtilizationScaleSettings. 'Standaard'
TargetUtilization (vereist)

ProbeSettings

Naam Beschrijving Waarde
failureThreshold Het aantal fouten dat moet worden toegestaan voordat een beschadigde status wordt geretourneerd. Int
initialDelay De vertraging vóór de eerste test in ISO 8601-indeling. snaar
periode De tijdsduur tussen tests in ISO 8601-indeling. snaar
successThreshold Het aantal geslaagde tests voordat een status in orde wordt geretourneerd. Int
Timeout De time-out van de test in ISO 8601-indeling. snaar

Sku

Naam Beschrijving Waarde
capaciteit Als de SKU uitschalen/inschalen ondersteunt, moet het gehele getal van de capaciteit worden opgenomen. Als uitschalen/inschalen niet mogelijk is voor de resource, kan dit worden weggelaten. Int
Familie Als de service verschillende generaties hardware heeft, voor dezelfde SKU, kan die hier worden vastgelegd. snaar
naam De naam van de SKU. Ex - P3. Dit is meestal een letter+cijfercode tekenreeks (vereist)
grootte De SKU-grootte. Wanneer het naamveld de combinatie van de laag en een andere waarde is, is dit de zelfstandige code. snaar
rang Dit veld moet worden geïmplementeerd door de resourceprovider als de service meer dan één laag heeft, maar niet vereist is voor een PUT. 'Basis'
'Gratis'
'Premium'
'Standaard'

TargetUtilizationScaleSettings

Naam Beschrijving Waarde
maxInstances Het maximum aantal exemplaren waarnaar de implementatie kan worden geschaald. Het quotum wordt gereserveerd voor max_instances. Int
minInstances Het minimale aantal exemplaren dat altijd aanwezig moet zijn. Int
pollingInterval Het polling-interval in ISO 8691-indeling. Ondersteunt alleen de duur met precisie zo laag als seconden. snaar
scaleType [Vereist] Type algoritme voor het schalen van implementaties TargetUtilization (vereist)
targetUtilizationPercentage Doel-CPU-gebruik voor de automatische schaalaanpassing. Int

TrackedResourceTags

Naam Beschrijving Waarde

UserAssignedIdentities

Naam Beschrijving Waarde

UserAssignedIdentity

Naam Beschrijving Waarde