Dela via


Microsoft.MachineLearningServices-arbetsytor/onlineEndpoints/deployments 2024-04-01-preview

Bicep-resursdefinition

Resurstypen arbetsytor/onlineEndpoints/distributioner kan distribueras med åtgärder som mål:

En lista över ändrade egenskaper i varje API-version finns i ändringsloggen.

Resursformat

Om du vill skapa en Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments-resurs lägger du till följande Bicep i mallen.

resource symbolicname 'Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2024-04-01-preview' = {
  identity: {
    type: 'string'
    userAssignedIdentities: {
      {customized property}: {}
    }
  }
  kind: 'string'
  location: 'string'
  name: 'string'
  properties: {
    appInsightsEnabled: bool
    codeConfiguration: {
      codeId: 'string'
      scoringScript: 'string'
    }
    dataCollector: {
      collections: {
        {customized property}: {
          clientId: 'string'
          dataCollectionMode: 'string'
          dataId: 'string'
          samplingRate: int
        }
      }
      requestLogging: {
        captureHeaders: [
          'string'
        ]
      }
      rollingRate: 'string'
    }
    description: 'string'
    egressPublicNetworkAccess: 'string'
    environmentId: 'string'
    environmentVariables: {
      {customized property}: 'string'
    }
    instanceType: 'string'
    livenessProbe: {
      failureThreshold: int
      initialDelay: 'string'
      period: 'string'
      successThreshold: int
      timeout: 'string'
    }
    model: 'string'
    modelMountPath: 'string'
    properties: {
      {customized property}: 'string'
    }
    readinessProbe: {
      failureThreshold: int
      initialDelay: 'string'
      period: 'string'
      successThreshold: int
      timeout: 'string'
    }
    requestSettings: {
      maxConcurrentRequestsPerInstance: int
      maxQueueWait: 'string'
      requestTimeout: 'string'
    }
    scaleSettings: {
      scaleType: 'string'
      // For remaining properties, see OnlineScaleSettings objects
    }
    endpointComputeType: 'string'
    // For remaining properties, see OnlineDeploymentProperties objects
  }
  sku: {
    capacity: int
    family: 'string'
    name: 'string'
    size: 'string'
    tier: 'string'
  }
  tags: {
    {customized property}: 'string'
  }
}

OnlineDeploymentProperties-objekt

Ange egenskapen endpointComputeType för att ange typ av objekt.

För Kubernetesanvänder du:

{
  containerResourceRequirements: {
    containerResourceLimits: {
      cpu: 'string'
      gpu: 'string'
      memory: 'string'
    }
    containerResourceRequests: {
      cpu: 'string'
      gpu: 'string'
      memory: 'string'
    }
  }
  endpointComputeType: 'Kubernetes'
}

För Managedanvänder du:

{
  endpointComputeType: 'Managed'
}

OnlineScaleSettings-objekt

Ange egenskapen scaleType för att ange typ av objekt.

För standardanvänder du:

{
  scaleType: 'Default'
}

För TargetUtilizationanvänder du:

{
  maxInstances: int
  minInstances: int
  pollingInterval: 'string'
  scaleType: 'TargetUtilization'
  targetUtilizationPercentage: int
}

Egenskapsvärden

CodeConfiguration

Namn Beskrivning Värde
codeId ARM-resurs-ID för kodtillgången. sträng
scoringScript [Krävs] Skriptet som ska köras vid start. T.ex. "score.py" sträng

Begränsningar:
Min längd = 1
Mönster = [a-zA-Z0-9_] (krävs)

Samling

Namn Beskrivning Värde
clientId Msi-klient-ID:t som används för att samla in loggning till bloblagring. Om det är null väljer serverdelen en registrerad slutpunktsidentitet för autentisering. sträng
dataCollectionMode Aktivera eller inaktivera datainsamling. "Inaktiverad"
"Aktiverad"
dataId Resurs-ID för datatillgångsarmen. På klientsidan ser du till att datatillgången pekar på bloblagringen och att serverdelen samlar in data till bloblagringen. sträng
samplingRate Samplingsfrekvensen för insamling. Samplingshastighet 1,0 innebär att vi samlar in 100% data som standard. Int

ContainerResourceRequirements

Namn Beskrivning Värde
containerResourceLimits Information om gräns för containerresurser: ContainerResourceSettings
containerResourceRequests Information om containerresursbegäran: ContainerResourceSettings

ContainerResourceSettings

Namn Beskrivning Värde
processor Antal vCPU:er för begäran/gräns för container. Mer information:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
sträng
Gpu Antal Nvidia GPU-kort för begäran/gräns för container. Mer information:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
sträng
minne Begäran/gräns för minnesstorlek för container. Mer information:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
sträng

DataCollector

Namn Beskrivning Värde
samlingar [Krävs] Samlingskonfigurationen. Varje samling har en egen konfiguration för att samla in modelldata och namnet på samlingen kan vara godtycklig sträng.
Modelldatainsamlare kan användas för antingen nyttolastloggning eller anpassad loggning eller båda. Samlingsbegäran och svar är reserverade för nyttolastloggning, andra är för anpassad loggning.
DataCollectorCollections (krävs)
requestLogging Konfigurationen för begärandeloggning för mdc innehåller avancerade loggningsinställningar för alla samlingar. Det är valfritt. RequestLogging
rollingRate När modelldata samlas in till bloblagring måste vi distribuera data till en annan sökväg för att undvika att logga dem alla i en enda blobfil.
Om den löpande hastigheten är timme samlas alla data in i blobsökvägen /åååå/MM/dd/HH/.
Om det är dag samlas alla data in i blobsökvägen /åååå/MM/dd/.
Den andra fördelen med rullande sökväg är att användargränssnittet för modellövervakning kan välja ett tidsintervall med data mycket snabbt.
"Dag"
"Timme"
"Minut"
"Månad"
"År"

DataCollectorCollections

Namn Beskrivning Värde

DefaultScaleSettings

Namn Beskrivning Värde
scaleType [Krävs] Typ av distributionsskalningsalgoritm "Standard" (krävs)

EndpointDeploymentPropertiesBaseEnvironmentVariables

Namn Beskrivning Värde

EndpointDeploymentPropertiesBaseProperties

Namn Beskrivning Värde

KubernetesOnlineDeployment

Namn Beskrivning Värde
containerResourceRequirements Resurskraven för containern (cpu och minne). ContainerResourceRequirements
endpointComputeType [Krävs] Slutpunktens beräkningstyp. "Kubernetes" (krävs)

ManagedOnlineDeployment

Namn Beskrivning Värde
endpointComputeType [Krävs] Slutpunktens beräkningstyp. "Hanterad" (krävs)

ManagedServiceIdentity

Namn Beskrivning Värde
typ Typ av hanterad tjänstidentitet (där både SystemAssigned- och UserAssigned-typer tillåts). "Ingen"
"SystemAssigned"
"SystemAssigned,UserAssigned"
"UserAssigned" (krävs)
userAssignedIdentities Uppsättningen användartilldelade identiteter som är associerade med resursen. Ordlistenycklarna userAssignedIdentities är ARM-resurs-ID:er i formuläret: '/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. Ordlistevärdena kan vara tomma objekt ({}) i begäranden. UserAssignedIdentiteter

Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments

Namn Beskrivning Värde
identitet Hanterad tjänstidentitet (systemtilldelade och/eller användartilldelade identiteter) ManagedServiceIdentity
sort Metadata som används av portal/verktyg/etc för att återge olika UX-funktioner för resurser av samma typ. sträng
plats Den geo-plats där resursen finns sträng (krävs)
Namn Resursnamnet sträng

Begränsningar:
Mönster = ^[a-zA-Z0-9][a-zA-Z0-9\-_]{0,254}$ (krävs)
förälder I Bicep kan du ange den överordnade resursen för en underordnad resurs. Du behöver bara lägga till den här egenskapen när den underordnade resursen deklareras utanför den överordnade resursen.

Mer information finns i Underordnad resurs utanför den överordnade resursen.
Symboliskt namn för resurs av typen: arbetsytor/onlineSlutpunkter
Egenskaper [Krävs] Ytterligare attribut för entiteten. OnlineDeploymentProperties (krävs)
Sku Sku-information som krävs för ARM-kontrakt för automatisk skalning. Sku
Taggar Resurstaggar Ordlista med taggnamn och värden. Se taggar i mallar

OnlineDeploymentProperties

Namn Beskrivning Värde
appInsightsEnabled Om det är sant aktiverar du Application Insights-loggning. Bool
codeConfiguration Kodkonfiguration för slutpunktsdistributionen. CodeConfiguration
dataCollector MDC-konfigurationen inaktiverar vi mdc när det är null. DataCollector
beskrivning Beskrivning av slutpunktsdistributionen. sträng
egressPublicNetworkAccess Om aktiverad tillåter du åtkomst till utgående offentligt nätverk. Om inaktiverad skapas en säker utgående trafik. Standard: Aktiverad. "Inaktiverad"
"Aktiverad"
endpointComputeType Ange till Kubernetes för typen KubernetesOnlineDeployment. Ange till Hanterad för typen ManagedOnlineDeployment. "Kubernetes"
"Hanterad" (krävs)
environmentId ARM-resurs-ID för miljöspecifikationen för slutpunktsdistributionen. sträng
environmentVariables Konfiguration av miljövariabler för distributionen. EndpointDeploymentPropertiesBaseEnvironmentVariables
instanceType Typ av beräkningsinstans. sträng
livenessProbe Liveness-avsökning övervakar regelbundet containerns hälsa. ProbeSettings
modell URI-sökvägen till modellen. sträng
modelMountPath Sökvägen för att montera modellen i en anpassad container. sträng
Egenskaper Egenskapsordlista. Egenskaper kan läggas till, men inte tas bort eller ändras. EndpointDeploymentPropertiesBaseProperties
readinessProbe Beredskapsavsökningen verifierar om containern är redo att hantera trafik. Egenskaperna och standardvärdena är desamma som liveness-avsökningen. ProbeSettings
requestSettings Begär inställningar för distributionen. OnlineRequestSettings
scaleSettings Skalningsinställningar för distributionen.
Om den är null eller inte tillhandahålls,
standardvärdet är TargetUtilizationScaleSettings för KubernetesOnlineDeployment
och till DefaultScaleSettings för ManagedOnlineDeployment.
OnlineScaleSettings

OnlineRequestSettings

Namn Beskrivning Värde
maxConcurrentRequestsPerInstance Antalet maximala samtidiga begäranden per nod som tillåts per distribution. Standardvärdet är 1. Int
maxQueueWait Den maximala tiden som en begäran stannar i kön i ISO 8601-format.
Standardvärdet är 500 ms.
sträng
requestTimeout Tidsgränsen för bedömning i ISO 8601-format.
Standardvärdet är 5 000 ms.
sträng

OnlineScaleSettings

Namn Beskrivning Värde
scaleType Ställ in på Standard för typ DefaultScaleSettings. Ange till TargetUtilization för typ TargetUtilizationScaleSettings. "Standard"
"TargetUtilization" (krävs)

ProbeSettings

Namn Beskrivning Värde
failureThreshold Antalet fel som tillåts innan statusen inte är felfri returneras. Int
initialDelay Fördröjningen före den första avsökningen i ISO 8601-format. sträng
period Tiden mellan avsökningar i ISO 8601-format. sträng
successThreshold Antalet lyckade avsökningar innan en felfri status returneras. Int
Timeout Tidsgränsen för avsökningen i ISO 8601-format. sträng

Begärandeloggning

Namn Beskrivning Värde
captureHeaders För nyttolastloggning samlar vi bara in nyttolasten som standard. Om kunderna också vill samla in de angivna huvudena kan de ange dem i captureHeaders så att serverdelen samlar in dessa huvuden tillsammans med nyttolasten. string[]

Sku

Namn Beskrivning Värde
kapacitet Om SKU:n stöder utskalning/in bör kapacitets heltal inkluderas. Om det inte går att skala ut/in för resursen kan detta utelämnas. Int
familj Om tjänsten har olika generationer av maskinvara, för samma SKU, kan den samlas in här. sträng
Namn Namnet på SKU:n. Ex - P3. Det är vanligtvis en bokstav+nummerkod sträng (krävs)
storlek SKU-storleken. När namnfältet är kombinationen av nivå och något annat värde är detta den fristående koden. sträng
Nivå Det här fältet måste implementeras av resursprovidern om tjänsten har mer än en nivå, men inte krävs på en PUT. "Grundläggande"
"Kostnadsfri"
"Premium"
"Standard"

TargetUtilizationScaleSettings

Namn Beskrivning Värde
maxInstances Det maximala antalet instanser som distributionen kan skalas till. Kvoten reserveras för max_instances. Int
minInstances Det minsta antalet instanser som alltid ska finnas. Int
pollingInterval Avsökningsintervallet i ISO 8691-format. Stöder endast varaktighet med så låg precision som Sekunder. sträng
scaleType [Krävs] Typ av distributionsskalningsalgoritm "TargetUtilization" (krävs)
targetUtilizationPercentage Mål-CPU-användning för autoskalning. Int

TrackedResourceTags

Namn Beskrivning Värde

UserAssignedIdentiteter

Namn Beskrivning Värde

UserAssignedIdentity

Namn Beskrivning Värde

Resursdefinition för ARM-mall

Resurstypen arbetsytor/onlineEndpoints/distributioner kan distribueras med åtgärder som mål:

En lista över ändrade egenskaper i varje API-version finns i ändringsloggen.

Resursformat

Om du vill skapa en Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments-resurs lägger du till följande JSON i mallen.

{
  "type": "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments",
  "apiVersion": "2024-04-01-preview",
  "name": "string",
  "identity": {
    "type": "string",
    "userAssignedIdentities": {
      "{customized property}": {
      }
    }
  },
  "kind": "string",
  "location": "string",
  "properties": {
    "appInsightsEnabled": "bool",
    "codeConfiguration": {
      "codeId": "string",
      "scoringScript": "string"
    },
    "dataCollector": {
      "collections": {
        "{customized property}": {
          "clientId": "string",
          "dataCollectionMode": "string",
          "dataId": "string",
          "samplingRate": "int"
        }
      },
      "requestLogging": {
        "captureHeaders": [ "string" ]
      },
      "rollingRate": "string"
    },
    "description": "string",
    "egressPublicNetworkAccess": "string",
    "environmentId": "string",
    "environmentVariables": {
      "{customized property}": "string"
    },
    "instanceType": "string",
    "livenessProbe": {
      "failureThreshold": "int",
      "initialDelay": "string",
      "period": "string",
      "successThreshold": "int",
      "timeout": "string"
    },
    "model": "string",
    "modelMountPath": "string",
    "properties": {
      "{customized property}": "string"
    },
    "readinessProbe": {
      "failureThreshold": "int",
      "initialDelay": "string",
      "period": "string",
      "successThreshold": "int",
      "timeout": "string"
    },
    "requestSettings": {
      "maxConcurrentRequestsPerInstance": "int",
      "maxQueueWait": "string",
      "requestTimeout": "string"
    },
    "scaleSettings": {
      "scaleType": "string"
      // For remaining properties, see OnlineScaleSettings objects
    },
    "endpointComputeType": "string"
    // For remaining properties, see OnlineDeploymentProperties objects
  },
  "sku": {
    "capacity": "int",
    "family": "string",
    "name": "string",
    "size": "string",
    "tier": "string"
  },
  "tags": {
    "{customized property}": "string"
  }
}

OnlineDeploymentProperties-objekt

Ange egenskapen endpointComputeType för att ange typ av objekt.

För Kubernetesanvänder du:

{
  "containerResourceRequirements": {
    "containerResourceLimits": {
      "cpu": "string",
      "gpu": "string",
      "memory": "string"
    },
    "containerResourceRequests": {
      "cpu": "string",
      "gpu": "string",
      "memory": "string"
    }
  },
  "endpointComputeType": "Kubernetes"
}

För Managedanvänder du:

{
  "endpointComputeType": "Managed"
}

OnlineScaleSettings-objekt

Ange egenskapen scaleType för att ange typ av objekt.

För standardanvänder du:

{
  "scaleType": "Default"
}

För TargetUtilizationanvänder du:

{
  "maxInstances": "int",
  "minInstances": "int",
  "pollingInterval": "string",
  "scaleType": "TargetUtilization",
  "targetUtilizationPercentage": "int"
}

Egenskapsvärden

CodeConfiguration

Namn Beskrivning Värde
codeId ARM-resurs-ID för kodtillgången. sträng
scoringScript [Krävs] Skriptet som ska köras vid start. T.ex. "score.py" sträng

Begränsningar:
Min längd = 1
Mönster = [a-zA-Z0-9_] (krävs)

Samling

Namn Beskrivning Värde
clientId Msi-klient-ID:t som används för att samla in loggning till bloblagring. Om det är null väljer serverdelen en registrerad slutpunktsidentitet för autentisering. sträng
dataCollectionMode Aktivera eller inaktivera datainsamling. "Inaktiverad"
"Aktiverad"
dataId Resurs-ID för datatillgångsarmen. På klientsidan ser du till att datatillgången pekar på bloblagringen och att serverdelen samlar in data till bloblagringen. sträng
samplingRate Samplingsfrekvensen för insamling. Samplingshastighet 1,0 innebär att vi samlar in 100% data som standard. Int

ContainerResourceRequirements

Namn Beskrivning Värde
containerResourceLimits Information om gräns för containerresurser: ContainerResourceSettings
containerResourceRequests Information om containerresursbegäran: ContainerResourceSettings

ContainerResourceSettings

Namn Beskrivning Värde
processor Antal vCPU:er för begäran/gräns för container. Mer information:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
sträng
Gpu Antal Nvidia GPU-kort för begäran/gräns för container. Mer information:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
sträng
minne Begäran/gräns för minnesstorlek för container. Mer information:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
sträng

DataCollector

Namn Beskrivning Värde
samlingar [Krävs] Samlingskonfigurationen. Varje samling har en egen konfiguration för att samla in modelldata och namnet på samlingen kan vara godtycklig sträng.
Modelldatainsamlare kan användas för antingen nyttolastloggning eller anpassad loggning eller båda. Samlingsbegäran och svar är reserverade för nyttolastloggning, andra är för anpassad loggning.
DataCollectorCollections (krävs)
requestLogging Konfigurationen för begärandeloggning för mdc innehåller avancerade loggningsinställningar för alla samlingar. Det är valfritt. RequestLogging
rollingRate När modelldata samlas in till bloblagring måste vi distribuera data till en annan sökväg för att undvika att logga dem alla i en enda blobfil.
Om den löpande hastigheten är timme samlas alla data in i blobsökvägen /åååå/MM/dd/HH/.
Om det är dag samlas alla data in i blobsökvägen /åååå/MM/dd/.
Den andra fördelen med rullande sökväg är att användargränssnittet för modellövervakning kan välja ett tidsintervall med data mycket snabbt.
"Dag"
"Timme"
"Minut"
"Månad"
"År"

DataCollectorCollections

Namn Beskrivning Värde

DefaultScaleSettings

Namn Beskrivning Värde
scaleType [Krävs] Typ av distributionsskalningsalgoritm "Standard" (krävs)

EndpointDeploymentPropertiesBaseEnvironmentVariables

Namn Beskrivning Värde

EndpointDeploymentPropertiesBaseProperties

Namn Beskrivning Värde

KubernetesOnlineDeployment

Namn Beskrivning Värde
containerResourceRequirements Resurskraven för containern (cpu och minne). ContainerResourceRequirements
endpointComputeType [Krävs] Slutpunktens beräkningstyp. "Kubernetes" (krävs)

ManagedOnlineDeployment

Namn Beskrivning Värde
endpointComputeType [Krävs] Slutpunktens beräkningstyp. "Hanterad" (krävs)

ManagedServiceIdentity

Namn Beskrivning Värde
typ Typ av hanterad tjänstidentitet (där både SystemAssigned- och UserAssigned-typer tillåts). "Ingen"
"SystemAssigned"
"SystemAssigned,UserAssigned"
"UserAssigned" (krävs)
userAssignedIdentities Uppsättningen användartilldelade identiteter som är associerade med resursen. Ordlistenycklarna userAssignedIdentities är ARM-resurs-ID:er i formuläret: '/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. Ordlistevärdena kan vara tomma objekt ({}) i begäranden. UserAssignedIdentiteter

Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments

Namn Beskrivning Värde
apiVersion API-versionen "2024-04-01-preview"
identitet Hanterad tjänstidentitet (systemtilldelade och/eller användartilldelade identiteter) ManagedServiceIdentity
sort Metadata som används av portal/verktyg/etc för att återge olika UX-funktioner för resurser av samma typ. sträng
plats Den geo-plats där resursen finns sträng (krävs)
Namn Resursnamnet sträng

Begränsningar:
Mönster = ^[a-zA-Z0-9][a-zA-Z0-9\-_]{0,254}$ (krävs)
Egenskaper [Krävs] Ytterligare attribut för entiteten. OnlineDeploymentProperties (krävs)
Sku Sku-information som krävs för ARM-kontrakt för automatisk skalning. Sku
Taggar Resurstaggar Ordlista med taggnamn och värden. Se taggar i mallar
typ Resurstypen "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments"

OnlineDeploymentProperties

Namn Beskrivning Värde
appInsightsEnabled Om det är sant aktiverar du Application Insights-loggning. Bool
codeConfiguration Kodkonfiguration för slutpunktsdistributionen. CodeConfiguration
dataCollector MDC-konfigurationen inaktiverar vi mdc när det är null. DataCollector
beskrivning Beskrivning av slutpunktsdistributionen. sträng
egressPublicNetworkAccess Om aktiverad tillåter du åtkomst till utgående offentligt nätverk. Om inaktiverad skapas en säker utgående trafik. Standard: Aktiverad. "Inaktiverad"
"Aktiverad"
endpointComputeType Ange till Kubernetes för typen KubernetesOnlineDeployment. Ange till Hanterad för typen ManagedOnlineDeployment. "Kubernetes"
"Hanterad" (krävs)
environmentId ARM-resurs-ID för miljöspecifikationen för slutpunktsdistributionen. sträng
environmentVariables Konfiguration av miljövariabler för distributionen. EndpointDeploymentPropertiesBaseEnvironmentVariables
instanceType Typ av beräkningsinstans. sträng
livenessProbe Liveness-avsökning övervakar regelbundet containerns hälsa. ProbeSettings
modell URI-sökvägen till modellen. sträng
modelMountPath Sökvägen för att montera modellen i en anpassad container. sträng
Egenskaper Egenskapsordlista. Egenskaper kan läggas till, men inte tas bort eller ändras. EndpointDeploymentPropertiesBaseProperties
readinessProbe Beredskapsavsökningen verifierar om containern är redo att hantera trafik. Egenskaperna och standardvärdena är desamma som liveness-avsökningen. ProbeSettings
requestSettings Begär inställningar för distributionen. OnlineRequestSettings
scaleSettings Skalningsinställningar för distributionen.
Om den är null eller inte tillhandahålls,
standardvärdet är TargetUtilizationScaleSettings för KubernetesOnlineDeployment
och till DefaultScaleSettings för ManagedOnlineDeployment.
OnlineScaleSettings

OnlineRequestSettings

Namn Beskrivning Värde
maxConcurrentRequestsPerInstance Antalet maximala samtidiga begäranden per nod som tillåts per distribution. Standardvärdet är 1. Int
maxQueueWait Den maximala tiden som en begäran stannar i kön i ISO 8601-format.
Standardvärdet är 500 ms.
sträng
requestTimeout Tidsgränsen för bedömning i ISO 8601-format.
Standardvärdet är 5 000 ms.
sträng

OnlineScaleSettings

Namn Beskrivning Värde
scaleType Ställ in på Standard för typ DefaultScaleSettings. Ange till TargetUtilization för typ TargetUtilizationScaleSettings. "Standard"
"TargetUtilization" (krävs)

ProbeSettings

Namn Beskrivning Värde
failureThreshold Antalet fel som tillåts innan statusen inte är felfri returneras. Int
initialDelay Fördröjningen före den första avsökningen i ISO 8601-format. sträng
period Tiden mellan avsökningar i ISO 8601-format. sträng
successThreshold Antalet lyckade avsökningar innan en felfri status returneras. Int
Timeout Tidsgränsen för avsökningen i ISO 8601-format. sträng

Begärandeloggning

Namn Beskrivning Värde
captureHeaders För nyttolastloggning samlar vi bara in nyttolasten som standard. Om kunderna också vill samla in de angivna huvudena kan de ange dem i captureHeaders så att serverdelen samlar in dessa huvuden tillsammans med nyttolasten. string[]

Sku

Namn Beskrivning Värde
kapacitet Om SKU:n stöder utskalning/in bör kapacitets heltal inkluderas. Om det inte går att skala ut/in för resursen kan detta utelämnas. Int
familj Om tjänsten har olika generationer av maskinvara, för samma SKU, kan den samlas in här. sträng
Namn Namnet på SKU:n. Ex - P3. Det är vanligtvis en bokstav+nummerkod sträng (krävs)
storlek SKU-storleken. När namnfältet är kombinationen av nivå och något annat värde är detta den fristående koden. sträng
Nivå Det här fältet måste implementeras av resursprovidern om tjänsten har mer än en nivå, men inte krävs på en PUT. "Grundläggande"
"Kostnadsfri"
"Premium"
"Standard"

TargetUtilizationScaleSettings

Namn Beskrivning Värde
maxInstances Det maximala antalet instanser som distributionen kan skalas till. Kvoten reserveras för max_instances. Int
minInstances Det minsta antalet instanser som alltid ska finnas. Int
pollingInterval Avsökningsintervallet i ISO 8691-format. Stöder endast varaktighet med så låg precision som Sekunder. sträng
scaleType [Krävs] Typ av distributionsskalningsalgoritm "TargetUtilization" (krävs)
targetUtilizationPercentage Mål-CPU-användning för autoskalning. Int

TrackedResourceTags

Namn Beskrivning Värde

UserAssignedIdentiteter

Namn Beskrivning Värde

UserAssignedIdentity

Namn Beskrivning Värde

Resursdefinition för Terraform (AzAPI-provider)

Resurstypen arbetsytor/onlineEndpoints/distributioner kan distribueras med åtgärder som mål:

  • Resursgrupper

En lista över ändrade egenskaper i varje API-version finns i ändringsloggen.

Resursformat

Om du vill skapa en Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments-resurs lägger du till följande Terraform i mallen.

resource "azapi_resource" "symbolicname" {
  type = "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2024-04-01-preview"
  name = "string"
  identity = {
    type = "string"
    userAssignedIdentities = {
      {customized property} = {
      }
    }
  }
  kind = "string"
  location = "string"
  body = jsonencode({
    properties = {
      appInsightsEnabled = bool
      codeConfiguration = {
        codeId = "string"
        scoringScript = "string"
      }
      dataCollector = {
        collections = {
          {customized property} = {
            clientId = "string"
            dataCollectionMode = "string"
            dataId = "string"
            samplingRate = int
          }
        }
        requestLogging = {
          captureHeaders = [
            "string"
          ]
        }
        rollingRate = "string"
      }
      description = "string"
      egressPublicNetworkAccess = "string"
      environmentId = "string"
      environmentVariables = {
        {customized property} = "string"
      }
      instanceType = "string"
      livenessProbe = {
        failureThreshold = int
        initialDelay = "string"
        period = "string"
        successThreshold = int
        timeout = "string"
      }
      model = "string"
      modelMountPath = "string"
      properties = {
        {customized property} = "string"
      }
      readinessProbe = {
        failureThreshold = int
        initialDelay = "string"
        period = "string"
        successThreshold = int
        timeout = "string"
      }
      requestSettings = {
        maxConcurrentRequestsPerInstance = int
        maxQueueWait = "string"
        requestTimeout = "string"
      }
      scaleSettings = {
        scaleType = "string"
        // For remaining properties, see OnlineScaleSettings objects
      }
      endpointComputeType = "string"
      // For remaining properties, see OnlineDeploymentProperties objects
    }
  })
  sku = {
    capacity = int
    family = "string"
    name = "string"
    size = "string"
    tier = "string"
  }
  tags = {
    {customized property} = "string"
  }
}

OnlineDeploymentProperties-objekt

Ange egenskapen endpointComputeType för att ange typ av objekt.

För Kubernetesanvänder du:

{
  containerResourceRequirements = {
    containerResourceLimits = {
      cpu = "string"
      gpu = "string"
      memory = "string"
    }
    containerResourceRequests = {
      cpu = "string"
      gpu = "string"
      memory = "string"
    }
  }
  endpointComputeType = "Kubernetes"
}

För Managedanvänder du:

{
  endpointComputeType = "Managed"
}

OnlineScaleSettings-objekt

Ange egenskapen scaleType för att ange typ av objekt.

För standardanvänder du:

{
  scaleType = "Default"
}

För TargetUtilizationanvänder du:

{
  maxInstances = int
  minInstances = int
  pollingInterval = "string"
  scaleType = "TargetUtilization"
  targetUtilizationPercentage = int
}

Egenskapsvärden

CodeConfiguration

Namn Beskrivning Värde
codeId ARM-resurs-ID för kodtillgången. sträng
scoringScript [Krävs] Skriptet som ska köras vid start. T.ex. "score.py" sträng

Begränsningar:
Min längd = 1
Mönster = [a-zA-Z0-9_] (krävs)

Samling

Namn Beskrivning Värde
clientId Msi-klient-ID:t som används för att samla in loggning till bloblagring. Om det är null väljer serverdelen en registrerad slutpunktsidentitet för autentisering. sträng
dataCollectionMode Aktivera eller inaktivera datainsamling. "Inaktiverad"
"Aktiverad"
dataId Resurs-ID för datatillgångsarmen. På klientsidan ser du till att datatillgången pekar på bloblagringen och att serverdelen samlar in data till bloblagringen. sträng
samplingRate Samplingsfrekvensen för insamling. Samplingshastighet 1,0 innebär att vi samlar in 100% data som standard. Int

ContainerResourceRequirements

Namn Beskrivning Värde
containerResourceLimits Information om gräns för containerresurser: ContainerResourceSettings
containerResourceRequests Information om containerresursbegäran: ContainerResourceSettings

ContainerResourceSettings

Namn Beskrivning Värde
processor Antal vCPU:er för begäran/gräns för container. Mer information:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
sträng
Gpu Antal Nvidia GPU-kort för begäran/gräns för container. Mer information:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
sträng
minne Begäran/gräns för minnesstorlek för container. Mer information:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
sträng

DataCollector

Namn Beskrivning Värde
samlingar [Krävs] Samlingskonfigurationen. Varje samling har en egen konfiguration för att samla in modelldata och namnet på samlingen kan vara godtycklig sträng.
Modelldatainsamlare kan användas för antingen nyttolastloggning eller anpassad loggning eller båda. Samlingsbegäran och svar är reserverade för nyttolastloggning, andra är för anpassad loggning.
DataCollectorCollections (krävs)
requestLogging Konfigurationen för begärandeloggning för mdc innehåller avancerade loggningsinställningar för alla samlingar. Det är valfritt. RequestLogging
rollingRate När modelldata samlas in till bloblagring måste vi distribuera data till en annan sökväg för att undvika att logga dem alla i en enda blobfil.
Om den löpande hastigheten är timme samlas alla data in i blobsökvägen /åååå/MM/dd/HH/.
Om det är dag samlas alla data in i blobsökvägen /åååå/MM/dd/.
Den andra fördelen med rullande sökväg är att användargränssnittet för modellövervakning kan välja ett tidsintervall med data mycket snabbt.
"Dag"
"Timme"
"Minut"
"Månad"
"År"

DataCollectorCollections

Namn Beskrivning Värde

DefaultScaleSettings

Namn Beskrivning Värde
scaleType [Krävs] Typ av distributionsskalningsalgoritm "Standard" (krävs)

EndpointDeploymentPropertiesBaseEnvironmentVariables

Namn Beskrivning Värde

EndpointDeploymentPropertiesBaseProperties

Namn Beskrivning Värde

KubernetesOnlineDeployment

Namn Beskrivning Värde
containerResourceRequirements Resurskraven för containern (cpu och minne). ContainerResourceRequirements
endpointComputeType [Krävs] Slutpunktens beräkningstyp. "Kubernetes" (krävs)

ManagedOnlineDeployment

Namn Beskrivning Värde
endpointComputeType [Krävs] Slutpunktens beräkningstyp. "Hanterad" (krävs)

ManagedServiceIdentity

Namn Beskrivning Värde
typ Typ av hanterad tjänstidentitet (där både SystemAssigned- och UserAssigned-typer tillåts). "Ingen"
"SystemAssigned"
"SystemAssigned,UserAssigned"
"UserAssigned" (krävs)
userAssignedIdentities Uppsättningen användartilldelade identiteter som är associerade med resursen. Ordlistenycklarna userAssignedIdentities är ARM-resurs-ID:er i formuläret: '/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. Ordlistevärdena kan vara tomma objekt ({}) i begäranden. UserAssignedIdentiteter

Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments

Namn Beskrivning Värde
identitet Hanterad tjänstidentitet (systemtilldelade och/eller användartilldelade identiteter) ManagedServiceIdentity
sort Metadata som används av portal/verktyg/etc för att återge olika UX-funktioner för resurser av samma typ. sträng
plats Den geo-plats där resursen finns sträng (krävs)
Namn Resursnamnet sträng

Begränsningar:
Mönster = ^[a-zA-Z0-9][a-zA-Z0-9\-_]{0,254}$ (krävs)
parent_id ID för resursen som är överordnad för den här resursen. ID för resurs av typen: arbetsytor/onlineSlutpunkter
Egenskaper [Krävs] Ytterligare attribut för entiteten. OnlineDeploymentProperties (krävs)
Sku Sku-information som krävs för ARM-kontrakt för automatisk skalning. Sku
Taggar Resurstaggar Ordlista med taggnamn och värden.
typ Resurstypen "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2024-04-01-preview"

OnlineDeploymentProperties

Namn Beskrivning Värde
appInsightsEnabled Om det är sant aktiverar du Application Insights-loggning. Bool
codeConfiguration Kodkonfiguration för slutpunktsdistributionen. CodeConfiguration
dataCollector MDC-konfigurationen inaktiverar vi mdc när det är null. DataCollector
beskrivning Beskrivning av slutpunktsdistributionen. sträng
egressPublicNetworkAccess Om aktiverad tillåter du åtkomst till utgående offentligt nätverk. Om inaktiverad skapas en säker utgående trafik. Standard: Aktiverad. "Inaktiverad"
"Aktiverad"
endpointComputeType Ange till Kubernetes för typen KubernetesOnlineDeployment. Ange till Hanterad för typen ManagedOnlineDeployment. "Kubernetes"
"Hanterad" (krävs)
environmentId ARM-resurs-ID för miljöspecifikationen för slutpunktsdistributionen. sträng
environmentVariables Konfiguration av miljövariabler för distributionen. EndpointDeploymentPropertiesBaseEnvironmentVariables
instanceType Typ av beräkningsinstans. sträng
livenessProbe Liveness-avsökning övervakar regelbundet containerns hälsa. ProbeSettings
modell URI-sökvägen till modellen. sträng
modelMountPath Sökvägen för att montera modellen i en anpassad container. sträng
Egenskaper Egenskapsordlista. Egenskaper kan läggas till, men inte tas bort eller ändras. EndpointDeploymentPropertiesBaseProperties
readinessProbe Beredskapsavsökningen verifierar om containern är redo att hantera trafik. Egenskaperna och standardvärdena är desamma som liveness-avsökningen. ProbeSettings
requestSettings Begär inställningar för distributionen. OnlineRequestSettings
scaleSettings Skalningsinställningar för distributionen.
Om den är null eller inte tillhandahålls,
standardvärdet är TargetUtilizationScaleSettings för KubernetesOnlineDeployment
och till DefaultScaleSettings för ManagedOnlineDeployment.
OnlineScaleSettings

OnlineRequestSettings

Namn Beskrivning Värde
maxConcurrentRequestsPerInstance Antalet maximala samtidiga begäranden per nod som tillåts per distribution. Standardvärdet är 1. Int
maxQueueWait Den maximala tiden som en begäran stannar i kön i ISO 8601-format.
Standardvärdet är 500 ms.
sträng
requestTimeout Tidsgränsen för bedömning i ISO 8601-format.
Standardvärdet är 5 000 ms.
sträng

OnlineScaleSettings

Namn Beskrivning Värde
scaleType Ställ in på Standard för typ DefaultScaleSettings. Ange till TargetUtilization för typ TargetUtilizationScaleSettings. "Standard"
"TargetUtilization" (krävs)

ProbeSettings

Namn Beskrivning Värde
failureThreshold Antalet fel som tillåts innan statusen inte är felfri returneras. Int
initialDelay Fördröjningen före den första avsökningen i ISO 8601-format. sträng
period Tiden mellan avsökningar i ISO 8601-format. sträng
successThreshold Antalet lyckade avsökningar innan en felfri status returneras. Int
Timeout Tidsgränsen för avsökningen i ISO 8601-format. sträng

Begärandeloggning

Namn Beskrivning Värde
captureHeaders För nyttolastloggning samlar vi bara in nyttolasten som standard. Om kunderna också vill samla in de angivna huvudena kan de ange dem i captureHeaders så att serverdelen samlar in dessa huvuden tillsammans med nyttolasten. string[]

Sku

Namn Beskrivning Värde
kapacitet Om SKU:n stöder utskalning/in bör kapacitets heltal inkluderas. Om det inte går att skala ut/in för resursen kan detta utelämnas. Int
familj Om tjänsten har olika generationer av maskinvara, för samma SKU, kan den samlas in här. sträng
Namn Namnet på SKU:n. Ex - P3. Det är vanligtvis en bokstav+nummerkod sträng (krävs)
storlek SKU-storleken. När namnfältet är kombinationen av nivå och något annat värde är detta den fristående koden. sträng
Nivå Det här fältet måste implementeras av resursprovidern om tjänsten har mer än en nivå, men inte krävs på en PUT. "Grundläggande"
"Kostnadsfri"
"Premium"
"Standard"

TargetUtilizationScaleSettings

Namn Beskrivning Värde
maxInstances Det maximala antalet instanser som distributionen kan skalas till. Kvoten reserveras för max_instances. Int
minInstances Det minsta antalet instanser som alltid ska finnas. Int
pollingInterval Avsökningsintervallet i ISO 8691-format. Stöder endast varaktighet med så låg precision som Sekunder. sträng
scaleType [Krävs] Typ av distributionsskalningsalgoritm "TargetUtilization" (krävs)
targetUtilizationPercentage Mål-CPU-användning för autoskalning. Int

TrackedResourceTags

Namn Beskrivning Värde

UserAssignedIdentiteter

Namn Beskrivning Värde

UserAssignedIdentity

Namn Beskrivning Värde