Sdílet prostřednictvím


Pracovní prostory Microsoft.MachineLearningServices/ onlineEndpoints/deployments 2023-10-01

Definice prostředku Bicep

Pracovní prostory/ onlineEndpoints/deployments typ prostředku je možné nasadit s operacemi, které cílí:

Seznam změněných vlastností v jednotlivých verzích rozhraní API najdete v protokolu změn.

Formát prostředku

Pokud chcete vytvořit prostředek Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments, přidejte do šablony následující bicep.

resource symbolicname 'Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2023-10-01' = {
  parent: resourceSymbolicName
  identity: {
    type: 'string'
    userAssignedIdentities: {
      {customized property}: {}
    }
  }
  kind: 'string'
  location: 'string'
  name: 'string'
  properties: {
    appInsightsEnabled: bool
    codeConfiguration: {
      codeId: 'string'
      scoringScript: 'string'
    }
    description: 'string'
    egressPublicNetworkAccess: 'string'
    environmentId: 'string'
    environmentVariables: {
      {customized property}: 'string'
    }
    instanceType: 'string'
    livenessProbe: {
      failureThreshold: int
      initialDelay: 'string'
      period: 'string'
      successThreshold: int
      timeout: 'string'
    }
    model: 'string'
    modelMountPath: 'string'
    properties: {
      {customized property}: 'string'
    }
    readinessProbe: {
      failureThreshold: int
      initialDelay: 'string'
      period: 'string'
      successThreshold: int
      timeout: 'string'
    }
    requestSettings: {
      maxConcurrentRequestsPerInstance: int
      maxQueueWait: 'string'
      requestTimeout: 'string'
    }
    scaleSettings: {
      scaleType: 'string'
      // For remaining properties, see OnlineScaleSettings objects
    }
    endpointComputeType: 'string'
    // For remaining properties, see OnlineDeploymentProperties objects
  }
  sku: {
    capacity: int
    family: 'string'
    name: 'string'
    size: 'string'
    tier: 'string'
  }
  tags: {
    {customized property}: 'string'
  }
}

Objekty OnlineDeploymentProperties

Nastavte endpointComputeType vlastnost určit typ objektu.

Pro Kubernetes použijte:

{
  containerResourceRequirements: {
    containerResourceLimits: {
      cpu: 'string'
      gpu: 'string'
      memory: 'string'
    }
    containerResourceRequests: {
      cpu: 'string'
      gpu: 'string'
      memory: 'string'
    }
  }
  endpointComputeType: 'Kubernetes'
}

Pro spravovanépoužijte:

{
  endpointComputeType: 'Managed'
}

Objekty OnlineScaleSettings

Nastavte scaleType vlastnost určit typ objektu.

Pro Výchozípoužijte:

{
  scaleType: 'Default'
}

Pro cílové využitípoužijte:

{
  maxInstances: int
  minInstances: int
  pollingInterval: 'string'
  scaleType: 'TargetUtilization'
  targetUtilizationPercentage: int
}

Hodnoty vlastností

CodeConfiguration

Jméno Popis Hodnota
codeId ID prostředku ARM prostředku kódu řetězec
BodováníScriptu [Povinné] Skript, který se má spustit při spuštění. Např. "score.py" řetězec

Omezení:
Minimální délka = 1
Model = [a-zA-Z0-9_] (povinné)

ContainerResourceRequirements

Jméno Popis Hodnota
containerResourceLimits Informace o limitu prostředků kontejneru: ContainerResourceSettings
containerResourceRequests Informace o požadavku na prostředek kontejneru: ContainerResourceSettings

ContainerResourceSettings

Jméno Popis Hodnota
procesor Počet požadavků nebo limitu počtu vCPU pro kontejner Více:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
řetězec
Gpu Počet požadavků nebo omezení karet Nvidia GPU pro kontejner Více:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
řetězec
paměť Požadavek nebo limit velikosti paměti pro kontejner. Více:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
řetězec

DefaultScaleSettings

Jméno Popis Hodnota
scaleType [Povinné] Typ algoritmu škálování nasazení Výchozí (povinné)

EndpointDeploymentPropertiesBaseEnvironmentVariables

Jméno Popis Hodnota

EndpointDeploymentPropertiesBaseProperties

Jméno Popis Hodnota

KubernetesOnlineDeployment

Jméno Popis Hodnota
containerResourceRequirements Požadavky na prostředky pro kontejner (procesor a paměť). ContainerResourceRequirements
endpointComputeType [Povinné] Typ výpočetního objektu koncového bodu. Kubernetes (povinné)

ManagedOnlineDeployment

Jméno Popis Hodnota
endpointComputeType [Povinné] Typ výpočetního objektu koncového bodu. Spravované (povinné)

ManagedServiceIdentity

Jméno Popis Hodnota
typ Typ identity spravované služby (kde jsou povolené typy SystemAssigned i UserAssigned). None (Žádný)
SystemAssigned
SystemAssigned, UserAssigned
UserAssigned (povinné)
userAssignedIdentities Sada identit přiřazených uživatelem přidružená k prostředku. Klíče slovníku userAssignedIdentities budou ID prostředků ARM ve formuláři: /subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. Hodnoty slovníku můžou být prázdné objekty ({}) v požadavcích. userAssignedIdentities

Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments

Jméno Popis Hodnota
identita Identita spravované služby (identita přiřazená systémem nebo identita přiřazená uživatelem) ManagedServiceIdentity
laskavý Metadata používaná portálem, nástroji atd. k vykreslení různých prostředí uživatelského rozhraní pro prostředky stejného typu. řetězec
umístění Geografické umístění, ve kterém se nachází zdroj string (povinné)
Jméno Název prostředku řetězec

Omezení:
Model = ^[a-zA-Z0-9][a-zA-Z0-9\-_]{0,254}$ (povinné)
rodič V bicep můžete zadat nadřazený prostředek pro podřízený prostředek. Tuto vlastnost je potřeba přidat pouze v případě, že je podřízený prostředek deklarován mimo nadřazený prostředek.

Další informace najdete v tématu Podřízený prostředek mimo nadřazený prostředek.
Symbolický název prostředku typu: pracovních prostorů/onlineEndpoints
vlastnosti [Povinné] Další atributy entity. OnlineDeploymentProperties (povinné)
sku Podrobnosti skladové položky vyžadované pro kontrakt ARM pro automatické škálování skladové položky
visačky Značky prostředků Slovník názvů a hodnot značek Viz Značky v šablonách

OnlineDeploymentProperties

Jméno Popis Hodnota
appInsightsEnabled Pokud je pravda, povolí protokolování Application Insights. Bool
CodeConfiguration Konfigurace kódu pro nasazení koncového bodu CodeConfiguration
popis Popis nasazení koncového bodu řetězec
egressPublicNetworkAccess Pokud je tato možnost povolená, povolte přístup k veřejné síti pro výchozí přenos dat. Pokud je zakázáno, vytvoří se zabezpečený výchozí přenos dat. Výchozí: Povoleno. Zakázáno
Povoleno
endpointComputeType Nastavte na Kubernetes pro typ KubernetesOnlineDeployment. U typu ManagedOnlineDeploymentna hodnotu ManagedOnlineDeployment . Kubernetes
Spravované (povinné)
environmentId ID prostředku ARM nebo AssetId specifikace prostředí pro nasazení koncového bodu řetězec
environmentVariables Konfigurace proměnných prostředí pro nasazení EndpointDeploymentPropertiesBaseEnvironmentVariables
instanceType Typ výpočetní instance. řetězec
livenessProbe Sonda aktivity pravidelně monitoruje stav kontejneru. ProbeSettings
model Cesta URI k modelu. řetězec
modelMountPath Cesta k připojení modelu ve vlastním kontejneru. řetězec
vlastnosti Slovník vlastností Vlastnosti lze přidat, ale ne odebrat nebo změnit. endpointDeploymentPropertiesBaseProperties
readinessProbe Sonda připravenosti ověří, jestli je kontejner připravený obsluhovat provoz. Vlastnosti a výchozí hodnoty jsou stejné jako sonda aktivity. ProbeSettings
requestSettings Požádejte o nastavení nasazení. OnlineRequestSettings
scaleSettings Nastavení škálování pro nasazení
Pokud je hodnota null nebo není zadaná,
Výchozí hodnota TargetUtilizationScaleSettings pro KubernetesOnlineDeployment
a do DefaultScaleSettings pro ManagedOnlineDeployment.
OnlineScaleSettings

OnlineRequestSettings

Jméno Popis Hodnota
maxConcurrentRequestsPerInstance Počet maximálních souběžných požadavků na uzel povolený pro každé nasazení. Výchozí hodnota je 1. Int
maxQueueWait (Zastaralé pro spravované online koncové body) Maximální doba, po kterou požadavek zůstane ve frontě ve formátu ISO 8601.
Výchozí hodnota je 500 ms.
(Teď zvyšte request_timeout_ms, aby se zohlednily případné zpoždění sítě nebo fronty.
řetězec
requestTimeout Časový limit bodování ve formátu ISO 8601.
Výchozí hodnota je 5000 ms.
řetězec

OnlineScaleSettings

Jméno Popis Hodnota
scaleType Pro typ DefaultScaleSettingsnastavte na DefaultScaleSettings . Pro typ TargetUtilizationScaleSettings nastavte na TargetUtilizationSettings. Výchozí
Cílové využití (povinné)

ProbeSettings

Jméno Popis Hodnota
failureThreshold Počet chyb, které se mají povolit před vrácením stavu, který není v pořádku. Int
initialDelay Zpoždění před první sondou ve formátu ISO 8601. řetězec
perioda Doba mezi sondami ve formátu ISO 8601. řetězec
successThreshold Počet úspěšných sond před vrácením stavu v pořádku. Int
přerušení zápasu Časový limit sondy ve formátu ISO 8601. řetězec

Sku

Jméno Popis Hodnota
kapacita Pokud skladová položka podporuje horizontální navýšení/snížení kapacity, měla by být zahrnuta celá čísla kapacity. Pokud není pro prostředek možné horizontální navýšení kapacity nebo jeho snížení kapacity, může se tento parametr vynechat. Int
Rodina Pokud má služba různé generace hardwaru, pro stejnou skladovou položku, můžete ji zde zachytit. řetězec
Jméno Název skladové položky. Ex - P3. Obvykle se jedná o písmeno+číslo. string (povinné)
velikost Velikost skladové položky. Pokud je pole název kombinací vrstvy a jiné hodnoty, jedná se o samostatný kód. řetězec
úroveň Toto pole musí implementovat poskytovatel prostředků, pokud má služba více než jednu úroveň, ale nevyžaduje se u put. "Základní"
"Zdarma"
Premium
"Standardní"

TargetUtilizationScaleSettings

Jméno Popis Hodnota
maxInstances Maximální počet instancí, na které se může nasazení škálovat. Kvóta bude vyhrazena pro max_instances. Int
minInstances Minimální početinstancíchch Int
pollingInterval Interval dotazování ve formátu ISO 8691. Podporuje pouze dobu trvání s přesností v sekundách. řetězec
scaleType [Povinné] Typ algoritmu škálování nasazení Cílové využití (povinné)
targetUtilizationPercentage Cílové využití procesoru pro automatické škálování Int

TrackedResourceTags

Jméno Popis Hodnota

UserAssignedIdentities

Jméno Popis Hodnota

UserAssignedIdentity

Jméno Popis Hodnota

Definice prostředku šablony ARM

Pracovní prostory/ onlineEndpoints/deployments typ prostředku je možné nasadit s operacemi, které cílí:

Seznam změněných vlastností v jednotlivých verzích rozhraní API najdete v protokolu změn.

Formát prostředku

Pokud chcete vytvořit prostředek Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments, přidejte do šablony následující JSON.

{
  "type": "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments",
  "apiVersion": "2023-10-01",
  "name": "string",
  "identity": {
    "type": "string",
    "userAssignedIdentities": {
      "{customized property}": {
      }
    }
  },
  "kind": "string",
  "location": "string",
  "properties": {
    "appInsightsEnabled": "bool",
    "codeConfiguration": {
      "codeId": "string",
      "scoringScript": "string"
    },
    "description": "string",
    "egressPublicNetworkAccess": "string",
    "environmentId": "string",
    "environmentVariables": {
      "{customized property}": "string"
    },
    "instanceType": "string",
    "livenessProbe": {
      "failureThreshold": "int",
      "initialDelay": "string",
      "period": "string",
      "successThreshold": "int",
      "timeout": "string"
    },
    "model": "string",
    "modelMountPath": "string",
    "properties": {
      "{customized property}": "string"
    },
    "readinessProbe": {
      "failureThreshold": "int",
      "initialDelay": "string",
      "period": "string",
      "successThreshold": "int",
      "timeout": "string"
    },
    "requestSettings": {
      "maxConcurrentRequestsPerInstance": "int",
      "maxQueueWait": "string",
      "requestTimeout": "string"
    },
    "scaleSettings": {
      "scaleType": "string"
      // For remaining properties, see OnlineScaleSettings objects
    },
    "endpointComputeType": "string"
    // For remaining properties, see OnlineDeploymentProperties objects
  },
  "sku": {
    "capacity": "int",
    "family": "string",
    "name": "string",
    "size": "string",
    "tier": "string"
  },
  "tags": {
    "{customized property}": "string"
  }
}

Objekty OnlineDeploymentProperties

Nastavte endpointComputeType vlastnost určit typ objektu.

Pro Kubernetes použijte:

{
  "containerResourceRequirements": {
    "containerResourceLimits": {
      "cpu": "string",
      "gpu": "string",
      "memory": "string"
    },
    "containerResourceRequests": {
      "cpu": "string",
      "gpu": "string",
      "memory": "string"
    }
  },
  "endpointComputeType": "Kubernetes"
}

Pro spravovanépoužijte:

{
  "endpointComputeType": "Managed"
}

Objekty OnlineScaleSettings

Nastavte scaleType vlastnost určit typ objektu.

Pro Výchozípoužijte:

{
  "scaleType": "Default"
}

Pro cílové využitípoužijte:

{
  "maxInstances": "int",
  "minInstances": "int",
  "pollingInterval": "string",
  "scaleType": "TargetUtilization",
  "targetUtilizationPercentage": "int"
}

Hodnoty vlastností

CodeConfiguration

Jméno Popis Hodnota
codeId ID prostředku ARM prostředku kódu řetězec
BodováníScriptu [Povinné] Skript, který se má spustit při spuštění. Např. "score.py" řetězec

Omezení:
Minimální délka = 1
Model = [a-zA-Z0-9_] (povinné)

ContainerResourceRequirements

Jméno Popis Hodnota
containerResourceLimits Informace o limitu prostředků kontejneru: ContainerResourceSettings
containerResourceRequests Informace o požadavku na prostředek kontejneru: ContainerResourceSettings

ContainerResourceSettings

Jméno Popis Hodnota
procesor Počet požadavků nebo limitu počtu vCPU pro kontejner Více:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
řetězec
Gpu Počet požadavků nebo omezení karet Nvidia GPU pro kontejner Více:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
řetězec
paměť Požadavek nebo limit velikosti paměti pro kontejner. Více:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
řetězec

DefaultScaleSettings

Jméno Popis Hodnota
scaleType [Povinné] Typ algoritmu škálování nasazení Výchozí (povinné)

EndpointDeploymentPropertiesBaseEnvironmentVariables

Jméno Popis Hodnota

EndpointDeploymentPropertiesBaseProperties

Jméno Popis Hodnota

KubernetesOnlineDeployment

Jméno Popis Hodnota
containerResourceRequirements Požadavky na prostředky pro kontejner (procesor a paměť). ContainerResourceRequirements
endpointComputeType [Povinné] Typ výpočetního objektu koncového bodu. Kubernetes (povinné)

ManagedOnlineDeployment

Jméno Popis Hodnota
endpointComputeType [Povinné] Typ výpočetního objektu koncového bodu. Spravované (povinné)

ManagedServiceIdentity

Jméno Popis Hodnota
typ Typ identity spravované služby (kde jsou povolené typy SystemAssigned i UserAssigned). None (Žádný)
SystemAssigned
SystemAssigned, UserAssigned
UserAssigned (povinné)
userAssignedIdentities Sada identit přiřazených uživatelem přidružená k prostředku. Klíče slovníku userAssignedIdentities budou ID prostředků ARM ve formuláři: /subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. Hodnoty slovníku můžou být prázdné objekty ({}) v požadavcích. userAssignedIdentities

Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments

Jméno Popis Hodnota
apiVersion Verze rozhraní API '2023-10-01'
identita Identita spravované služby (identita přiřazená systémem nebo identita přiřazená uživatelem) ManagedServiceIdentity
laskavý Metadata používaná portálem, nástroji atd. k vykreslení různých prostředí uživatelského rozhraní pro prostředky stejného typu. řetězec
umístění Geografické umístění, ve kterém se nachází zdroj string (povinné)
Jméno Název prostředku řetězec

Omezení:
Model = ^[a-zA-Z0-9][a-zA-Z0-9\-_]{0,254}$ (povinné)
vlastnosti [Povinné] Další atributy entity. OnlineDeploymentProperties (povinné)
sku Podrobnosti skladové položky vyžadované pro kontrakt ARM pro automatické škálování skladové položky
visačky Značky prostředků Slovník názvů a hodnot značek Viz Značky v šablonách
typ Typ prostředku Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments

OnlineDeploymentProperties

Jméno Popis Hodnota
appInsightsEnabled Pokud je pravda, povolí protokolování Application Insights. Bool
CodeConfiguration Konfigurace kódu pro nasazení koncového bodu CodeConfiguration
popis Popis nasazení koncového bodu řetězec
egressPublicNetworkAccess Pokud je tato možnost povolená, povolte přístup k veřejné síti pro výchozí přenos dat. Pokud je zakázáno, vytvoří se zabezpečený výchozí přenos dat. Výchozí: Povoleno. Zakázáno
Povoleno
endpointComputeType Nastavte na Kubernetes pro typ KubernetesOnlineDeployment. U typu ManagedOnlineDeploymentna hodnotu ManagedOnlineDeployment . Kubernetes
Spravované (povinné)
environmentId ID prostředku ARM nebo AssetId specifikace prostředí pro nasazení koncového bodu řetězec
environmentVariables Konfigurace proměnných prostředí pro nasazení EndpointDeploymentPropertiesBaseEnvironmentVariables
instanceType Typ výpočetní instance. řetězec
livenessProbe Sonda aktivity pravidelně monitoruje stav kontejneru. ProbeSettings
model Cesta URI k modelu. řetězec
modelMountPath Cesta k připojení modelu ve vlastním kontejneru. řetězec
vlastnosti Slovník vlastností Vlastnosti lze přidat, ale ne odebrat nebo změnit. endpointDeploymentPropertiesBaseProperties
readinessProbe Sonda připravenosti ověří, jestli je kontejner připravený obsluhovat provoz. Vlastnosti a výchozí hodnoty jsou stejné jako sonda aktivity. ProbeSettings
requestSettings Požádejte o nastavení nasazení. OnlineRequestSettings
scaleSettings Nastavení škálování pro nasazení
Pokud je hodnota null nebo není zadaná,
Výchozí hodnota TargetUtilizationScaleSettings pro KubernetesOnlineDeployment
a do DefaultScaleSettings pro ManagedOnlineDeployment.
OnlineScaleSettings

OnlineRequestSettings

Jméno Popis Hodnota
maxConcurrentRequestsPerInstance Počet maximálních souběžných požadavků na uzel povolený pro každé nasazení. Výchozí hodnota je 1. Int
maxQueueWait (Zastaralé pro spravované online koncové body) Maximální doba, po kterou požadavek zůstane ve frontě ve formátu ISO 8601.
Výchozí hodnota je 500 ms.
(Teď zvyšte request_timeout_ms, aby se zohlednily případné zpoždění sítě nebo fronty.
řetězec
requestTimeout Časový limit bodování ve formátu ISO 8601.
Výchozí hodnota je 5000 ms.
řetězec

OnlineScaleSettings

Jméno Popis Hodnota
scaleType Pro typ DefaultScaleSettingsnastavte na DefaultScaleSettings . Pro typ TargetUtilizationScaleSettings nastavte na TargetUtilizationSettings. Výchozí
Cílové využití (povinné)

ProbeSettings

Jméno Popis Hodnota
failureThreshold Počet chyb, které se mají povolit před vrácením stavu, který není v pořádku. Int
initialDelay Zpoždění před první sondou ve formátu ISO 8601. řetězec
perioda Doba mezi sondami ve formátu ISO 8601. řetězec
successThreshold Počet úspěšných sond před vrácením stavu v pořádku. Int
přerušení zápasu Časový limit sondy ve formátu ISO 8601. řetězec

Sku

Jméno Popis Hodnota
kapacita Pokud skladová položka podporuje horizontální navýšení/snížení kapacity, měla by být zahrnuta celá čísla kapacity. Pokud není pro prostředek možné horizontální navýšení kapacity nebo jeho snížení kapacity, může se tento parametr vynechat. Int
Rodina Pokud má služba různé generace hardwaru, pro stejnou skladovou položku, můžete ji zde zachytit. řetězec
Jméno Název skladové položky. Ex - P3. Obvykle se jedná o písmeno+číslo. string (povinné)
velikost Velikost skladové položky. Pokud je pole název kombinací vrstvy a jiné hodnoty, jedná se o samostatný kód. řetězec
úroveň Toto pole musí implementovat poskytovatel prostředků, pokud má služba více než jednu úroveň, ale nevyžaduje se u put. "Základní"
"Zdarma"
Premium
"Standardní"

TargetUtilizationScaleSettings

Jméno Popis Hodnota
maxInstances Maximální počet instancí, na které se může nasazení škálovat. Kvóta bude vyhrazena pro max_instances. Int
minInstances Minimální početinstancíchch Int
pollingInterval Interval dotazování ve formátu ISO 8691. Podporuje pouze dobu trvání s přesností v sekundách. řetězec
scaleType [Povinné] Typ algoritmu škálování nasazení Cílové využití (povinné)
targetUtilizationPercentage Cílové využití procesoru pro automatické škálování Int

TrackedResourceTags

Jméno Popis Hodnota

UserAssignedIdentities

Jméno Popis Hodnota

UserAssignedIdentity

Jméno Popis Hodnota

Definice prostředku Terraformu (poskytovatel AzAPI)

Pracovní prostory/ onlineEndpoints/deployments typ prostředku je možné nasadit s operacemi, které cílí:

  • skupiny prostředků

Seznam změněných vlastností v jednotlivých verzích rozhraní API najdete v protokolu změn.

Formát prostředku

Pokud chcete vytvořit prostředek Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments, přidejte do šablony následující Terraform.

resource "azapi_resource" "symbolicname" {
  type = "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2023-10-01"
  name = "string"
  identity = {
    type = "string"
    userAssignedIdentities = {
      {customized property} = {
      }
    }
  }
  kind = "string"
  location = "string"
  sku = {
    capacity = int
    family = "string"
    name = "string"
    size = "string"
    tier = "string"
  }
  tags = {
    {customized property} = "string"
  }
  body = jsonencode({
    properties = {
      appInsightsEnabled = bool
      codeConfiguration = {
        codeId = "string"
        scoringScript = "string"
      }
      description = "string"
      egressPublicNetworkAccess = "string"
      environmentId = "string"
      environmentVariables = {
        {customized property} = "string"
      }
      instanceType = "string"
      livenessProbe = {
        failureThreshold = int
        initialDelay = "string"
        period = "string"
        successThreshold = int
        timeout = "string"
      }
      model = "string"
      modelMountPath = "string"
      properties = {
        {customized property} = "string"
      }
      readinessProbe = {
        failureThreshold = int
        initialDelay = "string"
        period = "string"
        successThreshold = int
        timeout = "string"
      }
      requestSettings = {
        maxConcurrentRequestsPerInstance = int
        maxQueueWait = "string"
        requestTimeout = "string"
      }
      scaleSettings = {
        scaleType = "string"
        // For remaining properties, see OnlineScaleSettings objects
      }
      endpointComputeType = "string"
      // For remaining properties, see OnlineDeploymentProperties objects
    }
  })
}

Objekty OnlineDeploymentProperties

Nastavte endpointComputeType vlastnost určit typ objektu.

Pro Kubernetes použijte:

{
  containerResourceRequirements = {
    containerResourceLimits = {
      cpu = "string"
      gpu = "string"
      memory = "string"
    }
    containerResourceRequests = {
      cpu = "string"
      gpu = "string"
      memory = "string"
    }
  }
  endpointComputeType = "Kubernetes"
}

Pro spravovanépoužijte:

{
  endpointComputeType = "Managed"
}

Objekty OnlineScaleSettings

Nastavte scaleType vlastnost určit typ objektu.

Pro Výchozípoužijte:

{
  scaleType = "Default"
}

Pro cílové využitípoužijte:

{
  maxInstances = int
  minInstances = int
  pollingInterval = "string"
  scaleType = "TargetUtilization"
  targetUtilizationPercentage = int
}

Hodnoty vlastností

CodeConfiguration

Jméno Popis Hodnota
codeId ID prostředku ARM prostředku kódu řetězec
BodováníScriptu [Povinné] Skript, který se má spustit při spuštění. Např. "score.py" řetězec

Omezení:
Minimální délka = 1
Model = [a-zA-Z0-9_] (povinné)

ContainerResourceRequirements

Jméno Popis Hodnota
containerResourceLimits Informace o limitu prostředků kontejneru: ContainerResourceSettings
containerResourceRequests Informace o požadavku na prostředek kontejneru: ContainerResourceSettings

ContainerResourceSettings

Jméno Popis Hodnota
procesor Počet požadavků nebo limitu počtu vCPU pro kontejner Více:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
řetězec
Gpu Počet požadavků nebo omezení karet Nvidia GPU pro kontejner Více:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
řetězec
paměť Požadavek nebo limit velikosti paměti pro kontejner. Více:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
řetězec

DefaultScaleSettings

Jméno Popis Hodnota
scaleType [Povinné] Typ algoritmu škálování nasazení Výchozí (povinné)

EndpointDeploymentPropertiesBaseEnvironmentVariables

Jméno Popis Hodnota

EndpointDeploymentPropertiesBaseProperties

Jméno Popis Hodnota

KubernetesOnlineDeployment

Jméno Popis Hodnota
containerResourceRequirements Požadavky na prostředky pro kontejner (procesor a paměť). ContainerResourceRequirements
endpointComputeType [Povinné] Typ výpočetního objektu koncového bodu. Kubernetes (povinné)

ManagedOnlineDeployment

Jméno Popis Hodnota
endpointComputeType [Povinné] Typ výpočetního objektu koncového bodu. Spravované (povinné)

ManagedServiceIdentity

Jméno Popis Hodnota
typ Typ identity spravované služby (kde jsou povolené typy SystemAssigned i UserAssigned). None (Žádný)
SystemAssigned
SystemAssigned, UserAssigned
UserAssigned (povinné)
userAssignedIdentities Sada identit přiřazených uživatelem přidružená k prostředku. Klíče slovníku userAssignedIdentities budou ID prostředků ARM ve formuláři: /subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. Hodnoty slovníku můžou být prázdné objekty ({}) v požadavcích. userAssignedIdentities

Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments

Jméno Popis Hodnota
identita Identita spravované služby (identita přiřazená systémem nebo identita přiřazená uživatelem) ManagedServiceIdentity
laskavý Metadata používaná portálem, nástroji atd. k vykreslení různých prostředí uživatelského rozhraní pro prostředky stejného typu. řetězec
umístění Geografické umístění, ve kterém se nachází zdroj string (povinné)
Jméno Název prostředku řetězec

Omezení:
Model = ^[a-zA-Z0-9][a-zA-Z0-9\-_]{0,254}$ (povinné)
parent_id ID prostředku, který je nadřazený pro tento prostředek. ID prostředku typu: pracovních prostorů/onlineEndpoints
vlastnosti [Povinné] Další atributy entity. OnlineDeploymentProperties (povinné)
sku Podrobnosti skladové položky vyžadované pro kontrakt ARM pro automatické škálování skladové položky
visačky Značky prostředků Slovník názvů a hodnot značek
typ Typ prostředku Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2023-10-01"

OnlineDeploymentProperties

Jméno Popis Hodnota
appInsightsEnabled Pokud je pravda, povolí protokolování Application Insights. Bool
CodeConfiguration Konfigurace kódu pro nasazení koncového bodu CodeConfiguration
popis Popis nasazení koncového bodu řetězec
egressPublicNetworkAccess Pokud je tato možnost povolená, povolte přístup k veřejné síti pro výchozí přenos dat. Pokud je zakázáno, vytvoří se zabezpečený výchozí přenos dat. Výchozí: Povoleno. Zakázáno
Povoleno
endpointComputeType Nastavte na Kubernetes pro typ KubernetesOnlineDeployment. U typu ManagedOnlineDeploymentna hodnotu ManagedOnlineDeployment . Kubernetes
Spravované (povinné)
environmentId ID prostředku ARM nebo AssetId specifikace prostředí pro nasazení koncového bodu řetězec
environmentVariables Konfigurace proměnných prostředí pro nasazení EndpointDeploymentPropertiesBaseEnvironmentVariables
instanceType Typ výpočetní instance. řetězec
livenessProbe Sonda aktivity pravidelně monitoruje stav kontejneru. ProbeSettings
model Cesta URI k modelu. řetězec
modelMountPath Cesta k připojení modelu ve vlastním kontejneru. řetězec
vlastnosti Slovník vlastností Vlastnosti lze přidat, ale ne odebrat nebo změnit. endpointDeploymentPropertiesBaseProperties
readinessProbe Sonda připravenosti ověří, jestli je kontejner připravený obsluhovat provoz. Vlastnosti a výchozí hodnoty jsou stejné jako sonda aktivity. ProbeSettings
requestSettings Požádejte o nastavení nasazení. OnlineRequestSettings
scaleSettings Nastavení škálování pro nasazení
Pokud je hodnota null nebo není zadaná,
Výchozí hodnota TargetUtilizationScaleSettings pro KubernetesOnlineDeployment
a do DefaultScaleSettings pro ManagedOnlineDeployment.
OnlineScaleSettings

OnlineRequestSettings

Jméno Popis Hodnota
maxConcurrentRequestsPerInstance Počet maximálních souběžných požadavků na uzel povolený pro každé nasazení. Výchozí hodnota je 1. Int
maxQueueWait (Zastaralé pro spravované online koncové body) Maximální doba, po kterou požadavek zůstane ve frontě ve formátu ISO 8601.
Výchozí hodnota je 500 ms.
(Teď zvyšte request_timeout_ms, aby se zohlednily případné zpoždění sítě nebo fronty.
řetězec
requestTimeout Časový limit bodování ve formátu ISO 8601.
Výchozí hodnota je 5000 ms.
řetězec

OnlineScaleSettings

Jméno Popis Hodnota
scaleType Pro typ DefaultScaleSettingsnastavte na DefaultScaleSettings . Pro typ TargetUtilizationScaleSettings nastavte na TargetUtilizationSettings. Výchozí
Cílové využití (povinné)

ProbeSettings

Jméno Popis Hodnota
failureThreshold Počet chyb, které se mají povolit před vrácením stavu, který není v pořádku. Int
initialDelay Zpoždění před první sondou ve formátu ISO 8601. řetězec
perioda Doba mezi sondami ve formátu ISO 8601. řetězec
successThreshold Počet úspěšných sond před vrácením stavu v pořádku. Int
přerušení zápasu Časový limit sondy ve formátu ISO 8601. řetězec

Sku

Jméno Popis Hodnota
kapacita Pokud skladová položka podporuje horizontální navýšení/snížení kapacity, měla by být zahrnuta celá čísla kapacity. Pokud není pro prostředek možné horizontální navýšení kapacity nebo jeho snížení kapacity, může se tento parametr vynechat. Int
Rodina Pokud má služba různé generace hardwaru, pro stejnou skladovou položku, můžete ji zde zachytit. řetězec
Jméno Název skladové položky. Ex - P3. Obvykle se jedná o písmeno+číslo. string (povinné)
velikost Velikost skladové položky. Pokud je pole název kombinací vrstvy a jiné hodnoty, jedná se o samostatný kód. řetězec
úroveň Toto pole musí implementovat poskytovatel prostředků, pokud má služba více než jednu úroveň, ale nevyžaduje se u put. "Základní"
"Zdarma"
Premium
"Standardní"

TargetUtilizationScaleSettings

Jméno Popis Hodnota
maxInstances Maximální počet instancí, na které se může nasazení škálovat. Kvóta bude vyhrazena pro max_instances. Int
minInstances Minimální početinstancíchch Int
pollingInterval Interval dotazování ve formátu ISO 8691. Podporuje pouze dobu trvání s přesností v sekundách. řetězec
scaleType [Povinné] Typ algoritmu škálování nasazení Cílové využití (povinné)
targetUtilizationPercentage Cílové využití procesoru pro automatické škálování Int

TrackedResourceTags

Jméno Popis Hodnota

UserAssignedIdentities

Jméno Popis Hodnota

UserAssignedIdentity

Jméno Popis Hodnota