Pracovní prostory Microsoft.MachineLearningServices/ onlineEndpoints/deployments 2023-10-01
- nejnovější
- 10. 10. 2024
- z 10. 10. 2024 ve verzi Preview
-
2024-07-01-preview -
2024-04-04 -
2024-04-01-preview - 1. 1. 2024 ve verzi Preview
- 10. 10. 2023
-
2023-08-01-preview -
2023-06-01-preview -
2023-04-04 -
2023-04-01-Preview -
2023-023-01-preview -
12. 12. 2022 ve verzi Preview - 10. 10. 2022
-
10. 10. 2022 ve verzi Preview -
2022-06-01-preview - 05. 5. 2022
-
2022-022-01-preview -
2021-03-01-preview
Definice prostředku Bicep
Pracovní prostory/ onlineEndpoints/deployments typ prostředku je možné nasadit s operacemi, které cílí:
- skupiny prostředků – viz příkazy nasazení skupiny prostředků
Seznam změněných vlastností v jednotlivých verzích rozhraní API najdete v protokolu změn.
Formát prostředku
Pokud chcete vytvořit prostředek Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments, přidejte do šablony následující bicep.
resource symbolicname 'Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2023-10-01' = {
parent: resourceSymbolicName
identity: {
type: 'string'
userAssignedIdentities: {
{customized property}: {}
}
}
kind: 'string'
location: 'string'
name: 'string'
properties: {
appInsightsEnabled: bool
codeConfiguration: {
codeId: 'string'
scoringScript: 'string'
}
description: 'string'
egressPublicNetworkAccess: 'string'
environmentId: 'string'
environmentVariables: {
{customized property}: 'string'
}
instanceType: 'string'
livenessProbe: {
failureThreshold: int
initialDelay: 'string'
period: 'string'
successThreshold: int
timeout: 'string'
}
model: 'string'
modelMountPath: 'string'
properties: {
{customized property}: 'string'
}
readinessProbe: {
failureThreshold: int
initialDelay: 'string'
period: 'string'
successThreshold: int
timeout: 'string'
}
requestSettings: {
maxConcurrentRequestsPerInstance: int
maxQueueWait: 'string'
requestTimeout: 'string'
}
scaleSettings: {
scaleType: 'string'
// For remaining properties, see OnlineScaleSettings objects
}
endpointComputeType: 'string'
// For remaining properties, see OnlineDeploymentProperties objects
}
sku: {
capacity: int
family: 'string'
name: 'string'
size: 'string'
tier: 'string'
}
tags: {
{customized property}: 'string'
}
}
Objekty OnlineDeploymentProperties
Nastavte endpointComputeType vlastnost určit typ objektu.
Pro Kubernetes použijte:
{
containerResourceRequirements: {
containerResourceLimits: {
cpu: 'string'
gpu: 'string'
memory: 'string'
}
containerResourceRequests: {
cpu: 'string'
gpu: 'string'
memory: 'string'
}
}
endpointComputeType: 'Kubernetes'
}
Pro spravovanépoužijte:
{
endpointComputeType: 'Managed'
}
Objekty OnlineScaleSettings
Nastavte scaleType vlastnost určit typ objektu.
Pro Výchozípoužijte:
{
scaleType: 'Default'
}
Pro cílové využitípoužijte:
{
maxInstances: int
minInstances: int
pollingInterval: 'string'
scaleType: 'TargetUtilization'
targetUtilizationPercentage: int
}
Hodnoty vlastností
CodeConfiguration
Jméno | Popis | Hodnota |
---|---|---|
codeId | ID prostředku ARM prostředku kódu | řetězec |
BodováníScriptu | [Povinné] Skript, který se má spustit při spuštění. Např. "score.py" | řetězec Omezení: Minimální délka = 1 Model = [a-zA-Z0-9_] (povinné) |
ContainerResourceRequirements
Jméno | Popis | Hodnota |
---|---|---|
containerResourceLimits | Informace o limitu prostředků kontejneru: | ContainerResourceSettings |
containerResourceRequests | Informace o požadavku na prostředek kontejneru: | ContainerResourceSettings |
ContainerResourceSettings
Jméno | Popis | Hodnota |
---|---|---|
procesor | Počet požadavků nebo limitu počtu vCPU pro kontejner Více: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
řetězec |
Gpu | Počet požadavků nebo omezení karet Nvidia GPU pro kontejner Více: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
řetězec |
paměť | Požadavek nebo limit velikosti paměti pro kontejner. Více: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
řetězec |
DefaultScaleSettings
Jméno | Popis | Hodnota |
---|---|---|
scaleType | [Povinné] Typ algoritmu škálování nasazení | Výchozí (povinné) |
EndpointDeploymentPropertiesBaseEnvironmentVariables
Jméno | Popis | Hodnota |
---|
EndpointDeploymentPropertiesBaseProperties
Jméno | Popis | Hodnota |
---|
KubernetesOnlineDeployment
Jméno | Popis | Hodnota |
---|---|---|
containerResourceRequirements | Požadavky na prostředky pro kontejner (procesor a paměť). | ContainerResourceRequirements |
endpointComputeType | [Povinné] Typ výpočetního objektu koncového bodu. | Kubernetes (povinné) |
ManagedOnlineDeployment
Jméno | Popis | Hodnota |
---|---|---|
endpointComputeType | [Povinné] Typ výpočetního objektu koncového bodu. | Spravované (povinné) |
ManagedServiceIdentity
Jméno | Popis | Hodnota |
---|---|---|
typ | Typ identity spravované služby (kde jsou povolené typy SystemAssigned i UserAssigned). | None (Žádný) SystemAssigned SystemAssigned, UserAssigned UserAssigned (povinné) |
userAssignedIdentities | Sada identit přiřazených uživatelem přidružená k prostředku. Klíče slovníku userAssignedIdentities budou ID prostředků ARM ve formuláři: /subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. Hodnoty slovníku můžou být prázdné objekty ({}) v požadavcích. | userAssignedIdentities |
Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments
Jméno | Popis | Hodnota |
---|---|---|
identita | Identita spravované služby (identita přiřazená systémem nebo identita přiřazená uživatelem) | |
laskavý | Metadata používaná portálem, nástroji atd. k vykreslení různých prostředí uživatelského rozhraní pro prostředky stejného typu. | řetězec |
umístění | Geografické umístění, ve kterém se nachází zdroj | string (povinné) |
Jméno | Název prostředku | řetězec Omezení: Model = ^[a-zA-Z0-9][a-zA-Z0-9\-_]{0,254}$ (povinné) |
rodič | V bicep můžete zadat nadřazený prostředek pro podřízený prostředek. Tuto vlastnost je potřeba přidat pouze v případě, že je podřízený prostředek deklarován mimo nadřazený prostředek. Další informace najdete v tématu Podřízený prostředek mimo nadřazený prostředek. |
Symbolický název prostředku typu: pracovních prostorů/onlineEndpoints |
vlastnosti | [Povinné] Další atributy entity. | OnlineDeploymentProperties (povinné) |
sku | Podrobnosti skladové položky vyžadované pro kontrakt ARM pro automatické škálování | skladové položky |
visačky | Značky prostředků | Slovník názvů a hodnot značek Viz Značky v šablonách |
OnlineDeploymentProperties
Jméno | Popis | Hodnota |
---|---|---|
appInsightsEnabled | Pokud je pravda, povolí protokolování Application Insights. | Bool |
CodeConfiguration | Konfigurace kódu pro nasazení koncového bodu | CodeConfiguration |
popis | Popis nasazení koncového bodu | řetězec |
egressPublicNetworkAccess | Pokud je tato možnost povolená, povolte přístup k veřejné síti pro výchozí přenos dat. Pokud je zakázáno, vytvoří se zabezpečený výchozí přenos dat. Výchozí: Povoleno. | Zakázáno Povoleno |
endpointComputeType | Nastavte na Kubernetes pro typ KubernetesOnlineDeployment. U typu ManagedOnlineDeploymentna hodnotu ManagedOnlineDeployment . | Kubernetes Spravované (povinné) |
environmentId | ID prostředku ARM nebo AssetId specifikace prostředí pro nasazení koncového bodu | řetězec |
environmentVariables | Konfigurace proměnných prostředí pro nasazení | EndpointDeploymentPropertiesBaseEnvironmentVariables |
instanceType | Typ výpočetní instance. | řetězec |
livenessProbe | Sonda aktivity pravidelně monitoruje stav kontejneru. | ProbeSettings |
model | Cesta URI k modelu. | řetězec |
modelMountPath | Cesta k připojení modelu ve vlastním kontejneru. | řetězec |
vlastnosti | Slovník vlastností Vlastnosti lze přidat, ale ne odebrat nebo změnit. | endpointDeploymentPropertiesBaseProperties |
readinessProbe | Sonda připravenosti ověří, jestli je kontejner připravený obsluhovat provoz. Vlastnosti a výchozí hodnoty jsou stejné jako sonda aktivity. | ProbeSettings |
requestSettings | Požádejte o nastavení nasazení. | |
scaleSettings | Nastavení škálování pro nasazení Pokud je hodnota null nebo není zadaná, Výchozí hodnota TargetUtilizationScaleSettings pro KubernetesOnlineDeployment a do DefaultScaleSettings pro ManagedOnlineDeployment. |
|
OnlineRequestSettings
Jméno | Popis | Hodnota |
---|---|---|
maxConcurrentRequestsPerInstance | Počet maximálních souběžných požadavků na uzel povolený pro každé nasazení. Výchozí hodnota je 1. | Int |
maxQueueWait | (Zastaralé pro spravované online koncové body) Maximální doba, po kterou požadavek zůstane ve frontě ve formátu ISO 8601. Výchozí hodnota je 500 ms. (Teď zvyšte request_timeout_ms , aby se zohlednily případné zpoždění sítě nebo fronty. |
řetězec |
requestTimeout | Časový limit bodování ve formátu ISO 8601. Výchozí hodnota je 5000 ms. |
řetězec |
OnlineScaleSettings
Jméno | Popis | Hodnota |
---|---|---|
scaleType | Pro typ DefaultScaleSettingsnastavte na DefaultScaleSettings . Pro typ TargetUtilizationScaleSettings nastavte na TargetUtilizationSettings. | Výchozí Cílové využití (povinné) |
ProbeSettings
Jméno | Popis | Hodnota |
---|---|---|
failureThreshold | Počet chyb, které se mají povolit před vrácením stavu, který není v pořádku. | Int |
initialDelay | Zpoždění před první sondou ve formátu ISO 8601. | řetězec |
perioda | Doba mezi sondami ve formátu ISO 8601. | řetězec |
successThreshold | Počet úspěšných sond před vrácením stavu v pořádku. | Int |
přerušení zápasu | Časový limit sondy ve formátu ISO 8601. | řetězec |
Sku
Jméno | Popis | Hodnota |
---|---|---|
kapacita | Pokud skladová položka podporuje horizontální navýšení/snížení kapacity, měla by být zahrnuta celá čísla kapacity. Pokud není pro prostředek možné horizontální navýšení kapacity nebo jeho snížení kapacity, může se tento parametr vynechat. | Int |
Rodina | Pokud má služba různé generace hardwaru, pro stejnou skladovou položku, můžete ji zde zachytit. | řetězec |
Jméno | Název skladové položky. Ex - P3. Obvykle se jedná o písmeno+číslo. | string (povinné) |
velikost | Velikost skladové položky. Pokud je pole název kombinací vrstvy a jiné hodnoty, jedná se o samostatný kód. | řetězec |
úroveň | Toto pole musí implementovat poskytovatel prostředků, pokud má služba více než jednu úroveň, ale nevyžaduje se u put. | "Základní" "Zdarma" Premium "Standardní" |
TargetUtilizationScaleSettings
Jméno | Popis | Hodnota |
---|---|---|
maxInstances | Maximální počet instancí, na které se může nasazení škálovat. Kvóta bude vyhrazena pro max_instances. | Int |
minInstances | Minimální početinstancíchch | Int |
pollingInterval | Interval dotazování ve formátu ISO 8691. Podporuje pouze dobu trvání s přesností v sekundách. | řetězec |
scaleType | [Povinné] Typ algoritmu škálování nasazení | Cílové využití (povinné) |
targetUtilizationPercentage | Cílové využití procesoru pro automatické škálování | Int |
TrackedResourceTags
Jméno | Popis | Hodnota |
---|
UserAssignedIdentities
Jméno | Popis | Hodnota |
---|
UserAssignedIdentity
Jméno | Popis | Hodnota |
---|
Definice prostředku šablony ARM
Pracovní prostory/ onlineEndpoints/deployments typ prostředku je možné nasadit s operacemi, které cílí:
- skupiny prostředků – viz příkazy nasazení skupiny prostředků
Seznam změněných vlastností v jednotlivých verzích rozhraní API najdete v protokolu změn.
Formát prostředku
Pokud chcete vytvořit prostředek Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments, přidejte do šablony následující JSON.
{
"type": "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments",
"apiVersion": "2023-10-01",
"name": "string",
"identity": {
"type": "string",
"userAssignedIdentities": {
"{customized property}": {
}
}
},
"kind": "string",
"location": "string",
"properties": {
"appInsightsEnabled": "bool",
"codeConfiguration": {
"codeId": "string",
"scoringScript": "string"
},
"description": "string",
"egressPublicNetworkAccess": "string",
"environmentId": "string",
"environmentVariables": {
"{customized property}": "string"
},
"instanceType": "string",
"livenessProbe": {
"failureThreshold": "int",
"initialDelay": "string",
"period": "string",
"successThreshold": "int",
"timeout": "string"
},
"model": "string",
"modelMountPath": "string",
"properties": {
"{customized property}": "string"
},
"readinessProbe": {
"failureThreshold": "int",
"initialDelay": "string",
"period": "string",
"successThreshold": "int",
"timeout": "string"
},
"requestSettings": {
"maxConcurrentRequestsPerInstance": "int",
"maxQueueWait": "string",
"requestTimeout": "string"
},
"scaleSettings": {
"scaleType": "string"
// For remaining properties, see OnlineScaleSettings objects
},
"endpointComputeType": "string"
// For remaining properties, see OnlineDeploymentProperties objects
},
"sku": {
"capacity": "int",
"family": "string",
"name": "string",
"size": "string",
"tier": "string"
},
"tags": {
"{customized property}": "string"
}
}
Objekty OnlineDeploymentProperties
Nastavte endpointComputeType vlastnost určit typ objektu.
Pro Kubernetes použijte:
{
"containerResourceRequirements": {
"containerResourceLimits": {
"cpu": "string",
"gpu": "string",
"memory": "string"
},
"containerResourceRequests": {
"cpu": "string",
"gpu": "string",
"memory": "string"
}
},
"endpointComputeType": "Kubernetes"
}
Pro spravovanépoužijte:
{
"endpointComputeType": "Managed"
}
Objekty OnlineScaleSettings
Nastavte scaleType vlastnost určit typ objektu.
Pro Výchozípoužijte:
{
"scaleType": "Default"
}
Pro cílové využitípoužijte:
{
"maxInstances": "int",
"minInstances": "int",
"pollingInterval": "string",
"scaleType": "TargetUtilization",
"targetUtilizationPercentage": "int"
}
Hodnoty vlastností
CodeConfiguration
Jméno | Popis | Hodnota |
---|---|---|
codeId | ID prostředku ARM prostředku kódu | řetězec |
BodováníScriptu | [Povinné] Skript, který se má spustit při spuštění. Např. "score.py" | řetězec Omezení: Minimální délka = 1 Model = [a-zA-Z0-9_] (povinné) |
ContainerResourceRequirements
Jméno | Popis | Hodnota |
---|---|---|
containerResourceLimits | Informace o limitu prostředků kontejneru: | ContainerResourceSettings |
containerResourceRequests | Informace o požadavku na prostředek kontejneru: | ContainerResourceSettings |
ContainerResourceSettings
Jméno | Popis | Hodnota |
---|---|---|
procesor | Počet požadavků nebo limitu počtu vCPU pro kontejner Více: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
řetězec |
Gpu | Počet požadavků nebo omezení karet Nvidia GPU pro kontejner Více: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
řetězec |
paměť | Požadavek nebo limit velikosti paměti pro kontejner. Více: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
řetězec |
DefaultScaleSettings
Jméno | Popis | Hodnota |
---|---|---|
scaleType | [Povinné] Typ algoritmu škálování nasazení | Výchozí (povinné) |
EndpointDeploymentPropertiesBaseEnvironmentVariables
Jméno | Popis | Hodnota |
---|
EndpointDeploymentPropertiesBaseProperties
Jméno | Popis | Hodnota |
---|
KubernetesOnlineDeployment
Jméno | Popis | Hodnota |
---|---|---|
containerResourceRequirements | Požadavky na prostředky pro kontejner (procesor a paměť). | ContainerResourceRequirements |
endpointComputeType | [Povinné] Typ výpočetního objektu koncového bodu. | Kubernetes (povinné) |
ManagedOnlineDeployment
Jméno | Popis | Hodnota |
---|---|---|
endpointComputeType | [Povinné] Typ výpočetního objektu koncového bodu. | Spravované (povinné) |
ManagedServiceIdentity
Jméno | Popis | Hodnota |
---|---|---|
typ | Typ identity spravované služby (kde jsou povolené typy SystemAssigned i UserAssigned). | None (Žádný) SystemAssigned SystemAssigned, UserAssigned UserAssigned (povinné) |
userAssignedIdentities | Sada identit přiřazených uživatelem přidružená k prostředku. Klíče slovníku userAssignedIdentities budou ID prostředků ARM ve formuláři: /subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. Hodnoty slovníku můžou být prázdné objekty ({}) v požadavcích. | userAssignedIdentities |
Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments
Jméno | Popis | Hodnota |
---|---|---|
apiVersion | Verze rozhraní API | '2023-10-01' |
identita | Identita spravované služby (identita přiřazená systémem nebo identita přiřazená uživatelem) | |
laskavý | Metadata používaná portálem, nástroji atd. k vykreslení různých prostředí uživatelského rozhraní pro prostředky stejného typu. | řetězec |
umístění | Geografické umístění, ve kterém se nachází zdroj | string (povinné) |
Jméno | Název prostředku | řetězec Omezení: Model = ^[a-zA-Z0-9][a-zA-Z0-9\-_]{0,254}$ (povinné) |
vlastnosti | [Povinné] Další atributy entity. | OnlineDeploymentProperties (povinné) |
sku | Podrobnosti skladové položky vyžadované pro kontrakt ARM pro automatické škálování | skladové položky |
visačky | Značky prostředků | Slovník názvů a hodnot značek Viz Značky v šablonách |
typ | Typ prostředku | Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments |
OnlineDeploymentProperties
Jméno | Popis | Hodnota |
---|---|---|
appInsightsEnabled | Pokud je pravda, povolí protokolování Application Insights. | Bool |
CodeConfiguration | Konfigurace kódu pro nasazení koncového bodu | CodeConfiguration |
popis | Popis nasazení koncového bodu | řetězec |
egressPublicNetworkAccess | Pokud je tato možnost povolená, povolte přístup k veřejné síti pro výchozí přenos dat. Pokud je zakázáno, vytvoří se zabezpečený výchozí přenos dat. Výchozí: Povoleno. | Zakázáno Povoleno |
endpointComputeType | Nastavte na Kubernetes pro typ KubernetesOnlineDeployment. U typu ManagedOnlineDeploymentna hodnotu ManagedOnlineDeployment . | Kubernetes Spravované (povinné) |
environmentId | ID prostředku ARM nebo AssetId specifikace prostředí pro nasazení koncového bodu | řetězec |
environmentVariables | Konfigurace proměnných prostředí pro nasazení | EndpointDeploymentPropertiesBaseEnvironmentVariables |
instanceType | Typ výpočetní instance. | řetězec |
livenessProbe | Sonda aktivity pravidelně monitoruje stav kontejneru. | ProbeSettings |
model | Cesta URI k modelu. | řetězec |
modelMountPath | Cesta k připojení modelu ve vlastním kontejneru. | řetězec |
vlastnosti | Slovník vlastností Vlastnosti lze přidat, ale ne odebrat nebo změnit. | endpointDeploymentPropertiesBaseProperties |
readinessProbe | Sonda připravenosti ověří, jestli je kontejner připravený obsluhovat provoz. Vlastnosti a výchozí hodnoty jsou stejné jako sonda aktivity. | ProbeSettings |
requestSettings | Požádejte o nastavení nasazení. | |
scaleSettings | Nastavení škálování pro nasazení Pokud je hodnota null nebo není zadaná, Výchozí hodnota TargetUtilizationScaleSettings pro KubernetesOnlineDeployment a do DefaultScaleSettings pro ManagedOnlineDeployment. |
|
OnlineRequestSettings
Jméno | Popis | Hodnota |
---|---|---|
maxConcurrentRequestsPerInstance | Počet maximálních souběžných požadavků na uzel povolený pro každé nasazení. Výchozí hodnota je 1. | Int |
maxQueueWait | (Zastaralé pro spravované online koncové body) Maximální doba, po kterou požadavek zůstane ve frontě ve formátu ISO 8601. Výchozí hodnota je 500 ms. (Teď zvyšte request_timeout_ms , aby se zohlednily případné zpoždění sítě nebo fronty. |
řetězec |
requestTimeout | Časový limit bodování ve formátu ISO 8601. Výchozí hodnota je 5000 ms. |
řetězec |
OnlineScaleSettings
Jméno | Popis | Hodnota |
---|---|---|
scaleType | Pro typ DefaultScaleSettingsnastavte na DefaultScaleSettings . Pro typ TargetUtilizationScaleSettings nastavte na TargetUtilizationSettings. | Výchozí Cílové využití (povinné) |
ProbeSettings
Jméno | Popis | Hodnota |
---|---|---|
failureThreshold | Počet chyb, které se mají povolit před vrácením stavu, který není v pořádku. | Int |
initialDelay | Zpoždění před první sondou ve formátu ISO 8601. | řetězec |
perioda | Doba mezi sondami ve formátu ISO 8601. | řetězec |
successThreshold | Počet úspěšných sond před vrácením stavu v pořádku. | Int |
přerušení zápasu | Časový limit sondy ve formátu ISO 8601. | řetězec |
Sku
Jméno | Popis | Hodnota |
---|---|---|
kapacita | Pokud skladová položka podporuje horizontální navýšení/snížení kapacity, měla by být zahrnuta celá čísla kapacity. Pokud není pro prostředek možné horizontální navýšení kapacity nebo jeho snížení kapacity, může se tento parametr vynechat. | Int |
Rodina | Pokud má služba různé generace hardwaru, pro stejnou skladovou položku, můžete ji zde zachytit. | řetězec |
Jméno | Název skladové položky. Ex - P3. Obvykle se jedná o písmeno+číslo. | string (povinné) |
velikost | Velikost skladové položky. Pokud je pole název kombinací vrstvy a jiné hodnoty, jedná se o samostatný kód. | řetězec |
úroveň | Toto pole musí implementovat poskytovatel prostředků, pokud má služba více než jednu úroveň, ale nevyžaduje se u put. | "Základní" "Zdarma" Premium "Standardní" |
TargetUtilizationScaleSettings
Jméno | Popis | Hodnota |
---|---|---|
maxInstances | Maximální počet instancí, na které se může nasazení škálovat. Kvóta bude vyhrazena pro max_instances. | Int |
minInstances | Minimální početinstancíchch | Int |
pollingInterval | Interval dotazování ve formátu ISO 8691. Podporuje pouze dobu trvání s přesností v sekundách. | řetězec |
scaleType | [Povinné] Typ algoritmu škálování nasazení | Cílové využití (povinné) |
targetUtilizationPercentage | Cílové využití procesoru pro automatické škálování | Int |
TrackedResourceTags
Jméno | Popis | Hodnota |
---|
UserAssignedIdentities
Jméno | Popis | Hodnota |
---|
UserAssignedIdentity
Jméno | Popis | Hodnota |
---|
Definice prostředku Terraformu (poskytovatel AzAPI)
Pracovní prostory/ onlineEndpoints/deployments typ prostředku je možné nasadit s operacemi, které cílí:
- skupiny prostředků
Seznam změněných vlastností v jednotlivých verzích rozhraní API najdete v protokolu změn.
Formát prostředku
Pokud chcete vytvořit prostředek Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments, přidejte do šablony následující Terraform.
resource "azapi_resource" "symbolicname" {
type = "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2023-10-01"
name = "string"
identity = {
type = "string"
userAssignedIdentities = {
{customized property} = {
}
}
}
kind = "string"
location = "string"
sku = {
capacity = int
family = "string"
name = "string"
size = "string"
tier = "string"
}
tags = {
{customized property} = "string"
}
body = jsonencode({
properties = {
appInsightsEnabled = bool
codeConfiguration = {
codeId = "string"
scoringScript = "string"
}
description = "string"
egressPublicNetworkAccess = "string"
environmentId = "string"
environmentVariables = {
{customized property} = "string"
}
instanceType = "string"
livenessProbe = {
failureThreshold = int
initialDelay = "string"
period = "string"
successThreshold = int
timeout = "string"
}
model = "string"
modelMountPath = "string"
properties = {
{customized property} = "string"
}
readinessProbe = {
failureThreshold = int
initialDelay = "string"
period = "string"
successThreshold = int
timeout = "string"
}
requestSettings = {
maxConcurrentRequestsPerInstance = int
maxQueueWait = "string"
requestTimeout = "string"
}
scaleSettings = {
scaleType = "string"
// For remaining properties, see OnlineScaleSettings objects
}
endpointComputeType = "string"
// For remaining properties, see OnlineDeploymentProperties objects
}
})
}
Objekty OnlineDeploymentProperties
Nastavte endpointComputeType vlastnost určit typ objektu.
Pro Kubernetes použijte:
{
containerResourceRequirements = {
containerResourceLimits = {
cpu = "string"
gpu = "string"
memory = "string"
}
containerResourceRequests = {
cpu = "string"
gpu = "string"
memory = "string"
}
}
endpointComputeType = "Kubernetes"
}
Pro spravovanépoužijte:
{
endpointComputeType = "Managed"
}
Objekty OnlineScaleSettings
Nastavte scaleType vlastnost určit typ objektu.
Pro Výchozípoužijte:
{
scaleType = "Default"
}
Pro cílové využitípoužijte:
{
maxInstances = int
minInstances = int
pollingInterval = "string"
scaleType = "TargetUtilization"
targetUtilizationPercentage = int
}
Hodnoty vlastností
CodeConfiguration
Jméno | Popis | Hodnota |
---|---|---|
codeId | ID prostředku ARM prostředku kódu | řetězec |
BodováníScriptu | [Povinné] Skript, který se má spustit při spuštění. Např. "score.py" | řetězec Omezení: Minimální délka = 1 Model = [a-zA-Z0-9_] (povinné) |
ContainerResourceRequirements
Jméno | Popis | Hodnota |
---|---|---|
containerResourceLimits | Informace o limitu prostředků kontejneru: | ContainerResourceSettings |
containerResourceRequests | Informace o požadavku na prostředek kontejneru: | ContainerResourceSettings |
ContainerResourceSettings
Jméno | Popis | Hodnota |
---|---|---|
procesor | Počet požadavků nebo limitu počtu vCPU pro kontejner Více: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
řetězec |
Gpu | Počet požadavků nebo omezení karet Nvidia GPU pro kontejner Více: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
řetězec |
paměť | Požadavek nebo limit velikosti paměti pro kontejner. Více: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
řetězec |
DefaultScaleSettings
Jméno | Popis | Hodnota |
---|---|---|
scaleType | [Povinné] Typ algoritmu škálování nasazení | Výchozí (povinné) |
EndpointDeploymentPropertiesBaseEnvironmentVariables
Jméno | Popis | Hodnota |
---|
EndpointDeploymentPropertiesBaseProperties
Jméno | Popis | Hodnota |
---|
KubernetesOnlineDeployment
Jméno | Popis | Hodnota |
---|---|---|
containerResourceRequirements | Požadavky na prostředky pro kontejner (procesor a paměť). | ContainerResourceRequirements |
endpointComputeType | [Povinné] Typ výpočetního objektu koncového bodu. | Kubernetes (povinné) |
ManagedOnlineDeployment
Jméno | Popis | Hodnota |
---|---|---|
endpointComputeType | [Povinné] Typ výpočetního objektu koncového bodu. | Spravované (povinné) |
ManagedServiceIdentity
Jméno | Popis | Hodnota |
---|---|---|
typ | Typ identity spravované služby (kde jsou povolené typy SystemAssigned i UserAssigned). | None (Žádný) SystemAssigned SystemAssigned, UserAssigned UserAssigned (povinné) |
userAssignedIdentities | Sada identit přiřazených uživatelem přidružená k prostředku. Klíče slovníku userAssignedIdentities budou ID prostředků ARM ve formuláři: /subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. Hodnoty slovníku můžou být prázdné objekty ({}) v požadavcích. | userAssignedIdentities |
Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments
Jméno | Popis | Hodnota |
---|---|---|
identita | Identita spravované služby (identita přiřazená systémem nebo identita přiřazená uživatelem) | |
laskavý | Metadata používaná portálem, nástroji atd. k vykreslení různých prostředí uživatelského rozhraní pro prostředky stejného typu. | řetězec |
umístění | Geografické umístění, ve kterém se nachází zdroj | string (povinné) |
Jméno | Název prostředku | řetězec Omezení: Model = ^[a-zA-Z0-9][a-zA-Z0-9\-_]{0,254}$ (povinné) |
parent_id | ID prostředku, který je nadřazený pro tento prostředek. | ID prostředku typu: pracovních prostorů/onlineEndpoints |
vlastnosti | [Povinné] Další atributy entity. | OnlineDeploymentProperties (povinné) |
sku | Podrobnosti skladové položky vyžadované pro kontrakt ARM pro automatické škálování | skladové položky |
visačky | Značky prostředků | Slovník názvů a hodnot značek |
typ | Typ prostředku | Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2023-10-01" |
OnlineDeploymentProperties
Jméno | Popis | Hodnota |
---|---|---|
appInsightsEnabled | Pokud je pravda, povolí protokolování Application Insights. | Bool |
CodeConfiguration | Konfigurace kódu pro nasazení koncového bodu | CodeConfiguration |
popis | Popis nasazení koncového bodu | řetězec |
egressPublicNetworkAccess | Pokud je tato možnost povolená, povolte přístup k veřejné síti pro výchozí přenos dat. Pokud je zakázáno, vytvoří se zabezpečený výchozí přenos dat. Výchozí: Povoleno. | Zakázáno Povoleno |
endpointComputeType | Nastavte na Kubernetes pro typ KubernetesOnlineDeployment. U typu ManagedOnlineDeploymentna hodnotu ManagedOnlineDeployment . | Kubernetes Spravované (povinné) |
environmentId | ID prostředku ARM nebo AssetId specifikace prostředí pro nasazení koncového bodu | řetězec |
environmentVariables | Konfigurace proměnných prostředí pro nasazení | EndpointDeploymentPropertiesBaseEnvironmentVariables |
instanceType | Typ výpočetní instance. | řetězec |
livenessProbe | Sonda aktivity pravidelně monitoruje stav kontejneru. | ProbeSettings |
model | Cesta URI k modelu. | řetězec |
modelMountPath | Cesta k připojení modelu ve vlastním kontejneru. | řetězec |
vlastnosti | Slovník vlastností Vlastnosti lze přidat, ale ne odebrat nebo změnit. | endpointDeploymentPropertiesBaseProperties |
readinessProbe | Sonda připravenosti ověří, jestli je kontejner připravený obsluhovat provoz. Vlastnosti a výchozí hodnoty jsou stejné jako sonda aktivity. | ProbeSettings |
requestSettings | Požádejte o nastavení nasazení. | |
scaleSettings | Nastavení škálování pro nasazení Pokud je hodnota null nebo není zadaná, Výchozí hodnota TargetUtilizationScaleSettings pro KubernetesOnlineDeployment a do DefaultScaleSettings pro ManagedOnlineDeployment. |
|
OnlineRequestSettings
Jméno | Popis | Hodnota |
---|---|---|
maxConcurrentRequestsPerInstance | Počet maximálních souběžných požadavků na uzel povolený pro každé nasazení. Výchozí hodnota je 1. | Int |
maxQueueWait | (Zastaralé pro spravované online koncové body) Maximální doba, po kterou požadavek zůstane ve frontě ve formátu ISO 8601. Výchozí hodnota je 500 ms. (Teď zvyšte request_timeout_ms , aby se zohlednily případné zpoždění sítě nebo fronty. |
řetězec |
requestTimeout | Časový limit bodování ve formátu ISO 8601. Výchozí hodnota je 5000 ms. |
řetězec |
OnlineScaleSettings
Jméno | Popis | Hodnota |
---|---|---|
scaleType | Pro typ DefaultScaleSettingsnastavte na DefaultScaleSettings . Pro typ TargetUtilizationScaleSettings nastavte na TargetUtilizationSettings. | Výchozí Cílové využití (povinné) |
ProbeSettings
Jméno | Popis | Hodnota |
---|---|---|
failureThreshold | Počet chyb, které se mají povolit před vrácením stavu, který není v pořádku. | Int |
initialDelay | Zpoždění před první sondou ve formátu ISO 8601. | řetězec |
perioda | Doba mezi sondami ve formátu ISO 8601. | řetězec |
successThreshold | Počet úspěšných sond před vrácením stavu v pořádku. | Int |
přerušení zápasu | Časový limit sondy ve formátu ISO 8601. | řetězec |
Sku
Jméno | Popis | Hodnota |
---|---|---|
kapacita | Pokud skladová položka podporuje horizontální navýšení/snížení kapacity, měla by být zahrnuta celá čísla kapacity. Pokud není pro prostředek možné horizontální navýšení kapacity nebo jeho snížení kapacity, může se tento parametr vynechat. | Int |
Rodina | Pokud má služba různé generace hardwaru, pro stejnou skladovou položku, můžete ji zde zachytit. | řetězec |
Jméno | Název skladové položky. Ex - P3. Obvykle se jedná o písmeno+číslo. | string (povinné) |
velikost | Velikost skladové položky. Pokud je pole název kombinací vrstvy a jiné hodnoty, jedná se o samostatný kód. | řetězec |
úroveň | Toto pole musí implementovat poskytovatel prostředků, pokud má služba více než jednu úroveň, ale nevyžaduje se u put. | "Základní" "Zdarma" Premium "Standardní" |
TargetUtilizationScaleSettings
Jméno | Popis | Hodnota |
---|---|---|
maxInstances | Maximální počet instancí, na které se může nasazení škálovat. Kvóta bude vyhrazena pro max_instances. | Int |
minInstances | Minimální početinstancíchch | Int |
pollingInterval | Interval dotazování ve formátu ISO 8691. Podporuje pouze dobu trvání s přesností v sekundách. | řetězec |
scaleType | [Povinné] Typ algoritmu škálování nasazení | Cílové využití (povinné) |
targetUtilizationPercentage | Cílové využití procesoru pro automatické škálování | Int |
TrackedResourceTags
Jméno | Popis | Hodnota |
---|
UserAssignedIdentities
Jméno | Popis | Hodnota |
---|
UserAssignedIdentity
Jméno | Popis | Hodnota |
---|