Microsoft.MachineLearningServices-werkruimten/onlineEndpoints/deployments 2022-05-01
- meest recente
- 2024-10-01
- 2024-10-01-preview
- 2024-07-01-preview-
- 2024-04-01
- 2024-04-01-preview-
- 2024-01-01-preview-
- 2023-10-01
- 2023-08-01-preview-
- 2023-06-01-preview-
- 2023-04-01
- 2023-04-01-preview-
- 2023-02-01-preview
- 2022-12-01-preview
- 2022-10-01
- 2022-10-01-preview-
- 2022-06-01-preview-
- 2022-05-01
- 2022-02-01-preview-
- 2021-03-01-preview-
Bicep-resourcedefinitie
Het resourcetype werkruimten/onlineEndpoints/deployments kan worden geïmplementeerd met bewerkingen die zijn gericht op:
- Resourcegroepen - Zie opdrachten voor de implementatie van resourcegroepen
Zie logboek wijzigenvoor een lijst met gewijzigde eigenschappen in elke API-versie.
Resource-indeling
Als u een Resource microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments wilt maken, voegt u de volgende Bicep toe aan uw sjabloon.
resource symbolicname 'Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2022-05-01' = {
parent: resourceSymbolicName
identity: {
type: 'string'
userAssignedIdentities: {
{customized property}: {}
}
}
kind: 'string'
location: 'string'
name: 'string'
properties: {
appInsightsEnabled: bool
codeConfiguration: {
codeId: 'string'
scoringScript: 'string'
}
description: 'string'
environmentId: 'string'
environmentVariables: {
{customized property}: 'string'
}
instanceType: 'string'
livenessProbe: {
failureThreshold: int
initialDelay: 'string'
period: 'string'
successThreshold: int
timeout: 'string'
}
model: 'string'
modelMountPath: 'string'
properties: {
{customized property}: 'string'
}
readinessProbe: {
failureThreshold: int
initialDelay: 'string'
period: 'string'
successThreshold: int
timeout: 'string'
}
requestSettings: {
maxConcurrentRequestsPerInstance: int
maxQueueWait: 'string'
requestTimeout: 'string'
}
scaleSettings: {
scaleType: 'string'
// For remaining properties, see OnlineScaleSettings objects
}
endpointComputeType: 'string'
// For remaining properties, see OnlineDeploymentProperties objects
}
sku: {
capacity: int
family: 'string'
name: 'string'
size: 'string'
tier: 'string'
}
tags: {
{customized property}: 'string'
}
}
OnlineDeploymentProperties-objecten
Stel de eigenschap endpointComputeType in om het type object op te geven.
Gebruik voor Kubernetes-:
{
containerResourceRequirements: {
containerResourceLimits: {
cpu: 'string'
gpu: 'string'
memory: 'string'
}
containerResourceRequests: {
cpu: 'string'
gpu: 'string'
memory: 'string'
}
}
endpointComputeType: 'Kubernetes'
}
Gebruik voor Beheerde:
{
endpointComputeType: 'Managed'
}
OnlineScaleSettings-objecten
Stel de eigenschap scaleType in om het type object op te geven.
Gebruik voor standaard:
{
scaleType: 'Default'
}
Gebruik voor TargetUtilization:
{
maxInstances: int
minInstances: int
pollingInterval: 'string'
scaleType: 'TargetUtilization'
targetUtilizationPercentage: int
}
Eigenschapswaarden
CodeConfiguration
Naam | Beschrijving | Waarde |
---|---|---|
codeId | ARM-resource-id van de codeasset. | snaar |
scoringScript | [Vereist] Het script dat moet worden uitgevoerd bij het opstarten. bijvoorbeeld "score.py" | snaar Beperkingen: Minimale lengte = 1 Patroon = [a-zA-Z0-9_] (vereist) |
ContainerResourceRequirements
Naam | Beschrijving | Waarde |
---|---|---|
containerResourceLimits | Informatie over de limiet voor containerresources: | ContainerResourceSettings- |
containerResourceRequests | Informatie over containerresourceaanvragen: | ContainerResourceSettings- |
ContainerResourceSettings
Naam | Beschrijving | Waarde |
---|---|---|
CPU | Aantal vCPU's aanvraag/limiet voor container. Meer informatie: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
snaar |
Gpu | Aantal Nvidia GPU-kaarten aanvragen/limieten voor containers. Meer informatie: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
snaar |
geheugen | Aanvraag/limiet voor geheugengrootte voor container. Meer informatie: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
snaar |
DefaultScaleSettings
Naam | Beschrijving | Waarde |
---|---|---|
scaleType | [Vereist] Type algoritme voor het schalen van implementaties | 'Standaard' (vereist) |
EndpointDeploymentPropertiesBaseEnvironmentVariables
Naam | Beschrijving | Waarde |
---|
EndpointDeploymentPropertiesBaseProperties
Naam | Beschrijving | Waarde |
---|
KubernetesOnlineDeployment
Naam | Beschrijving | Waarde |
---|---|---|
containerResourceRequirements | De resourcevereisten voor de container (cpu en geheugen). | ContainerResourceRequirements |
endpointComputeType | [Vereist] Het rekentype van het eindpunt. | 'Kubernetes' (vereist) |
ManagedOnlineDeployment
Naam | Beschrijving | Waarde |
---|---|---|
endpointComputeType | [Vereist] Het rekentype van het eindpunt. | Beheerd (vereist) |
ManagedServiceIdentity
Naam | Beschrijving | Waarde |
---|---|---|
type | Type beheerde service-identiteit (waarbij zowel SystemAssigned- als UserAssigned-typen zijn toegestaan). | 'Geen' 'SystemAssigned' 'SystemAssigned, UserAssigned' UserAssigned (vereist) |
userAssignedIdentities | De set door de gebruiker toegewezen identiteiten die aan de resource zijn gekoppeld. De woordenlijstsleutels userAssignedIdentities zijn ARM-resource-id's in de vorm: /subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. De woordenlijstwaarden kunnen lege objecten ({}) zijn in aanvragen. | UserAssignedId-entiteiten |
Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments
Naam | Beschrijving | Waarde |
---|---|---|
identiteit | Beheerde service-identiteit (door het systeem toegewezen en/of door de gebruiker toegewezen identiteiten) | ManagedServiceIdentity- |
soort | Metagegevens die worden gebruikt door portal/tooling/etc om verschillende UX-ervaringen weer te geven voor resources van hetzelfde type. | snaar |
plaats | De geografische locatie waar de resource zich bevindt | tekenreeks (vereist) |
naam | De resourcenaam | snaar Beperkingen: Patroon = ^[a-zA-Z0-9][a-zA-Z0-9\-_]{0,254}$ (vereist) |
ouder | In Bicep kunt u de bovenliggende resource voor een onderliggende resource opgeven. U hoeft deze eigenschap alleen toe te voegen wanneer de onderliggende resource buiten de bovenliggende resource wordt gedeclareerd. Zie onderliggende resource buiten de bovenliggende resourcevoor meer informatie. |
Symbolische naam voor resource van het type: werkruimten/onlineEndpoints |
Eigenschappen | [Vereist] Aanvullende kenmerken van de entiteit. | OnlineDeploymentProperties (vereist) |
Sku | SKU-gegevens die vereist zijn voor een ARM-contract voor automatisch schalen. | SKU- |
Tags | Resourcetags | Woordenlijst met tagnamen en -waarden. Zie Tags in sjablonen |
OnlineDeploymentProperties
Naam | Beschrijving | Waarde |
---|---|---|
appInsightsEnabled | Indien waar, schakelt u Application Insights-logboekregistratie in. | Bool |
codeConfiguration | Codeconfiguratie voor de eindpuntimplementatie. | CodeConfiguration- |
beschrijving | Beschrijving van de eindpuntimplementatie. | snaar |
endpointComputeType | Ingesteld op 'Kubernetes' voor het type KubernetesOnlineDeployment. Ingesteld op Beheerd voor type ManagedOnlineDeployment. | 'Kubernetes' Beheerd (vereist) |
environmentId | ARM-resource-id of AssetId van de omgevingsspecificatie voor de eindpuntimplementatie. | snaar |
environmentVariables | Configuratie van omgevingsvariabelen voor de implementatie. | EndpointDeploymentPropertiesBaseEnvironmentVariables |
instanceType | Type rekeninstantie. | snaar |
livenessProbe | De livenesstest bewaakt regelmatig de status van de container. | ProbeSettings |
model | Het URI-pad naar het model. | snaar |
modelMountPath | Het pad voor het koppelen van het model in een aangepaste container. | snaar |
Eigenschappen | Eigenschappenwoordenlijst. Eigenschappen kunnen worden toegevoegd, maar niet worden verwijderd of gewijzigd. | EndpointDeploymentPropertiesBaseProperties |
readinessProbe | De gereedheidstest controleert of de container gereed is om verkeer te verwerken. De eigenschappen en standaardwaarden zijn hetzelfde als de livenesstest. | ProbeSettings |
requestSettings | Aanvraaginstellingen voor de implementatie. | OnlineRequestSettings |
scaleSettings | Schaalinstellingen voor de implementatie. Als deze null is of niet is opgegeven, standaard ingesteld op TargetUtilizationScaleSettings voor KubernetesOnlineDeployment en naar DefaultScaleSettings voor ManagedOnlineDeployment. |
OnlineScaleSettings- |
OnlineRequestSettings
Naam | Beschrijving | Waarde |
---|---|---|
maxConcurrentRequestsPerInstance | Het aantal maximaal gelijktijdige aanvragen per knooppunt dat per implementatie is toegestaan. De standaardwaarde is 1. | Int |
maxQueueWait | De maximale tijdsduur voor een aanvraag blijft in de wachtrij in ISO 8601-indeling. De standaardwaarde is 500 ms. |
snaar |
requestTimeout | De time-out voor scoren in ISO 8601-indeling. De standaardwaarde is 5000 ms. |
snaar |
OnlineScaleSettings
Naam | Beschrijving | Waarde |
---|---|---|
scaleType | Ingesteld op Standaard voor het type DefaultScaleSettings. Ingesteld op TargetUtilization voor type TargetUtilizationScaleSettings. | 'Standaard' TargetUtilization (vereist) |
ProbeSettings
Naam | Beschrijving | Waarde |
---|---|---|
failureThreshold | Het aantal fouten dat moet worden toegestaan voordat een beschadigde status wordt geretourneerd. | Int |
initialDelay | De vertraging vóór de eerste test in ISO 8601-indeling. | snaar |
periode | De tijdsduur tussen tests in ISO 8601-indeling. | snaar |
successThreshold | Het aantal geslaagde tests voordat een status in orde wordt geretourneerd. | Int |
Timeout | De time-out van de test in ISO 8601-indeling. | snaar |
Sku
Naam | Beschrijving | Waarde |
---|---|---|
capaciteit | Als de SKU uitschalen/inschalen ondersteunt, moet het gehele getal van de capaciteit worden opgenomen. Als uitschalen/inschalen niet mogelijk is voor de resource, kan dit worden weggelaten. | Int |
Familie | Als de service verschillende generaties hardware heeft, voor dezelfde SKU, kan die hier worden vastgelegd. | snaar |
naam | De naam van de SKU. Ex - P3. Dit is meestal een letter+cijfercode | tekenreeks (vereist) |
grootte | De SKU-grootte. Wanneer het naamveld de combinatie van de laag en een andere waarde is, is dit de zelfstandige code. | snaar |
rang | Dit veld moet worden geïmplementeerd door de resourceprovider als de service meer dan één laag heeft, maar niet vereist is voor een PUT. | 'Basis' 'Gratis' 'Premium' 'Standaard' |
TargetUtilizationScaleSettings
Naam | Beschrijving | Waarde |
---|---|---|
maxInstances | Het maximum aantal exemplaren waarnaar de implementatie kan worden geschaald. Het quotum wordt gereserveerd voor max_instances. | Int |
minInstances | Het minimale aantal exemplaren dat altijd aanwezig moet zijn. | Int |
pollingInterval | Het polling-interval in ISO 8691-indeling. Ondersteunt alleen de duur met precisie zo laag als seconden. | snaar |
scaleType | [Vereist] Type algoritme voor het schalen van implementaties | TargetUtilization (vereist) |
targetUtilizationPercentage | Doel-CPU-gebruik voor de automatische schaalaanpassing. | Int |
TrackedResourceTags
Naam | Beschrijving | Waarde |
---|
UserAssignedIdentities
Naam | Beschrijving | Waarde |
---|
UserAssignedIdentity
Naam | Beschrijving | Waarde |
---|
Resourcedefinitie van ARM-sjabloon
Het resourcetype werkruimten/onlineEndpoints/deployments kan worden geïmplementeerd met bewerkingen die zijn gericht op:
- Resourcegroepen - Zie opdrachten voor de implementatie van resourcegroepen
Zie logboek wijzigenvoor een lijst met gewijzigde eigenschappen in elke API-versie.
Resource-indeling
Als u een Resource Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments wilt maken, voegt u de volgende JSON toe aan uw sjabloon.
{
"type": "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments",
"apiVersion": "2022-05-01",
"name": "string",
"identity": {
"type": "string",
"userAssignedIdentities": {
"{customized property}": {
}
}
},
"kind": "string",
"location": "string",
"properties": {
"appInsightsEnabled": "bool",
"codeConfiguration": {
"codeId": "string",
"scoringScript": "string"
},
"description": "string",
"environmentId": "string",
"environmentVariables": {
"{customized property}": "string"
},
"instanceType": "string",
"livenessProbe": {
"failureThreshold": "int",
"initialDelay": "string",
"period": "string",
"successThreshold": "int",
"timeout": "string"
},
"model": "string",
"modelMountPath": "string",
"properties": {
"{customized property}": "string"
},
"readinessProbe": {
"failureThreshold": "int",
"initialDelay": "string",
"period": "string",
"successThreshold": "int",
"timeout": "string"
},
"requestSettings": {
"maxConcurrentRequestsPerInstance": "int",
"maxQueueWait": "string",
"requestTimeout": "string"
},
"scaleSettings": {
"scaleType": "string"
// For remaining properties, see OnlineScaleSettings objects
},
"endpointComputeType": "string"
// For remaining properties, see OnlineDeploymentProperties objects
},
"sku": {
"capacity": "int",
"family": "string",
"name": "string",
"size": "string",
"tier": "string"
},
"tags": {
"{customized property}": "string"
}
}
OnlineDeploymentProperties-objecten
Stel de eigenschap endpointComputeType in om het type object op te geven.
Gebruik voor Kubernetes-:
{
"containerResourceRequirements": {
"containerResourceLimits": {
"cpu": "string",
"gpu": "string",
"memory": "string"
},
"containerResourceRequests": {
"cpu": "string",
"gpu": "string",
"memory": "string"
}
},
"endpointComputeType": "Kubernetes"
}
Gebruik voor Beheerde:
{
"endpointComputeType": "Managed"
}
OnlineScaleSettings-objecten
Stel de eigenschap scaleType in om het type object op te geven.
Gebruik voor standaard:
{
"scaleType": "Default"
}
Gebruik voor TargetUtilization:
{
"maxInstances": "int",
"minInstances": "int",
"pollingInterval": "string",
"scaleType": "TargetUtilization",
"targetUtilizationPercentage": "int"
}
Eigenschapswaarden
CodeConfiguration
Naam | Beschrijving | Waarde |
---|---|---|
codeId | ARM-resource-id van de codeasset. | snaar |
scoringScript | [Vereist] Het script dat moet worden uitgevoerd bij het opstarten. bijvoorbeeld "score.py" | snaar Beperkingen: Minimale lengte = 1 Patroon = [a-zA-Z0-9_] (vereist) |
ContainerResourceRequirements
Naam | Beschrijving | Waarde |
---|---|---|
containerResourceLimits | Informatie over de limiet voor containerresources: | ContainerResourceSettings- |
containerResourceRequests | Informatie over containerresourceaanvragen: | ContainerResourceSettings- |
ContainerResourceSettings
Naam | Beschrijving | Waarde |
---|---|---|
CPU | Aantal vCPU's aanvraag/limiet voor container. Meer informatie: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
snaar |
Gpu | Aantal Nvidia GPU-kaarten aanvragen/limieten voor containers. Meer informatie: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
snaar |
geheugen | Aanvraag/limiet voor geheugengrootte voor container. Meer informatie: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
snaar |
DefaultScaleSettings
Naam | Beschrijving | Waarde |
---|---|---|
scaleType | [Vereist] Type algoritme voor het schalen van implementaties | 'Standaard' (vereist) |
EndpointDeploymentPropertiesBaseEnvironmentVariables
Naam | Beschrijving | Waarde |
---|
EndpointDeploymentPropertiesBaseProperties
Naam | Beschrijving | Waarde |
---|
KubernetesOnlineDeployment
Naam | Beschrijving | Waarde |
---|---|---|
containerResourceRequirements | De resourcevereisten voor de container (cpu en geheugen). | ContainerResourceRequirements |
endpointComputeType | [Vereist] Het rekentype van het eindpunt. | 'Kubernetes' (vereist) |
ManagedOnlineDeployment
Naam | Beschrijving | Waarde |
---|---|---|
endpointComputeType | [Vereist] Het rekentype van het eindpunt. | Beheerd (vereist) |
ManagedServiceIdentity
Naam | Beschrijving | Waarde |
---|---|---|
type | Type beheerde service-identiteit (waarbij zowel SystemAssigned- als UserAssigned-typen zijn toegestaan). | 'Geen' 'SystemAssigned' 'SystemAssigned, UserAssigned' UserAssigned (vereist) |
userAssignedIdentities | De set door de gebruiker toegewezen identiteiten die aan de resource zijn gekoppeld. De woordenlijstsleutels userAssignedIdentities zijn ARM-resource-id's in de vorm: /subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. De woordenlijstwaarden kunnen lege objecten ({}) zijn in aanvragen. | UserAssignedId-entiteiten |
Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments
Naam | Beschrijving | Waarde |
---|---|---|
apiVersion | De API-versie | '2022-05-01' |
identiteit | Beheerde service-identiteit (door het systeem toegewezen en/of door de gebruiker toegewezen identiteiten) | ManagedServiceIdentity- |
soort | Metagegevens die worden gebruikt door portal/tooling/etc om verschillende UX-ervaringen weer te geven voor resources van hetzelfde type. | snaar |
plaats | De geografische locatie waar de resource zich bevindt | tekenreeks (vereist) |
naam | De resourcenaam | snaar Beperkingen: Patroon = ^[a-zA-Z0-9][a-zA-Z0-9\-_]{0,254}$ (vereist) |
Eigenschappen | [Vereist] Aanvullende kenmerken van de entiteit. | OnlineDeploymentProperties (vereist) |
Sku | SKU-gegevens die vereist zijn voor een ARM-contract voor automatisch schalen. | SKU- |
Tags | Resourcetags | Woordenlijst met tagnamen en -waarden. Zie Tags in sjablonen |
type | Het resourcetype | 'Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments' |
OnlineDeploymentProperties
Naam | Beschrijving | Waarde |
---|---|---|
appInsightsEnabled | Indien waar, schakelt u Application Insights-logboekregistratie in. | Bool |
codeConfiguration | Codeconfiguratie voor de eindpuntimplementatie. | CodeConfiguration- |
beschrijving | Beschrijving van de eindpuntimplementatie. | snaar |
endpointComputeType | Ingesteld op 'Kubernetes' voor het type KubernetesOnlineDeployment. Ingesteld op Beheerd voor type ManagedOnlineDeployment. | 'Kubernetes' Beheerd (vereist) |
environmentId | ARM-resource-id of AssetId van de omgevingsspecificatie voor de eindpuntimplementatie. | snaar |
environmentVariables | Configuratie van omgevingsvariabelen voor de implementatie. | EndpointDeploymentPropertiesBaseEnvironmentVariables |
instanceType | Type rekeninstantie. | snaar |
livenessProbe | De livenesstest bewaakt regelmatig de status van de container. | ProbeSettings |
model | Het URI-pad naar het model. | snaar |
modelMountPath | Het pad voor het koppelen van het model in een aangepaste container. | snaar |
Eigenschappen | Eigenschappenwoordenlijst. Eigenschappen kunnen worden toegevoegd, maar niet worden verwijderd of gewijzigd. | EndpointDeploymentPropertiesBaseProperties |
readinessProbe | De gereedheidstest controleert of de container gereed is om verkeer te verwerken. De eigenschappen en standaardwaarden zijn hetzelfde als de livenesstest. | ProbeSettings |
requestSettings | Aanvraaginstellingen voor de implementatie. | OnlineRequestSettings |
scaleSettings | Schaalinstellingen voor de implementatie. Als deze null is of niet is opgegeven, standaard ingesteld op TargetUtilizationScaleSettings voor KubernetesOnlineDeployment en naar DefaultScaleSettings voor ManagedOnlineDeployment. |
OnlineScaleSettings- |
OnlineRequestSettings
Naam | Beschrijving | Waarde |
---|---|---|
maxConcurrentRequestsPerInstance | Het aantal maximaal gelijktijdige aanvragen per knooppunt dat per implementatie is toegestaan. De standaardwaarde is 1. | Int |
maxQueueWait | De maximale tijdsduur voor een aanvraag blijft in de wachtrij in ISO 8601-indeling. De standaardwaarde is 500 ms. |
snaar |
requestTimeout | De time-out voor scoren in ISO 8601-indeling. De standaardwaarde is 5000 ms. |
snaar |
OnlineScaleSettings
Naam | Beschrijving | Waarde |
---|---|---|
scaleType | Ingesteld op Standaard voor het type DefaultScaleSettings. Ingesteld op TargetUtilization voor type TargetUtilizationScaleSettings. | 'Standaard' TargetUtilization (vereist) |
ProbeSettings
Naam | Beschrijving | Waarde |
---|---|---|
failureThreshold | Het aantal fouten dat moet worden toegestaan voordat een beschadigde status wordt geretourneerd. | Int |
initialDelay | De vertraging vóór de eerste test in ISO 8601-indeling. | snaar |
periode | De tijdsduur tussen tests in ISO 8601-indeling. | snaar |
successThreshold | Het aantal geslaagde tests voordat een status in orde wordt geretourneerd. | Int |
Timeout | De time-out van de test in ISO 8601-indeling. | snaar |
Sku
Naam | Beschrijving | Waarde |
---|---|---|
capaciteit | Als de SKU uitschalen/inschalen ondersteunt, moet het gehele getal van de capaciteit worden opgenomen. Als uitschalen/inschalen niet mogelijk is voor de resource, kan dit worden weggelaten. | Int |
Familie | Als de service verschillende generaties hardware heeft, voor dezelfde SKU, kan die hier worden vastgelegd. | snaar |
naam | De naam van de SKU. Ex - P3. Dit is meestal een letter+cijfercode | tekenreeks (vereist) |
grootte | De SKU-grootte. Wanneer het naamveld de combinatie van de laag en een andere waarde is, is dit de zelfstandige code. | snaar |
rang | Dit veld moet worden geïmplementeerd door de resourceprovider als de service meer dan één laag heeft, maar niet vereist is voor een PUT. | 'Basis' 'Gratis' 'Premium' 'Standaard' |
TargetUtilizationScaleSettings
Naam | Beschrijving | Waarde |
---|---|---|
maxInstances | Het maximum aantal exemplaren waarnaar de implementatie kan worden geschaald. Het quotum wordt gereserveerd voor max_instances. | Int |
minInstances | Het minimale aantal exemplaren dat altijd aanwezig moet zijn. | Int |
pollingInterval | Het polling-interval in ISO 8691-indeling. Ondersteunt alleen de duur met precisie zo laag als seconden. | snaar |
scaleType | [Vereist] Type algoritme voor het schalen van implementaties | TargetUtilization (vereist) |
targetUtilizationPercentage | Doel-CPU-gebruik voor de automatische schaalaanpassing. | Int |
TrackedResourceTags
Naam | Beschrijving | Waarde |
---|
UserAssignedIdentities
Naam | Beschrijving | Waarde |
---|
UserAssignedIdentity
Naam | Beschrijving | Waarde |
---|
Resourcedefinitie van Terraform (AzAPI-provider)
Het resourcetype werkruimten/onlineEndpoints/deployments kan worden geïmplementeerd met bewerkingen die zijn gericht op:
- resourcegroepen
Zie logboek wijzigenvoor een lijst met gewijzigde eigenschappen in elke API-versie.
Resource-indeling
Als u een Resource microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments wilt maken, voegt u de volgende Terraform toe aan uw sjabloon.
resource "azapi_resource" "symbolicname" {
type = "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2022-05-01"
name = "string"
identity = {
type = "string"
userAssignedIdentities = {
{customized property} = {
}
}
}
kind = "string"
location = "string"
sku = {
capacity = int
family = "string"
name = "string"
size = "string"
tier = "string"
}
tags = {
{customized property} = "string"
}
body = jsonencode({
properties = {
appInsightsEnabled = bool
codeConfiguration = {
codeId = "string"
scoringScript = "string"
}
description = "string"
environmentId = "string"
environmentVariables = {
{customized property} = "string"
}
instanceType = "string"
livenessProbe = {
failureThreshold = int
initialDelay = "string"
period = "string"
successThreshold = int
timeout = "string"
}
model = "string"
modelMountPath = "string"
properties = {
{customized property} = "string"
}
readinessProbe = {
failureThreshold = int
initialDelay = "string"
period = "string"
successThreshold = int
timeout = "string"
}
requestSettings = {
maxConcurrentRequestsPerInstance = int
maxQueueWait = "string"
requestTimeout = "string"
}
scaleSettings = {
scaleType = "string"
// For remaining properties, see OnlineScaleSettings objects
}
endpointComputeType = "string"
// For remaining properties, see OnlineDeploymentProperties objects
}
})
}
OnlineDeploymentProperties-objecten
Stel de eigenschap endpointComputeType in om het type object op te geven.
Gebruik voor Kubernetes-:
{
containerResourceRequirements = {
containerResourceLimits = {
cpu = "string"
gpu = "string"
memory = "string"
}
containerResourceRequests = {
cpu = "string"
gpu = "string"
memory = "string"
}
}
endpointComputeType = "Kubernetes"
}
Gebruik voor Beheerde:
{
endpointComputeType = "Managed"
}
OnlineScaleSettings-objecten
Stel de eigenschap scaleType in om het type object op te geven.
Gebruik voor standaard:
{
scaleType = "Default"
}
Gebruik voor TargetUtilization:
{
maxInstances = int
minInstances = int
pollingInterval = "string"
scaleType = "TargetUtilization"
targetUtilizationPercentage = int
}
Eigenschapswaarden
CodeConfiguration
Naam | Beschrijving | Waarde |
---|---|---|
codeId | ARM-resource-id van de codeasset. | snaar |
scoringScript | [Vereist] Het script dat moet worden uitgevoerd bij het opstarten. bijvoorbeeld "score.py" | snaar Beperkingen: Minimale lengte = 1 Patroon = [a-zA-Z0-9_] (vereist) |
ContainerResourceRequirements
Naam | Beschrijving | Waarde |
---|---|---|
containerResourceLimits | Informatie over de limiet voor containerresources: | ContainerResourceSettings- |
containerResourceRequests | Informatie over containerresourceaanvragen: | ContainerResourceSettings- |
ContainerResourceSettings
Naam | Beschrijving | Waarde |
---|---|---|
CPU | Aantal vCPU's aanvraag/limiet voor container. Meer informatie: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
snaar |
Gpu | Aantal Nvidia GPU-kaarten aanvragen/limieten voor containers. Meer informatie: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
snaar |
geheugen | Aanvraag/limiet voor geheugengrootte voor container. Meer informatie: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
snaar |
DefaultScaleSettings
Naam | Beschrijving | Waarde |
---|---|---|
scaleType | [Vereist] Type algoritme voor het schalen van implementaties | 'Standaard' (vereist) |
EndpointDeploymentPropertiesBaseEnvironmentVariables
Naam | Beschrijving | Waarde |
---|
EndpointDeploymentPropertiesBaseProperties
Naam | Beschrijving | Waarde |
---|
KubernetesOnlineDeployment
Naam | Beschrijving | Waarde |
---|---|---|
containerResourceRequirements | De resourcevereisten voor de container (cpu en geheugen). | ContainerResourceRequirements |
endpointComputeType | [Vereist] Het rekentype van het eindpunt. | 'Kubernetes' (vereist) |
ManagedOnlineDeployment
Naam | Beschrijving | Waarde |
---|---|---|
endpointComputeType | [Vereist] Het rekentype van het eindpunt. | Beheerd (vereist) |
ManagedServiceIdentity
Naam | Beschrijving | Waarde |
---|---|---|
type | Type beheerde service-identiteit (waarbij zowel SystemAssigned- als UserAssigned-typen zijn toegestaan). | 'Geen' 'SystemAssigned' 'SystemAssigned, UserAssigned' UserAssigned (vereist) |
userAssignedIdentities | De set door de gebruiker toegewezen identiteiten die aan de resource zijn gekoppeld. De woordenlijstsleutels userAssignedIdentities zijn ARM-resource-id's in de vorm: /subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. De woordenlijstwaarden kunnen lege objecten ({}) zijn in aanvragen. | UserAssignedId-entiteiten |
Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments
Naam | Beschrijving | Waarde |
---|---|---|
identiteit | Beheerde service-identiteit (door het systeem toegewezen en/of door de gebruiker toegewezen identiteiten) | ManagedServiceIdentity- |
soort | Metagegevens die worden gebruikt door portal/tooling/etc om verschillende UX-ervaringen weer te geven voor resources van hetzelfde type. | snaar |
plaats | De geografische locatie waar de resource zich bevindt | tekenreeks (vereist) |
naam | De resourcenaam | snaar Beperkingen: Patroon = ^[a-zA-Z0-9][a-zA-Z0-9\-_]{0,254}$ (vereist) |
parent_id | De id van de resource die het bovenliggende item voor deze resource is. | Id voor resource van het type: werkruimten/onlineEndpoints |
Eigenschappen | [Vereist] Aanvullende kenmerken van de entiteit. | OnlineDeploymentProperties (vereist) |
Sku | SKU-gegevens die vereist zijn voor een ARM-contract voor automatisch schalen. | SKU- |
Tags | Resourcetags | Woordenlijst met tagnamen en -waarden. |
type | Het resourcetype | "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2022-05-01" |
OnlineDeploymentProperties
Naam | Beschrijving | Waarde |
---|---|---|
appInsightsEnabled | Indien waar, schakelt u Application Insights-logboekregistratie in. | Bool |
codeConfiguration | Codeconfiguratie voor de eindpuntimplementatie. | CodeConfiguration- |
beschrijving | Beschrijving van de eindpuntimplementatie. | snaar |
endpointComputeType | Ingesteld op 'Kubernetes' voor het type KubernetesOnlineDeployment. Ingesteld op Beheerd voor type ManagedOnlineDeployment. | 'Kubernetes' Beheerd (vereist) |
environmentId | ARM-resource-id of AssetId van de omgevingsspecificatie voor de eindpuntimplementatie. | snaar |
environmentVariables | Configuratie van omgevingsvariabelen voor de implementatie. | EndpointDeploymentPropertiesBaseEnvironmentVariables |
instanceType | Type rekeninstantie. | snaar |
livenessProbe | De livenesstest bewaakt regelmatig de status van de container. | ProbeSettings |
model | Het URI-pad naar het model. | snaar |
modelMountPath | Het pad voor het koppelen van het model in een aangepaste container. | snaar |
Eigenschappen | Eigenschappenwoordenlijst. Eigenschappen kunnen worden toegevoegd, maar niet worden verwijderd of gewijzigd. | EndpointDeploymentPropertiesBaseProperties |
readinessProbe | De gereedheidstest controleert of de container gereed is om verkeer te verwerken. De eigenschappen en standaardwaarden zijn hetzelfde als de livenesstest. | ProbeSettings |
requestSettings | Aanvraaginstellingen voor de implementatie. | OnlineRequestSettings |
scaleSettings | Schaalinstellingen voor de implementatie. Als deze null is of niet is opgegeven, standaard ingesteld op TargetUtilizationScaleSettings voor KubernetesOnlineDeployment en naar DefaultScaleSettings voor ManagedOnlineDeployment. |
OnlineScaleSettings- |
OnlineRequestSettings
Naam | Beschrijving | Waarde |
---|---|---|
maxConcurrentRequestsPerInstance | Het aantal maximaal gelijktijdige aanvragen per knooppunt dat per implementatie is toegestaan. De standaardwaarde is 1. | Int |
maxQueueWait | De maximale tijdsduur voor een aanvraag blijft in de wachtrij in ISO 8601-indeling. De standaardwaarde is 500 ms. |
snaar |
requestTimeout | De time-out voor scoren in ISO 8601-indeling. De standaardwaarde is 5000 ms. |
snaar |
OnlineScaleSettings
Naam | Beschrijving | Waarde |
---|---|---|
scaleType | Ingesteld op Standaard voor het type DefaultScaleSettings. Ingesteld op TargetUtilization voor type TargetUtilizationScaleSettings. | 'Standaard' TargetUtilization (vereist) |
ProbeSettings
Naam | Beschrijving | Waarde |
---|---|---|
failureThreshold | Het aantal fouten dat moet worden toegestaan voordat een beschadigde status wordt geretourneerd. | Int |
initialDelay | De vertraging vóór de eerste test in ISO 8601-indeling. | snaar |
periode | De tijdsduur tussen tests in ISO 8601-indeling. | snaar |
successThreshold | Het aantal geslaagde tests voordat een status in orde wordt geretourneerd. | Int |
Timeout | De time-out van de test in ISO 8601-indeling. | snaar |
Sku
Naam | Beschrijving | Waarde |
---|---|---|
capaciteit | Als de SKU uitschalen/inschalen ondersteunt, moet het gehele getal van de capaciteit worden opgenomen. Als uitschalen/inschalen niet mogelijk is voor de resource, kan dit worden weggelaten. | Int |
Familie | Als de service verschillende generaties hardware heeft, voor dezelfde SKU, kan die hier worden vastgelegd. | snaar |
naam | De naam van de SKU. Ex - P3. Dit is meestal een letter+cijfercode | tekenreeks (vereist) |
grootte | De SKU-grootte. Wanneer het naamveld de combinatie van de laag en een andere waarde is, is dit de zelfstandige code. | snaar |
rang | Dit veld moet worden geïmplementeerd door de resourceprovider als de service meer dan één laag heeft, maar niet vereist is voor een PUT. | 'Basis' 'Gratis' 'Premium' 'Standaard' |
TargetUtilizationScaleSettings
Naam | Beschrijving | Waarde |
---|---|---|
maxInstances | Het maximum aantal exemplaren waarnaar de implementatie kan worden geschaald. Het quotum wordt gereserveerd voor max_instances. | Int |
minInstances | Het minimale aantal exemplaren dat altijd aanwezig moet zijn. | Int |
pollingInterval | Het polling-interval in ISO 8691-indeling. Ondersteunt alleen de duur met precisie zo laag als seconden. | snaar |
scaleType | [Vereist] Type algoritme voor het schalen van implementaties | TargetUtilization (vereist) |
targetUtilizationPercentage | Doel-CPU-gebruik voor de automatische schaalaanpassing. | Int |
TrackedResourceTags
Naam | Beschrijving | Waarde |
---|
UserAssignedIdentities
Naam | Beschrijving | Waarde |
---|
UserAssignedIdentity
Naam | Beschrijving | Waarde |
---|