Microsoft.MachineLearningServices-Arbeitsbereiche/onlineEndpoints/deployments 2022-12-01-preview
- neueste
- 2024-10-01
- 2024-10-01-Vorschau-
- 2024-07-01-Preview-
- 2024-04-01
- 2024-04-01-Preview-
- 2024-01-01-Preview-
- 2023-10-01
- 2023-08-01-Preview-
- 2023-06-01-Preview-
- 2023-04-01
- 2023-04-01-Preview-
- 2023-02-01-Vorschau-
- 2022-12-01-Vorschau-
- 2022-10-01
- 2022-10-01-Preview-
- 2022-06-01-Preview-
- 2022-05-01
- 2022-02-01-Preview-
- 2021-03-01-Preview-
Bicep-Ressourcendefinition
Der Ressourcentyp "workspaces/onlineEndpoints/deployments" kann mit Vorgängen bereitgestellt werden, die auf Folgendes abzielen:
- Ressourcengruppen – Siehe Ressourcengruppenbereitstellungsbefehle
Eine Liste der geänderten Eigenschaften in jeder API-Version finden Sie unter Änderungsprotokoll.
Ressourcenformat
Um eine Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments-Ressource zu erstellen, fügen Sie ihrer Vorlage die folgende Bicep hinzu.
resource symbolicname 'Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2022-12-01-preview' = {
parent: resourceSymbolicName
identity: {
type: 'string'
userAssignedIdentities: {
{customized property}: {}
}
}
kind: 'string'
location: 'string'
name: 'string'
properties: {
appInsightsEnabled: bool
codeConfiguration: {
codeId: 'string'
scoringScript: 'string'
}
description: 'string'
egressPublicNetworkAccess: 'string'
environmentId: 'string'
environmentVariables: {
{customized property}: 'string'
}
instanceType: 'string'
livenessProbe: {
failureThreshold: int
initialDelay: 'string'
period: 'string'
successThreshold: int
timeout: 'string'
}
model: 'string'
modelMountPath: 'string'
properties: {
{customized property}: 'string'
}
readinessProbe: {
failureThreshold: int
initialDelay: 'string'
period: 'string'
successThreshold: int
timeout: 'string'
}
requestSettings: {
maxConcurrentRequestsPerInstance: int
maxQueueWait: 'string'
requestTimeout: 'string'
}
scaleSettings: {
scaleType: 'string'
// For remaining properties, see OnlineScaleSettings objects
}
endpointComputeType: 'string'
// For remaining properties, see OnlineDeploymentProperties objects
}
sku: {
capacity: int
family: 'string'
name: 'string'
size: 'string'
tier: 'string'
}
tags: {
{customized property}: 'string'
}
}
OnlineScaleSettings-Objekte
Legen Sie die scaleType--Eigenschaft fest, um den Objekttyp anzugeben.
Verwenden Sie für Standard-:
{
scaleType: 'Default'
}
Verwenden Sie für TargetUtilization-Folgendes:
{
maxInstances: int
minInstances: int
pollingInterval: 'string'
scaleType: 'TargetUtilization'
targetUtilizationPercentage: int
}
OnlineDeploymentProperties-Objekte
Legen Sie die eigenschaft endpointComputeType fest, um den Objekttyp anzugeben.
Verwenden Sie für Kubernetes:
{
containerResourceRequirements: {
containerResourceLimits: {
cpu: 'string'
gpu: 'string'
memory: 'string'
}
containerResourceRequests: {
cpu: 'string'
gpu: 'string'
memory: 'string'
}
}
endpointComputeType: 'Kubernetes'
}
Verwenden Sie für verwaltete:
{
endpointComputeType: 'Managed'
}
Eigenschaftswerte
CodeConfiguration
Name | Beschreibung | Wert |
---|---|---|
codeId | ARM-Ressourcen-ID der Coderessource. | Schnur |
scoringScript | [Erforderlich] Das Skript, das beim Start ausgeführt werden soll. Zb. "score.py" | Schnur Zwänge: Min. Länge = 1 Pattern = [a-zA-Z0-9_] (erforderlich) |
ContainerResourceRequirements
Name | Beschreibung | Wert |
---|---|---|
containerResourceLimits | Informationen zum Containerressourcengrenzwert: | ContainerResourceSettings- |
containerResourceRequests | Informationen zur Containerressourcenanforderung: | ContainerResourceSettings- |
ContainerResourceSettings
Name | Beschreibung | Wert |
---|---|---|
CPU | Anzahl der vCPUs-Anforderung/Grenzwert für Container. Weitere Informationen: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
Schnur |
gpu | Anzahl der Nvidia GPU-Kartenanforderung/-limit für Container. Weitere Informationen: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
Schnur |
Gedächtnis | Anforderung/Grenzwert für Speichergröße für Container. Weitere Informationen: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
Schnur |
DefaultScaleSettings
Name | Beschreibung | Wert |
---|---|---|
scaleType | [Erforderlich] Art des Bereitstellungsskalierungsalgorithmus | 'Standard' (erforderlich) |
EndpointDeploymentPropertiesBaseEnvironmentVariables
Name | Beschreibung | Wert |
---|
EndpointDeploymentPropertiesBaseProperties
Name | Beschreibung | Wert |
---|
KubernetesOnlineDeployment
Name | Beschreibung | Wert |
---|---|---|
containerResourceRequirements | Die Ressourcenanforderungen für den Container (CPU und Arbeitsspeicher). | ContainerResourceRequirements |
endpointComputeType | [Erforderlich] Der Computetyp des Endpunkts. | 'Kubernetes' (erforderlich) |
ManagedOnlineDeployment
Name | Beschreibung | Wert |
---|---|---|
endpointComputeType | [Erforderlich] Der Computetyp des Endpunkts. | "Verwaltet" (erforderlich) |
ManagedServiceIdentity
Name | Beschreibung | Wert |
---|---|---|
Art | Typ der verwalteten Dienstidentität (wobei systemAssigned- und UserAssigned-Typen zulässig sind). | 'None' 'SystemAssigned' "SystemAssigned,UserAssigned" "UserAssigned" (erforderlich) |
userAssignedIdentities | Die Gruppe der benutzerzuweisungen Identitäten, die der Ressource zugeordnet sind. Die Wörterbuchschlüssel "userAssignedIdentities" sind ARM-Ressourcen-IDs im Formular: '/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. Die Wörterbuchwerte können leere Objekte ({}) in Anforderungen sein. | UserAssignedIdentities- |
Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments
Name | Beschreibung | Wert |
---|---|---|
Identität | Verwaltete Dienstidentität (vom System zugewiesene und/oder vom Benutzer zugewiesene Identitäten) | ManagedServiceIdentity- |
Art | Metadaten, die von Portal/Tooling/etc. verwendet werden, um unterschiedliche UX-Oberflächen für Ressourcen desselben Typs zu rendern. | Schnur |
Ort | Der geografische Standort, an dem sich die Ressource befindet | Zeichenfolge (erforderlich) |
Name | Der Ressourcenname | Schnur Zwänge: Pattern = ^[a-zA-Z0-9][a-zA-Z0-9\-_]{0,254}$ (erforderlich) |
Elternteil | In Bicep können Sie die übergeordnete Ressource für eine untergeordnete Ressource angeben. Sie müssen diese Eigenschaft nur hinzufügen, wenn die untergeordnete Ressource außerhalb der übergeordneten Ressource deklariert wird. Weitere Informationen finden Sie unter Untergeordnete Ressource außerhalb der übergeordneten Ressource. |
Symbolischer Name für Ressource des Typs: Arbeitsbereiche/onlineEndpoints |
Eigenschaften | [Erforderlich] Zusätzliche Attribute der Entität. | OnlineDeploymentProperties (erforderlich) |
Sku | Sku-Details, die für den ARM-Vertrag für die automatische Skalierung erforderlich sind. | Sku- |
Schilder | Ressourcentags | Wörterbuch der Tagnamen und -werte. Siehe Tags in Vorlagen |
OnlineDeploymentProperties
Name | Beschreibung | Wert |
---|---|---|
appInsightsEnabled | Wenn wahr, aktiviert die Application Insights-Protokollierung. | Bool |
codeConfiguration | Codekonfiguration für die Endpunktbereitstellung. | CodeConfiguration- |
Beschreibung | Beschreibung der Endpunktbereitstellung. | Schnur |
egressPublicNetworkAccess | Wenn aktiviert, lassen Sie den Zugriff auf öffentliche Netzwerke zu. Wenn deaktiviert, wird dadurch ein sicherer Ausgang erstellt. Standard: Aktiviert. | "Deaktiviert" "Aktiviert" |
endpointComputeType | Legen Sie für den Typ KubernetesOnlineDeploymentauf "Kubernetes" fest. Legen Sie für den Typ ManagedOnlineDeployment-auf "Verwaltet" fest. | 'Kubernetes' "Verwaltet" (erforderlich) |
environmentId | ARM-Ressourcen-ID der Umgebungsspezifikation für die Endpunktbereitstellung. | Schnur |
environmentVariables | Umgebungsvariablenkonfiguration für die Bereitstellung. | EndpointDeploymentPropertiesBaseEnvironmentVariables |
instanceType | Computeinstanztyp. | Schnur |
livenessProbe | Liveness-Probe überwacht die Integrität des Containers regelmäßig. | ProbeSettings |
Modell | Der URI-Pfad zum Modell. | Schnur |
modelMountPath | Der Pfad zum Bereitstellen des Modells im benutzerdefinierten Container. | Schnur |
Eigenschaften | Eigenschaftenwörterbuch. Eigenschaften können hinzugefügt, aber nicht entfernt oder geändert werden. | EndpointDeploymentPropertiesBaseProperties |
readinessProbe | Die Bereitschaftssonde überprüft, ob der Container für den Datenverkehr bereit ist. Die Eigenschaften und Standardwerte sind identisch mit der Livenesssonde. | ProbeSettings |
requestSettings | Fordern Sie Einstellungen für die Bereitstellung an. | OnlineRequestSettings |
scaleSettings | Skalierungseinstellungen für die Bereitstellung. Wenn er null ist oder nicht angegeben wird, standardmäßig "TargetUtilizationScaleSettings" für KubernetesOnlineDeployment und in DefaultScaleSettings für ManagedOnlineDeployment. |
OnlineScaleSettings- |
OnlineRequestSettings
Name | Beschreibung | Wert |
---|---|---|
maxConcurrentRequestsPerInstance | Die Anzahl der maximalen gleichzeitigen Anforderungen pro Knoten pro Bereitstellung zulässig. Standardwert ist 1. | Int |
maxQueueWait | Die maximale Zeitspanne, die eine Anforderung in der Warteschlange im ISO 8601-Format verbleibt. Der Standardwert ist 500 ms. |
Schnur |
requestTimeout | Das Bewertungstimeout im ISO 8601-Format. Der Standardwert ist 5000 ms. |
Schnur |
OnlineScaleSettings
Name | Beschreibung | Wert |
---|---|---|
scaleType | Legen Sie für den Typ DefaultScaleSettingsauf "Default" fest. Legen Sie für den Typ TargetUtilizationScaleSettingsauf 'TargetUtilizationScaleSettings' fest. | 'Standard' 'TargetUtilization' (erforderlich) |
ProbeSettings
Name | Beschreibung | Wert |
---|---|---|
failureThreshold | Die Anzahl der Fehler, die zugelassen werden sollen, bevor ein fehlerhafter Status zurückgegeben wird. | Int |
initialDelay | Die Verzögerung vor der ersten Probe im ISO 8601-Format. | Schnur |
Periode | Die Dauer zwischen Probes im ISO 8601-Format. | Schnur |
successThreshold | Die Anzahl der erfolgreichen Probe, bevor ein fehlerfreier Status zurückgegeben wird. | Int |
Zeitüberschreitung | Das Timeout der Probe im ISO 8601-Format. | Schnur |
Sku
Name | Beschreibung | Wert |
---|---|---|
Fassungsvermögen | Wenn die SKU skalierungs-/in unterstützt, sollte die Ganze Kapazität eingeschlossen werden. Wenn eine Skalierung für die Ressource nicht möglich ist, wird dies möglicherweise weggelassen. | Int |
Familie | Wenn der Dienst über unterschiedliche Hardwaregenerationen verfügt, kann dies für dieselbe SKU hier erfasst werden. | Schnur |
Name | Der Name der SKU. Ex - P3. Es handelt sich in der Regel um einen Buchstaben+Zahlencode. | Zeichenfolge (erforderlich) |
Größe | Die SKU-Größe. Wenn das Namensfeld die Kombination aus Ebene und einem anderen Wert ist, wäre dies der eigenständige Code. | Schnur |
Rang | Dieses Feld muss vom Ressourcenanbieter implementiert werden, wenn der Dienst mehr als eine Ebene aufweist, für einen PUT jedoch nicht erforderlich ist. | "Einfach" "Kostenlos" "Premium" "Standard" |
TargetUtilizationScaleSettings
Name | Beschreibung | Wert |
---|---|---|
maxInstances | Die maximale Anzahl von Instanzen, auf die die Bereitstellung skaliert werden kann. Das Kontingent wird für max_instances reserviert. | Int |
minInstances | Die Mindestanzahl der Instanzen, die immer vorhanden sein sollen. | Int |
pollingInterval | Das Abrufintervall im ISO 8691-Format. Unterstützt nur die Dauer mit der Genauigkeit so niedrig wie Sekunden. | Schnur |
scaleType | [Erforderlich] Art des Bereitstellungsskalierungsalgorithmus | 'TargetUtilization' (erforderlich) |
targetUtilizationPercentage | Die CPU-Zielauslastung für die Autoscaler. | Int |
TrackedResourceTags
Name | Beschreibung | Wert |
---|
UserAssignedIdentities
Name | Beschreibung | Wert |
---|
UserAssignedIdentity
Name | Beschreibung | Wert |
---|
ARM-Vorlagenressourcendefinition
Der Ressourcentyp "workspaces/onlineEndpoints/deployments" kann mit Vorgängen bereitgestellt werden, die auf Folgendes abzielen:
- Ressourcengruppen – Siehe Ressourcengruppenbereitstellungsbefehle
Eine Liste der geänderten Eigenschaften in jeder API-Version finden Sie unter Änderungsprotokoll.
Ressourcenformat
Um eine Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments-Ressource zu erstellen, fügen Sie ihrer Vorlage den folgenden JSON-Code hinzu.
{
"type": "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments",
"apiVersion": "2022-12-01-preview",
"name": "string",
"identity": {
"type": "string",
"userAssignedIdentities": {
"{customized property}": {
}
}
},
"kind": "string",
"location": "string",
"properties": {
"appInsightsEnabled": "bool",
"codeConfiguration": {
"codeId": "string",
"scoringScript": "string"
},
"description": "string",
"egressPublicNetworkAccess": "string",
"environmentId": "string",
"environmentVariables": {
"{customized property}": "string"
},
"instanceType": "string",
"livenessProbe": {
"failureThreshold": "int",
"initialDelay": "string",
"period": "string",
"successThreshold": "int",
"timeout": "string"
},
"model": "string",
"modelMountPath": "string",
"properties": {
"{customized property}": "string"
},
"readinessProbe": {
"failureThreshold": "int",
"initialDelay": "string",
"period": "string",
"successThreshold": "int",
"timeout": "string"
},
"requestSettings": {
"maxConcurrentRequestsPerInstance": "int",
"maxQueueWait": "string",
"requestTimeout": "string"
},
"scaleSettings": {
"scaleType": "string"
// For remaining properties, see OnlineScaleSettings objects
},
"endpointComputeType": "string"
// For remaining properties, see OnlineDeploymentProperties objects
},
"sku": {
"capacity": "int",
"family": "string",
"name": "string",
"size": "string",
"tier": "string"
},
"tags": {
"{customized property}": "string"
}
}
OnlineScaleSettings-Objekte
Legen Sie die scaleType--Eigenschaft fest, um den Objekttyp anzugeben.
Verwenden Sie für Standard-:
{
"scaleType": "Default"
}
Verwenden Sie für TargetUtilization-Folgendes:
{
"maxInstances": "int",
"minInstances": "int",
"pollingInterval": "string",
"scaleType": "TargetUtilization",
"targetUtilizationPercentage": "int"
}
OnlineDeploymentProperties-Objekte
Legen Sie die eigenschaft endpointComputeType fest, um den Objekttyp anzugeben.
Verwenden Sie für Kubernetes:
{
"containerResourceRequirements": {
"containerResourceLimits": {
"cpu": "string",
"gpu": "string",
"memory": "string"
},
"containerResourceRequests": {
"cpu": "string",
"gpu": "string",
"memory": "string"
}
},
"endpointComputeType": "Kubernetes"
}
Verwenden Sie für verwaltete:
{
"endpointComputeType": "Managed"
}
Eigenschaftswerte
CodeConfiguration
Name | Beschreibung | Wert |
---|---|---|
codeId | ARM-Ressourcen-ID der Coderessource. | Schnur |
scoringScript | [Erforderlich] Das Skript, das beim Start ausgeführt werden soll. Zb. "score.py" | Schnur Zwänge: Min. Länge = 1 Pattern = [a-zA-Z0-9_] (erforderlich) |
ContainerResourceRequirements
Name | Beschreibung | Wert |
---|---|---|
containerResourceLimits | Informationen zum Containerressourcengrenzwert: | ContainerResourceSettings- |
containerResourceRequests | Informationen zur Containerressourcenanforderung: | ContainerResourceSettings- |
ContainerResourceSettings
Name | Beschreibung | Wert |
---|---|---|
CPU | Anzahl der vCPUs-Anforderung/Grenzwert für Container. Weitere Informationen: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
Schnur |
gpu | Anzahl der Nvidia GPU-Kartenanforderung/-limit für Container. Weitere Informationen: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
Schnur |
Gedächtnis | Anforderung/Grenzwert für Speichergröße für Container. Weitere Informationen: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
Schnur |
DefaultScaleSettings
Name | Beschreibung | Wert |
---|---|---|
scaleType | [Erforderlich] Art des Bereitstellungsskalierungsalgorithmus | 'Standard' (erforderlich) |
EndpointDeploymentPropertiesBaseEnvironmentVariables
Name | Beschreibung | Wert |
---|
EndpointDeploymentPropertiesBaseProperties
Name | Beschreibung | Wert |
---|
KubernetesOnlineDeployment
Name | Beschreibung | Wert |
---|---|---|
containerResourceRequirements | Die Ressourcenanforderungen für den Container (CPU und Arbeitsspeicher). | ContainerResourceRequirements |
endpointComputeType | [Erforderlich] Der Computetyp des Endpunkts. | 'Kubernetes' (erforderlich) |
ManagedOnlineDeployment
Name | Beschreibung | Wert |
---|---|---|
endpointComputeType | [Erforderlich] Der Computetyp des Endpunkts. | "Verwaltet" (erforderlich) |
ManagedServiceIdentity
Name | Beschreibung | Wert |
---|---|---|
Art | Typ der verwalteten Dienstidentität (wobei systemAssigned- und UserAssigned-Typen zulässig sind). | 'None' 'SystemAssigned' "SystemAssigned,UserAssigned" "UserAssigned" (erforderlich) |
userAssignedIdentities | Die Gruppe der benutzerzuweisungen Identitäten, die der Ressource zugeordnet sind. Die Wörterbuchschlüssel "userAssignedIdentities" sind ARM-Ressourcen-IDs im Formular: '/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. Die Wörterbuchwerte können leere Objekte ({}) in Anforderungen sein. | UserAssignedIdentities- |
Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments
Name | Beschreibung | Wert |
---|---|---|
apiVersion | Die API-Version | "2022-12-01-preview" |
Identität | Verwaltete Dienstidentität (vom System zugewiesene und/oder vom Benutzer zugewiesene Identitäten) | ManagedServiceIdentity- |
Art | Metadaten, die von Portal/Tooling/etc. verwendet werden, um unterschiedliche UX-Oberflächen für Ressourcen desselben Typs zu rendern. | Schnur |
Ort | Der geografische Standort, an dem sich die Ressource befindet | Zeichenfolge (erforderlich) |
Name | Der Ressourcenname | Schnur Zwänge: Pattern = ^[a-zA-Z0-9][a-zA-Z0-9\-_]{0,254}$ (erforderlich) |
Eigenschaften | [Erforderlich] Zusätzliche Attribute der Entität. | OnlineDeploymentProperties (erforderlich) |
Sku | Sku-Details, die für den ARM-Vertrag für die automatische Skalierung erforderlich sind. | Sku- |
Schilder | Ressourcentags | Wörterbuch der Tagnamen und -werte. Siehe Tags in Vorlagen |
Art | Der Ressourcentyp | "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments" |
OnlineDeploymentProperties
Name | Beschreibung | Wert |
---|---|---|
appInsightsEnabled | Wenn wahr, aktiviert die Application Insights-Protokollierung. | Bool |
codeConfiguration | Codekonfiguration für die Endpunktbereitstellung. | CodeConfiguration- |
Beschreibung | Beschreibung der Endpunktbereitstellung. | Schnur |
egressPublicNetworkAccess | Wenn aktiviert, lassen Sie den Zugriff auf öffentliche Netzwerke zu. Wenn deaktiviert, wird dadurch ein sicherer Ausgang erstellt. Standard: Aktiviert. | "Deaktiviert" "Aktiviert" |
endpointComputeType | Legen Sie für den Typ KubernetesOnlineDeploymentauf "Kubernetes" fest. Legen Sie für den Typ ManagedOnlineDeployment-auf "Verwaltet" fest. | 'Kubernetes' "Verwaltet" (erforderlich) |
environmentId | ARM-Ressourcen-ID der Umgebungsspezifikation für die Endpunktbereitstellung. | Schnur |
environmentVariables | Umgebungsvariablenkonfiguration für die Bereitstellung. | EndpointDeploymentPropertiesBaseEnvironmentVariables |
instanceType | Computeinstanztyp. | Schnur |
livenessProbe | Liveness-Probe überwacht die Integrität des Containers regelmäßig. | ProbeSettings |
Modell | Der URI-Pfad zum Modell. | Schnur |
modelMountPath | Der Pfad zum Bereitstellen des Modells im benutzerdefinierten Container. | Schnur |
Eigenschaften | Eigenschaftenwörterbuch. Eigenschaften können hinzugefügt, aber nicht entfernt oder geändert werden. | EndpointDeploymentPropertiesBaseProperties |
readinessProbe | Die Bereitschaftssonde überprüft, ob der Container für den Datenverkehr bereit ist. Die Eigenschaften und Standardwerte sind identisch mit der Livenesssonde. | ProbeSettings |
requestSettings | Fordern Sie Einstellungen für die Bereitstellung an. | OnlineRequestSettings |
scaleSettings | Skalierungseinstellungen für die Bereitstellung. Wenn er null ist oder nicht angegeben wird, standardmäßig "TargetUtilizationScaleSettings" für KubernetesOnlineDeployment und in DefaultScaleSettings für ManagedOnlineDeployment. |
OnlineScaleSettings- |
OnlineRequestSettings
Name | Beschreibung | Wert |
---|---|---|
maxConcurrentRequestsPerInstance | Die Anzahl der maximalen gleichzeitigen Anforderungen pro Knoten pro Bereitstellung zulässig. Standardwert ist 1. | Int |
maxQueueWait | Die maximale Zeitspanne, die eine Anforderung in der Warteschlange im ISO 8601-Format verbleibt. Der Standardwert ist 500 ms. |
Schnur |
requestTimeout | Das Bewertungstimeout im ISO 8601-Format. Der Standardwert ist 5000 ms. |
Schnur |
OnlineScaleSettings
Name | Beschreibung | Wert |
---|---|---|
scaleType | Legen Sie für den Typ DefaultScaleSettingsauf "Default" fest. Legen Sie für den Typ TargetUtilizationScaleSettingsauf 'TargetUtilizationScaleSettings' fest. | 'Standard' 'TargetUtilization' (erforderlich) |
ProbeSettings
Name | Beschreibung | Wert |
---|---|---|
failureThreshold | Die Anzahl der Fehler, die zugelassen werden sollen, bevor ein fehlerhafter Status zurückgegeben wird. | Int |
initialDelay | Die Verzögerung vor der ersten Probe im ISO 8601-Format. | Schnur |
Periode | Die Dauer zwischen Probes im ISO 8601-Format. | Schnur |
successThreshold | Die Anzahl der erfolgreichen Probe, bevor ein fehlerfreier Status zurückgegeben wird. | Int |
Zeitüberschreitung | Das Timeout der Probe im ISO 8601-Format. | Schnur |
Sku
Name | Beschreibung | Wert |
---|---|---|
Fassungsvermögen | Wenn die SKU skalierungs-/in unterstützt, sollte die Ganze Kapazität eingeschlossen werden. Wenn eine Skalierung für die Ressource nicht möglich ist, wird dies möglicherweise weggelassen. | Int |
Familie | Wenn der Dienst über unterschiedliche Hardwaregenerationen verfügt, kann dies für dieselbe SKU hier erfasst werden. | Schnur |
Name | Der Name der SKU. Ex - P3. Es handelt sich in der Regel um einen Buchstaben+Zahlencode. | Zeichenfolge (erforderlich) |
Größe | Die SKU-Größe. Wenn das Namensfeld die Kombination aus Ebene und einem anderen Wert ist, wäre dies der eigenständige Code. | Schnur |
Rang | Dieses Feld muss vom Ressourcenanbieter implementiert werden, wenn der Dienst mehr als eine Ebene aufweist, für einen PUT jedoch nicht erforderlich ist. | "Einfach" "Kostenlos" "Premium" "Standard" |
TargetUtilizationScaleSettings
Name | Beschreibung | Wert |
---|---|---|
maxInstances | Die maximale Anzahl von Instanzen, auf die die Bereitstellung skaliert werden kann. Das Kontingent wird für max_instances reserviert. | Int |
minInstances | Die Mindestanzahl der Instanzen, die immer vorhanden sein sollen. | Int |
pollingInterval | Das Abrufintervall im ISO 8691-Format. Unterstützt nur die Dauer mit der Genauigkeit so niedrig wie Sekunden. | Schnur |
scaleType | [Erforderlich] Art des Bereitstellungsskalierungsalgorithmus | 'TargetUtilization' (erforderlich) |
targetUtilizationPercentage | Die CPU-Zielauslastung für die Autoscaler. | Int |
TrackedResourceTags
Name | Beschreibung | Wert |
---|
UserAssignedIdentities
Name | Beschreibung | Wert |
---|
UserAssignedIdentity
Name | Beschreibung | Wert |
---|
Terraform -Ressourcendefinition (AzAPI-Anbieter)
Der Ressourcentyp "workspaces/onlineEndpoints/deployments" kann mit Vorgängen bereitgestellt werden, die auf Folgendes abzielen:
- Ressourcengruppen
Eine Liste der geänderten Eigenschaften in jeder API-Version finden Sie unter Änderungsprotokoll.
Ressourcenformat
Um eine Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments-Ressource zu erstellen, fügen Sie Ihrer Vorlage die folgende Terraform hinzu.
resource "azapi_resource" "symbolicname" {
type = "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2022-12-01-preview"
name = "string"
identity = {
type = "string"
userAssignedIdentities = {
{customized property} = {
}
}
}
kind = "string"
location = "string"
sku = {
capacity = int
family = "string"
name = "string"
size = "string"
tier = "string"
}
tags = {
{customized property} = "string"
}
body = jsonencode({
properties = {
appInsightsEnabled = bool
codeConfiguration = {
codeId = "string"
scoringScript = "string"
}
description = "string"
egressPublicNetworkAccess = "string"
environmentId = "string"
environmentVariables = {
{customized property} = "string"
}
instanceType = "string"
livenessProbe = {
failureThreshold = int
initialDelay = "string"
period = "string"
successThreshold = int
timeout = "string"
}
model = "string"
modelMountPath = "string"
properties = {
{customized property} = "string"
}
readinessProbe = {
failureThreshold = int
initialDelay = "string"
period = "string"
successThreshold = int
timeout = "string"
}
requestSettings = {
maxConcurrentRequestsPerInstance = int
maxQueueWait = "string"
requestTimeout = "string"
}
scaleSettings = {
scaleType = "string"
// For remaining properties, see OnlineScaleSettings objects
}
endpointComputeType = "string"
// For remaining properties, see OnlineDeploymentProperties objects
}
})
}
OnlineScaleSettings-Objekte
Legen Sie die scaleType--Eigenschaft fest, um den Objekttyp anzugeben.
Verwenden Sie für Standard-:
{
scaleType = "Default"
}
Verwenden Sie für TargetUtilization-Folgendes:
{
maxInstances = int
minInstances = int
pollingInterval = "string"
scaleType = "TargetUtilization"
targetUtilizationPercentage = int
}
OnlineDeploymentProperties-Objekte
Legen Sie die eigenschaft endpointComputeType fest, um den Objekttyp anzugeben.
Verwenden Sie für Kubernetes:
{
containerResourceRequirements = {
containerResourceLimits = {
cpu = "string"
gpu = "string"
memory = "string"
}
containerResourceRequests = {
cpu = "string"
gpu = "string"
memory = "string"
}
}
endpointComputeType = "Kubernetes"
}
Verwenden Sie für verwaltete:
{
endpointComputeType = "Managed"
}
Eigenschaftswerte
CodeConfiguration
Name | Beschreibung | Wert |
---|---|---|
codeId | ARM-Ressourcen-ID der Coderessource. | Schnur |
scoringScript | [Erforderlich] Das Skript, das beim Start ausgeführt werden soll. Zb. "score.py" | Schnur Zwänge: Min. Länge = 1 Pattern = [a-zA-Z0-9_] (erforderlich) |
ContainerResourceRequirements
Name | Beschreibung | Wert |
---|---|---|
containerResourceLimits | Informationen zum Containerressourcengrenzwert: | ContainerResourceSettings- |
containerResourceRequests | Informationen zur Containerressourcenanforderung: | ContainerResourceSettings- |
ContainerResourceSettings
Name | Beschreibung | Wert |
---|---|---|
CPU | Anzahl der vCPUs-Anforderung/Grenzwert für Container. Weitere Informationen: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
Schnur |
gpu | Anzahl der Nvidia GPU-Kartenanforderung/-limit für Container. Weitere Informationen: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
Schnur |
Gedächtnis | Anforderung/Grenzwert für Speichergröße für Container. Weitere Informationen: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
Schnur |
DefaultScaleSettings
Name | Beschreibung | Wert |
---|---|---|
scaleType | [Erforderlich] Art des Bereitstellungsskalierungsalgorithmus | 'Standard' (erforderlich) |
EndpointDeploymentPropertiesBaseEnvironmentVariables
Name | Beschreibung | Wert |
---|
EndpointDeploymentPropertiesBaseProperties
Name | Beschreibung | Wert |
---|
KubernetesOnlineDeployment
Name | Beschreibung | Wert |
---|---|---|
containerResourceRequirements | Die Ressourcenanforderungen für den Container (CPU und Arbeitsspeicher). | ContainerResourceRequirements |
endpointComputeType | [Erforderlich] Der Computetyp des Endpunkts. | 'Kubernetes' (erforderlich) |
ManagedOnlineDeployment
Name | Beschreibung | Wert |
---|---|---|
endpointComputeType | [Erforderlich] Der Computetyp des Endpunkts. | "Verwaltet" (erforderlich) |
ManagedServiceIdentity
Name | Beschreibung | Wert |
---|---|---|
Art | Typ der verwalteten Dienstidentität (wobei systemAssigned- und UserAssigned-Typen zulässig sind). | 'None' 'SystemAssigned' "SystemAssigned,UserAssigned" "UserAssigned" (erforderlich) |
userAssignedIdentities | Die Gruppe der benutzerzuweisungen Identitäten, die der Ressource zugeordnet sind. Die Wörterbuchschlüssel "userAssignedIdentities" sind ARM-Ressourcen-IDs im Formular: '/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. Die Wörterbuchwerte können leere Objekte ({}) in Anforderungen sein. | UserAssignedIdentities- |
Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments
Name | Beschreibung | Wert |
---|---|---|
Identität | Verwaltete Dienstidentität (vom System zugewiesene und/oder vom Benutzer zugewiesene Identitäten) | ManagedServiceIdentity- |
Art | Metadaten, die von Portal/Tooling/etc. verwendet werden, um unterschiedliche UX-Oberflächen für Ressourcen desselben Typs zu rendern. | Schnur |
Ort | Der geografische Standort, an dem sich die Ressource befindet | Zeichenfolge (erforderlich) |
Name | Der Ressourcenname | Schnur Zwänge: Pattern = ^[a-zA-Z0-9][a-zA-Z0-9\-_]{0,254}$ (erforderlich) |
parent_id | Die ID der Ressource, die das übergeordnete Element für diese Ressource ist. | ID für Ressource des Typs: Arbeitsbereiche/onlineEndpoints |
Eigenschaften | [Erforderlich] Zusätzliche Attribute der Entität. | OnlineDeploymentProperties (erforderlich) |
Sku | Sku-Details, die für den ARM-Vertrag für die automatische Skalierung erforderlich sind. | Sku- |
Schilder | Ressourcentags | Wörterbuch der Tagnamen und -werte. |
Art | Der Ressourcentyp | "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2022-12-01-preview" |
OnlineDeploymentProperties
Name | Beschreibung | Wert |
---|---|---|
appInsightsEnabled | Wenn wahr, aktiviert die Application Insights-Protokollierung. | Bool |
codeConfiguration | Codekonfiguration für die Endpunktbereitstellung. | CodeConfiguration- |
Beschreibung | Beschreibung der Endpunktbereitstellung. | Schnur |
egressPublicNetworkAccess | Wenn aktiviert, lassen Sie den Zugriff auf öffentliche Netzwerke zu. Wenn deaktiviert, wird dadurch ein sicherer Ausgang erstellt. Standard: Aktiviert. | "Deaktiviert" "Aktiviert" |
endpointComputeType | Legen Sie für den Typ KubernetesOnlineDeploymentauf "Kubernetes" fest. Legen Sie für den Typ ManagedOnlineDeployment-auf "Verwaltet" fest. | 'Kubernetes' "Verwaltet" (erforderlich) |
environmentId | ARM-Ressourcen-ID der Umgebungsspezifikation für die Endpunktbereitstellung. | Schnur |
environmentVariables | Umgebungsvariablenkonfiguration für die Bereitstellung. | EndpointDeploymentPropertiesBaseEnvironmentVariables |
instanceType | Computeinstanztyp. | Schnur |
livenessProbe | Liveness-Probe überwacht die Integrität des Containers regelmäßig. | ProbeSettings |
Modell | Der URI-Pfad zum Modell. | Schnur |
modelMountPath | Der Pfad zum Bereitstellen des Modells im benutzerdefinierten Container. | Schnur |
Eigenschaften | Eigenschaftenwörterbuch. Eigenschaften können hinzugefügt, aber nicht entfernt oder geändert werden. | EndpointDeploymentPropertiesBaseProperties |
readinessProbe | Die Bereitschaftssonde überprüft, ob der Container für den Datenverkehr bereit ist. Die Eigenschaften und Standardwerte sind identisch mit der Livenesssonde. | ProbeSettings |
requestSettings | Fordern Sie Einstellungen für die Bereitstellung an. | OnlineRequestSettings |
scaleSettings | Skalierungseinstellungen für die Bereitstellung. Wenn er null ist oder nicht angegeben wird, standardmäßig "TargetUtilizationScaleSettings" für KubernetesOnlineDeployment und in DefaultScaleSettings für ManagedOnlineDeployment. |
OnlineScaleSettings- |
OnlineRequestSettings
Name | Beschreibung | Wert |
---|---|---|
maxConcurrentRequestsPerInstance | Die Anzahl der maximalen gleichzeitigen Anforderungen pro Knoten pro Bereitstellung zulässig. Standardwert ist 1. | Int |
maxQueueWait | Die maximale Zeitspanne, die eine Anforderung in der Warteschlange im ISO 8601-Format verbleibt. Der Standardwert ist 500 ms. |
Schnur |
requestTimeout | Das Bewertungstimeout im ISO 8601-Format. Der Standardwert ist 5000 ms. |
Schnur |
OnlineScaleSettings
Name | Beschreibung | Wert |
---|---|---|
scaleType | Legen Sie für den Typ DefaultScaleSettingsauf "Default" fest. Legen Sie für den Typ TargetUtilizationScaleSettingsauf 'TargetUtilizationScaleSettings' fest. | 'Standard' 'TargetUtilization' (erforderlich) |
ProbeSettings
Name | Beschreibung | Wert |
---|---|---|
failureThreshold | Die Anzahl der Fehler, die zugelassen werden sollen, bevor ein fehlerhafter Status zurückgegeben wird. | Int |
initialDelay | Die Verzögerung vor der ersten Probe im ISO 8601-Format. | Schnur |
Periode | Die Dauer zwischen Probes im ISO 8601-Format. | Schnur |
successThreshold | Die Anzahl der erfolgreichen Probe, bevor ein fehlerfreier Status zurückgegeben wird. | Int |
Zeitüberschreitung | Das Timeout der Probe im ISO 8601-Format. | Schnur |
Sku
Name | Beschreibung | Wert |
---|---|---|
Fassungsvermögen | Wenn die SKU skalierungs-/in unterstützt, sollte die Ganze Kapazität eingeschlossen werden. Wenn eine Skalierung für die Ressource nicht möglich ist, wird dies möglicherweise weggelassen. | Int |
Familie | Wenn der Dienst über unterschiedliche Hardwaregenerationen verfügt, kann dies für dieselbe SKU hier erfasst werden. | Schnur |
Name | Der Name der SKU. Ex - P3. Es handelt sich in der Regel um einen Buchstaben+Zahlencode. | Zeichenfolge (erforderlich) |
Größe | Die SKU-Größe. Wenn das Namensfeld die Kombination aus Ebene und einem anderen Wert ist, wäre dies der eigenständige Code. | Schnur |
Rang | Dieses Feld muss vom Ressourcenanbieter implementiert werden, wenn der Dienst mehr als eine Ebene aufweist, für einen PUT jedoch nicht erforderlich ist. | "Einfach" "Kostenlos" "Premium" "Standard" |
TargetUtilizationScaleSettings
Name | Beschreibung | Wert |
---|---|---|
maxInstances | Die maximale Anzahl von Instanzen, auf die die Bereitstellung skaliert werden kann. Das Kontingent wird für max_instances reserviert. | Int |
minInstances | Die Mindestanzahl der Instanzen, die immer vorhanden sein sollen. | Int |
pollingInterval | Das Abrufintervall im ISO 8691-Format. Unterstützt nur die Dauer mit der Genauigkeit so niedrig wie Sekunden. | Schnur |
scaleType | [Erforderlich] Art des Bereitstellungsskalierungsalgorithmus | 'TargetUtilization' (erforderlich) |
targetUtilizationPercentage | Die CPU-Zielauslastung für die Autoscaler. | Int |
TrackedResourceTags
Name | Beschreibung | Wert |
---|
UserAssignedIdentities
Name | Beschreibung | Wert |
---|
UserAssignedIdentity
Name | Beschreibung | Wert |
---|