Microsoft.MachineLearningServices-Arbeitsbereiche/onlineEndpoints/deployments 2021-03-01-preview
- Neueste
- 2024-10-01
- 2024-10-01-Vorschau-
- 2024-07-01-Preview-
- 2024-04-01
- 2024-04-01-Preview-
- 2024-01-01-Preview-
- 2023-10-01
- 2023-08-01-Preview-
- 2023-06-01-Preview-
- 2023-04-01
- 2023-04-01-Preview-
- 2023-02-01-Vorschau-
- 2022-12-01-Vorschau-
- 2022-10-01
- 2022-10-01-Preview-
- 2022-06-01-Preview-
- 2022-05-01
- 2022-02-01-Preview-
- 2021-03-01-Preview-
Bicep-Ressourcendefinition
Der Ressourcentyp "workspaces/onlineEndpoints/deployments" kann mit Vorgängen bereitgestellt werden, die auf Folgendes abzielen:
- Ressourcengruppen – Siehe Ressourcengruppenbereitstellungsbefehle
Eine Liste der geänderten Eigenschaften in jeder API-Version finden Sie unter Änderungsprotokoll.
Ressourcenformat
Um eine Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments-Ressource zu erstellen, fügen Sie ihrer Vorlage die folgende Bicep hinzu.
resource symbolicname 'Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2021-03-01-preview' = {
parent: resourceSymbolicName
identity: {
type: 'string'
userAssignedIdentities: {
{customized property}: {
clientId: 'string'
principalId: 'string'
}
}
}
kind: 'string'
location: 'string'
name: 'string'
properties: {
appInsightsEnabled: bool
codeConfiguration: {
codeId: 'string'
scoringScript: 'string'
}
description: 'string'
environmentId: 'string'
environmentVariables: {
{customized property}: 'string'
}
livenessProbe: {
failureThreshold: int
initialDelay: 'string'
period: 'string'
successThreshold: int
timeout: 'string'
}
model: {
referenceType: 'string'
// For remaining properties, see AssetReferenceBase objects
}
properties: {
{customized property}: 'string'
}
requestSettings: {
maxConcurrentRequestsPerInstance: int
maxQueueWait: 'string'
requestTimeout: 'string'
}
scaleSettings: {
maxInstances: int
minInstances: int
scaleType: 'string'
// For remaining properties, see OnlineScaleSettings objects
}
endpointComputeType: 'string'
// For remaining properties, see OnlineDeployment objects
}
tags: {
{customized property}: 'string'
}
}
AssetReferenceBase-Objekte
Legen Sie die referenceType-Eigenschaft fest, um den Objekttyp anzugeben.
Verwenden Sie für DataPath-:
{
datastoreId: 'string'
path: 'string'
referenceType: 'DataPath'
}
Verwenden Sie für -ID-:
{
assetId: 'string'
referenceType: 'Id'
}
Verwenden Sie für OutputPath-:
{
jobId: 'string'
path: 'string'
referenceType: 'OutputPath'
}
OnlineDeployment-Objekte
Legen Sie die eigenschaft endpointComputeType fest, um den Objekttyp anzugeben.
Verwenden Sie für K8S-:
{
containerResourceRequirements: {
cpu: int
cpuLimit: int
fpga: int
gpu: int
memoryInGB: int
memoryInGBLimit: int
}
endpointComputeType: 'K8S'
}
Verwenden Sie für verwaltete:
{
endpointComputeType: 'Managed'
instanceType: 'string'
readinessProbe: {
failureThreshold: int
initialDelay: 'string'
period: 'string'
successThreshold: int
timeout: 'string'
}
}
OnlineScaleSettings-Objekte
Legen Sie die scaleType--Eigenschaft fest, um den Objekttyp anzugeben.
Verwenden Sie für automatischenFolgendes:
{
pollingInterval: 'string'
scaleType: 'Auto'
targetUtilizationPercentage: int
}
Verwenden Sie für manuellen:
{
instanceCount: int
scaleType: 'Manual'
}
Eigenschaftswerte
AssetReferenceBase
Name | Beschreibung | Wert |
---|---|---|
referenceType | Legen Sie für den Typ DataPathAssetReference-auf "DataPath" fest. Set to 'ID' for type IdAssetReference. Legen Sie für den Typ OutputPathAssetReferenceauf 'OutputPath' fest. | 'DataPath' 'ID' 'OutputPath' (erforderlich) |
AutoScaleSettings
Name | Beschreibung | Wert |
---|---|---|
pollingInterval | Das Abrufintervall im ISO 8691-Format. Unterstützt nur die Dauer mit der Genauigkeit so niedrig wie Sekunden. | Schnur |
scaleType | [Erforderlich] Art des Bereitstellungsskalierungsalgorithmus | "Auto" (erforderlich) |
targetUtilizationPercentage | Die CPU-Zielauslastung für die Autoscaler. | Int |
CodeConfiguration
Name | Beschreibung | Wert |
---|---|---|
codeId | ARM-Ressourcen-ID der Coderessource. | Schnur |
scoringScript | [Erforderlich] Das Skript, das beim Start ausgeführt werden soll. Zb. "score.py" | Schnur Zwänge: Min. Länge = 1 Pattern = [a-zA-Z0-9_] (erforderlich) |
ContainerResourceRequirements
Name | Beschreibung | Wert |
---|---|---|
CPU | Die Mindestmenge an CPU-Kernen, die vom Container verwendet werden sollen. Weitere Informationen: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
Int |
cpuLimit | Die maximale Anzahl von CPU-Kernen, die vom Container verwendet werden dürfen. Weitere Informationen: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
Int |
fpga | Die Anzahl der FÜR den Container verfügbar gemachten FPGA PCIE-Geräte. Muss ein Vielfaches von 2 sein. | Int |
gpu | Die Anzahl der GPU-Kerne im Container. | Int |
memoryInGB | Die mindeste Arbeitsspeichermenge (in GB), die vom Container verwendet werden soll. Weitere Informationen: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
Int |
memoryInGBLimit | Die maximale Speichermenge (in GB), die vom Container verwendet werden darf. Weitere Informationen: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
Int |
DataPathAssetReference
Name | Beschreibung | Wert |
---|---|---|
datastoreId | ARM-Ressourcen-ID des Datenspeichers, in dem sich die Ressource befindet. | Schnur |
Pfad | Der Pfad der Datei/des Verzeichnisses im Datenspeicher. | Schnur |
referenceType | [Erforderlich] Gibt den Typ des Objektverweises an. | 'DataPath' (erforderlich) |
IdAssetReference
Name | Beschreibung | Wert |
---|---|---|
assetId | [Erforderlich] ARM-Ressourcen-ID der Ressource. | Schnur Zwänge: Pattern = [a-zA-Z0-9_] (erforderlich) |
referenceType | [Erforderlich] Gibt den Typ des Objektverweises an. | 'ID' (erforderlich) |
K8SOnlineDeployment
Name | Beschreibung | Wert |
---|---|---|
containerResourceRequirements | Ressourcenanforderungen für jede Containerinstanz innerhalb einer Onlinebereitstellung. | ContainerResourceRequirements |
endpointComputeType | [Erforderlich] Der Computetyp des Endpunkts. | 'K8S' (erforderlich) |
ManagedOnlineDeployment
Name | Beschreibung | Wert |
---|---|---|
endpointComputeType | [Erforderlich] Der Computetyp des Endpunkts. | "Verwaltet" (erforderlich) |
instanceType | Computeinstanztyp. | Schnur |
readinessProbe | Konfiguration der Bereitstellungscontainer-Live-/Bereitschaftstestkonfiguration. | ProbeSettings |
ManualScaleSettings
Name | Beschreibung | Wert |
---|---|---|
instanceCount | Die Anzahl der Instanzen für diese Bereitstellung wurde behoben. | Int |
scaleType | [Erforderlich] Art des Bereitstellungsskalierungsalgorithmus | "Manuell" (erforderlich) |
Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments
Name | Beschreibung | Wert |
---|---|---|
Identität | Dienstidentität, die einer Ressource zugeordnet ist. | ResourceIdentity- |
Art | Metadaten, die von Portal/Tooling/etc. verwendet werden, um unterschiedliche UX-Oberflächen für Ressourcen desselben Typs zu rendern. | Schnur |
Ort | Der geografische Standort, an dem sich die Ressource befindet | Zeichenfolge (erforderlich) |
Name | Der Ressourcenname | Schnur Zwänge: Pattern = ^[a-zA-Z0-9][a-zA-Z0-9\-_]{0,254}$ (erforderlich) |
Elternteil | In Bicep können Sie die übergeordnete Ressource für eine untergeordnete Ressource angeben. Sie müssen diese Eigenschaft nur hinzufügen, wenn die untergeordnete Ressource außerhalb der übergeordneten Ressource deklariert wird. Weitere Informationen finden Sie unter Untergeordnete Ressource außerhalb der übergeordneten Ressource. |
Symbolischer Name für Ressource des Typs: Arbeitsbereiche/onlineEndpoints |
Eigenschaften | [Erforderlich] Zusätzliche Attribute der Entität. | OnlineDeployment- (erforderlich) |
Schilder | Ressourcentags | Wörterbuch der Tagnamen und -werte. Siehe Tags in Vorlagen |
OnlineDeployment
Name | Beschreibung | Wert |
---|---|---|
appInsightsEnabled | Wenn wahr, aktiviert die Application Insights-Protokollierung. | Bool |
codeConfiguration | Codekonfiguration für die Endpunktbereitstellung. | CodeConfiguration- |
Beschreibung | Beschreibung der Endpunktbereitstellung. | Schnur |
endpointComputeType | Legen Sie für den Typ K8SOnlineDeploymentauf "K8S" fest. Legen Sie für den Typ ManagedOnlineDeployment-auf "Verwaltet" fest. | 'K8S' "Verwaltet" (erforderlich) |
environmentId | ARM-Ressourcen-ID der Umgebungsspezifikation für die Endpunktbereitstellung. | Schnur |
environmentVariables | Umgebungsvariablenkonfiguration für die Bereitstellung. | OnlineDeploymentEnvironmentVariables- |
livenessProbe | Konfiguration der Bereitstellungscontainer-Live-/Bereitschaftstestkonfiguration. | ProbeSettings |
Modell | Verweis auf die Modellressource für die Endpunktbereitstellung. | AssetReferenceBase- |
Eigenschaften | Eigenschaftenwörterbuch. Eigenschaften können hinzugefügt, aber nicht entfernt oder geändert werden. | OnlineDeploymentProperties- |
requestSettings | Konfiguration von Onlinebereitstellungsbewertungsanforderungen. | OnlineRequestSettings |
scaleSettings | Konfiguration der Onlinebereitstellungsskalierung. | OnlineScaleSettings- |
OnlineDeploymentEnvironmentVariables
Name | Beschreibung | Wert |
---|
OnlineDeploymentProperties
Name | Beschreibung | Wert |
---|
OnlineRequestSettings
Name | Beschreibung | Wert |
---|---|---|
maxConcurrentRequestsPerInstance | Die Anzahl der Anforderungen, die für diese Bereitstellung gleichzeitig in die Warteschlange gestellt werden dürfen. | Int |
maxQueueWait | Die maximale Wartezeit der Warteschlange im ISO 8601-Format. Unterstützt Millisekundengenauigkeit. | Schnur |
requestTimeout | Das Anforderungstimeout im ISO 8601-Format. Unterstützt Millisekundengenauigkeit. | Schnur |
OnlineScaleSettings
Name | Beschreibung | Wert |
---|---|---|
maxInstances | Maximale Anzahl von Instanzen für diese Bereitstellung. | Int |
minInstances | Mindestanzahl von Instanzen für diese Bereitstellung. | Int |
scaleType | Legen Sie für den Typ AutoScaleSettingsauf "Auto" fest. Set to 'Manual' for type ManualScaleSettings. | "Auto" "Manuell" (erforderlich) |
OutputPathAssetReference
Name | Beschreibung | Wert |
---|---|---|
jobId | ARM-Ressourcen-ID des Auftrags. | Schnur |
Pfad | Der Pfad der Datei/des Verzeichnisses in der Auftragsausgabe. | Schnur |
referenceType | [Erforderlich] Gibt den Typ des Objektverweises an. | 'OutputPath' (erforderlich) |
ProbeSettings
Name | Beschreibung | Wert |
---|---|---|
failureThreshold | Die Anzahl der Fehler, die zugelassen werden sollen, bevor ein fehlerhafter Status zurückgegeben wird. | Int |
initialDelay | Die Verzögerung vor der ersten Probe im ISO 8601-Format. | Schnur |
Periode | Die Dauer zwischen Probes im ISO 8601-Format. | Schnur |
successThreshold | Die Anzahl der erfolgreichen Probe, bevor ein fehlerfreier Status zurückgegeben wird. | Int |
Zeitüberschreitung | Das Timeout der Probe im ISO 8601-Format. | Schnur |
ResourceIdentity
Name | Beschreibung | Wert |
---|---|---|
Art | Definiert Werte für den Typ "ResourceIdentity". | 'None' 'SystemAssigned' "SystemAssigned,UserAssigned" "UserAssigned" |
userAssignedIdentities | Das Wörterbuch der vom Benutzer zugewiesenen Identitäten, schlüssel ist die ARM-Ressourcen-ID der UAI. | ResourceIdentityUserAssignedIdentities- |
ResourceIdentityUserAssignedIdentities
Name | Beschreibung | Wert |
---|
TrackedResourceTags
Name | Beschreibung | Wert |
---|
UserAssignedIdentityMeta
Name | Beschreibung | Wert |
---|---|---|
clientId | Aka application ID, a unique identifier generated by Azure AD that is tied to an application and service principal during its initial provisioning. | Schnur |
principalId | Die Objekt-ID des Dienstprinzipalobjekts für Ihre verwaltete Identität, die verwendet wird, um rollenbasierten Zugriff auf eine Azure-Ressource zu gewähren. | Schnur |
ARM-Vorlagenressourcendefinition
Der Ressourcentyp "workspaces/onlineEndpoints/deployments" kann mit Vorgängen bereitgestellt werden, die auf Folgendes abzielen:
- Ressourcengruppen – Siehe Ressourcengruppenbereitstellungsbefehle
Eine Liste der geänderten Eigenschaften in jeder API-Version finden Sie unter Änderungsprotokoll.
Ressourcenformat
Um eine Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments-Ressource zu erstellen, fügen Sie ihrer Vorlage den folgenden JSON-Code hinzu.
{
"type": "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments",
"apiVersion": "2021-03-01-preview",
"name": "string",
"identity": {
"type": "string",
"userAssignedIdentities": {
"{customized property}": {
"clientId": "string",
"principalId": "string"
}
}
},
"kind": "string",
"location": "string",
"properties": {
"appInsightsEnabled": "bool",
"codeConfiguration": {
"codeId": "string",
"scoringScript": "string"
},
"description": "string",
"environmentId": "string",
"environmentVariables": {
"{customized property}": "string"
},
"livenessProbe": {
"failureThreshold": "int",
"initialDelay": "string",
"period": "string",
"successThreshold": "int",
"timeout": "string"
},
"model": {
"referenceType": "string"
// For remaining properties, see AssetReferenceBase objects
},
"properties": {
"{customized property}": "string"
},
"requestSettings": {
"maxConcurrentRequestsPerInstance": "int",
"maxQueueWait": "string",
"requestTimeout": "string"
},
"scaleSettings": {
"maxInstances": "int",
"minInstances": "int",
"scaleType": "string"
// For remaining properties, see OnlineScaleSettings objects
},
"endpointComputeType": "string"
// For remaining properties, see OnlineDeployment objects
},
"tags": {
"{customized property}": "string"
}
}
AssetReferenceBase-Objekte
Legen Sie die referenceType-Eigenschaft fest, um den Objekttyp anzugeben.
Verwenden Sie für DataPath-:
{
"datastoreId": "string",
"path": "string",
"referenceType": "DataPath"
}
Verwenden Sie für -ID-:
{
"assetId": "string",
"referenceType": "Id"
}
Verwenden Sie für OutputPath-:
{
"jobId": "string",
"path": "string",
"referenceType": "OutputPath"
}
OnlineDeployment-Objekte
Legen Sie die eigenschaft endpointComputeType fest, um den Objekttyp anzugeben.
Verwenden Sie für K8S-:
{
"containerResourceRequirements": {
"cpu": "int",
"cpuLimit": "int",
"fpga": "int",
"gpu": "int",
"memoryInGB": "int",
"memoryInGBLimit": "int"
},
"endpointComputeType": "K8S"
}
Verwenden Sie für verwaltete:
{
"endpointComputeType": "Managed",
"instanceType": "string",
"readinessProbe": {
"failureThreshold": "int",
"initialDelay": "string",
"period": "string",
"successThreshold": "int",
"timeout": "string"
}
}
OnlineScaleSettings-Objekte
Legen Sie die scaleType--Eigenschaft fest, um den Objekttyp anzugeben.
Verwenden Sie für automatischenFolgendes:
{
"pollingInterval": "string",
"scaleType": "Auto",
"targetUtilizationPercentage": "int"
}
Verwenden Sie für manuellen:
{
"instanceCount": "int",
"scaleType": "Manual"
}
Eigenschaftswerte
AssetReferenceBase
Name | Beschreibung | Wert |
---|---|---|
referenceType | Legen Sie für den Typ DataPathAssetReference-auf "DataPath" fest. Set to 'ID' for type IdAssetReference. Legen Sie für den Typ OutputPathAssetReferenceauf 'OutputPath' fest. | 'DataPath' 'ID' 'OutputPath' (erforderlich) |
AutoScaleSettings
Name | Beschreibung | Wert |
---|---|---|
pollingInterval | Das Abrufintervall im ISO 8691-Format. Unterstützt nur die Dauer mit der Genauigkeit so niedrig wie Sekunden. | Schnur |
scaleType | [Erforderlich] Art des Bereitstellungsskalierungsalgorithmus | "Auto" (erforderlich) |
targetUtilizationPercentage | Die CPU-Zielauslastung für die Autoscaler. | Int |
CodeConfiguration
Name | Beschreibung | Wert |
---|---|---|
codeId | ARM-Ressourcen-ID der Coderessource. | Schnur |
scoringScript | [Erforderlich] Das Skript, das beim Start ausgeführt werden soll. Zb. "score.py" | Schnur Zwänge: Min. Länge = 1 Pattern = [a-zA-Z0-9_] (erforderlich) |
ContainerResourceRequirements
Name | Beschreibung | Wert |
---|---|---|
CPU | Die Mindestmenge an CPU-Kernen, die vom Container verwendet werden sollen. Weitere Informationen: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
Int |
cpuLimit | Die maximale Anzahl von CPU-Kernen, die vom Container verwendet werden dürfen. Weitere Informationen: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
Int |
fpga | Die Anzahl der FÜR den Container verfügbar gemachten FPGA PCIE-Geräte. Muss ein Vielfaches von 2 sein. | Int |
gpu | Die Anzahl der GPU-Kerne im Container. | Int |
memoryInGB | Die mindeste Arbeitsspeichermenge (in GB), die vom Container verwendet werden soll. Weitere Informationen: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
Int |
memoryInGBLimit | Die maximale Speichermenge (in GB), die vom Container verwendet werden darf. Weitere Informationen: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
Int |
DataPathAssetReference
Name | Beschreibung | Wert |
---|---|---|
datastoreId | ARM-Ressourcen-ID des Datenspeichers, in dem sich die Ressource befindet. | Schnur |
Pfad | Der Pfad der Datei/des Verzeichnisses im Datenspeicher. | Schnur |
referenceType | [Erforderlich] Gibt den Typ des Objektverweises an. | 'DataPath' (erforderlich) |
IdAssetReference
Name | Beschreibung | Wert |
---|---|---|
assetId | [Erforderlich] ARM-Ressourcen-ID der Ressource. | Schnur Zwänge: Pattern = [a-zA-Z0-9_] (erforderlich) |
referenceType | [Erforderlich] Gibt den Typ des Objektverweises an. | 'ID' (erforderlich) |
K8SOnlineDeployment
Name | Beschreibung | Wert |
---|---|---|
containerResourceRequirements | Ressourcenanforderungen für jede Containerinstanz innerhalb einer Onlinebereitstellung. | ContainerResourceRequirements |
endpointComputeType | [Erforderlich] Der Computetyp des Endpunkts. | 'K8S' (erforderlich) |
ManagedOnlineDeployment
Name | Beschreibung | Wert |
---|---|---|
endpointComputeType | [Erforderlich] Der Computetyp des Endpunkts. | "Verwaltet" (erforderlich) |
instanceType | Computeinstanztyp. | Schnur |
readinessProbe | Konfiguration der Bereitstellungscontainer-Live-/Bereitschaftstestkonfiguration. | ProbeSettings |
ManualScaleSettings
Name | Beschreibung | Wert |
---|---|---|
instanceCount | Die Anzahl der Instanzen für diese Bereitstellung wurde behoben. | Int |
scaleType | [Erforderlich] Art des Bereitstellungsskalierungsalgorithmus | "Manuell" (erforderlich) |
Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments
Name | Beschreibung | Wert |
---|---|---|
apiVersion | Die API-Version | "2021-03-01-preview" |
Identität | Dienstidentität, die einer Ressource zugeordnet ist. | ResourceIdentity- |
Art | Metadaten, die von Portal/Tooling/etc. verwendet werden, um unterschiedliche UX-Oberflächen für Ressourcen desselben Typs zu rendern. | Schnur |
Ort | Der geografische Standort, an dem sich die Ressource befindet | Zeichenfolge (erforderlich) |
Name | Der Ressourcenname | Schnur Zwänge: Pattern = ^[a-zA-Z0-9][a-zA-Z0-9\-_]{0,254}$ (erforderlich) |
Eigenschaften | [Erforderlich] Zusätzliche Attribute der Entität. | OnlineDeployment- (erforderlich) |
Schilder | Ressourcentags | Wörterbuch der Tagnamen und -werte. Siehe Tags in Vorlagen |
Art | Der Ressourcentyp | "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments" |
OnlineDeployment
Name | Beschreibung | Wert |
---|---|---|
appInsightsEnabled | Wenn wahr, aktiviert die Application Insights-Protokollierung. | Bool |
codeConfiguration | Codekonfiguration für die Endpunktbereitstellung. | CodeConfiguration- |
Beschreibung | Beschreibung der Endpunktbereitstellung. | Schnur |
endpointComputeType | Legen Sie für den Typ K8SOnlineDeploymentauf "K8S" fest. Legen Sie für den Typ ManagedOnlineDeployment-auf "Verwaltet" fest. | 'K8S' "Verwaltet" (erforderlich) |
environmentId | ARM-Ressourcen-ID der Umgebungsspezifikation für die Endpunktbereitstellung. | Schnur |
environmentVariables | Umgebungsvariablenkonfiguration für die Bereitstellung. | OnlineDeploymentEnvironmentVariables- |
livenessProbe | Konfiguration der Bereitstellungscontainer-Live-/Bereitschaftstestkonfiguration. | ProbeSettings |
Modell | Verweis auf die Modellressource für die Endpunktbereitstellung. | AssetReferenceBase- |
Eigenschaften | Eigenschaftenwörterbuch. Eigenschaften können hinzugefügt, aber nicht entfernt oder geändert werden. | OnlineDeploymentProperties- |
requestSettings | Konfiguration von Onlinebereitstellungsbewertungsanforderungen. | OnlineRequestSettings |
scaleSettings | Konfiguration der Onlinebereitstellungsskalierung. | OnlineScaleSettings- |
OnlineDeploymentEnvironmentVariables
Name | Beschreibung | Wert |
---|
OnlineDeploymentProperties
Name | Beschreibung | Wert |
---|
OnlineRequestSettings
Name | Beschreibung | Wert |
---|---|---|
maxConcurrentRequestsPerInstance | Die Anzahl der Anforderungen, die für diese Bereitstellung gleichzeitig in die Warteschlange gestellt werden dürfen. | Int |
maxQueueWait | Die maximale Wartezeit der Warteschlange im ISO 8601-Format. Unterstützt Millisekundengenauigkeit. | Schnur |
requestTimeout | Das Anforderungstimeout im ISO 8601-Format. Unterstützt Millisekundengenauigkeit. | Schnur |
OnlineScaleSettings
Name | Beschreibung | Wert |
---|---|---|
maxInstances | Maximale Anzahl von Instanzen für diese Bereitstellung. | Int |
minInstances | Mindestanzahl von Instanzen für diese Bereitstellung. | Int |
scaleType | Legen Sie für den Typ AutoScaleSettingsauf "Auto" fest. Set to 'Manual' for type ManualScaleSettings. | "Auto" "Manuell" (erforderlich) |
OutputPathAssetReference
Name | Beschreibung | Wert |
---|---|---|
jobId | ARM-Ressourcen-ID des Auftrags. | Schnur |
Pfad | Der Pfad der Datei/des Verzeichnisses in der Auftragsausgabe. | Schnur |
referenceType | [Erforderlich] Gibt den Typ des Objektverweises an. | 'OutputPath' (erforderlich) |
ProbeSettings
Name | Beschreibung | Wert |
---|---|---|
failureThreshold | Die Anzahl der Fehler, die zugelassen werden sollen, bevor ein fehlerhafter Status zurückgegeben wird. | Int |
initialDelay | Die Verzögerung vor der ersten Probe im ISO 8601-Format. | Schnur |
Periode | Die Dauer zwischen Probes im ISO 8601-Format. | Schnur |
successThreshold | Die Anzahl der erfolgreichen Probe, bevor ein fehlerfreier Status zurückgegeben wird. | Int |
Zeitüberschreitung | Das Timeout der Probe im ISO 8601-Format. | Schnur |
ResourceIdentity
Name | Beschreibung | Wert |
---|---|---|
Art | Definiert Werte für den Typ "ResourceIdentity". | 'None' 'SystemAssigned' "SystemAssigned,UserAssigned" "UserAssigned" |
userAssignedIdentities | Das Wörterbuch der vom Benutzer zugewiesenen Identitäten, schlüssel ist die ARM-Ressourcen-ID der UAI. | ResourceIdentityUserAssignedIdentities- |
ResourceIdentityUserAssignedIdentities
Name | Beschreibung | Wert |
---|
TrackedResourceTags
Name | Beschreibung | Wert |
---|
UserAssignedIdentityMeta
Name | Beschreibung | Wert |
---|---|---|
clientId | Aka application ID, a unique identifier generated by Azure AD that is tied to an application and service principal during its initial provisioning. | Schnur |
principalId | Die Objekt-ID des Dienstprinzipalobjekts für Ihre verwaltete Identität, die verwendet wird, um rollenbasierten Zugriff auf eine Azure-Ressource zu gewähren. | Schnur |
Terraform -Ressourcendefinition (AzAPI-Anbieter)
Der Ressourcentyp "workspaces/onlineEndpoints/deployments" kann mit Vorgängen bereitgestellt werden, die auf Folgendes abzielen:
- Ressourcengruppen
Eine Liste der geänderten Eigenschaften in jeder API-Version finden Sie unter Änderungsprotokoll.
Ressourcenformat
Um eine Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments-Ressource zu erstellen, fügen Sie Ihrer Vorlage die folgende Terraform hinzu.
resource "azapi_resource" "symbolicname" {
type = "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2021-03-01-preview"
name = "string"
identity = {
type = "string"
userAssignedIdentities = {
{customized property} = {
clientId = "string"
principalId = "string"
}
}
}
kind = "string"
location = "string"
tags = {
{customized property} = "string"
}
body = jsonencode({
properties = {
appInsightsEnabled = bool
codeConfiguration = {
codeId = "string"
scoringScript = "string"
}
description = "string"
environmentId = "string"
environmentVariables = {
{customized property} = "string"
}
livenessProbe = {
failureThreshold = int
initialDelay = "string"
period = "string"
successThreshold = int
timeout = "string"
}
model = {
referenceType = "string"
// For remaining properties, see AssetReferenceBase objects
}
properties = {
{customized property} = "string"
}
requestSettings = {
maxConcurrentRequestsPerInstance = int
maxQueueWait = "string"
requestTimeout = "string"
}
scaleSettings = {
maxInstances = int
minInstances = int
scaleType = "string"
// For remaining properties, see OnlineScaleSettings objects
}
endpointComputeType = "string"
// For remaining properties, see OnlineDeployment objects
}
})
}
AssetReferenceBase-Objekte
Legen Sie die referenceType-Eigenschaft fest, um den Objekttyp anzugeben.
Verwenden Sie für DataPath-:
{
datastoreId = "string"
path = "string"
referenceType = "DataPath"
}
Verwenden Sie für -ID-:
{
assetId = "string"
referenceType = "Id"
}
Verwenden Sie für OutputPath-:
{
jobId = "string"
path = "string"
referenceType = "OutputPath"
}
OnlineDeployment-Objekte
Legen Sie die eigenschaft endpointComputeType fest, um den Objekttyp anzugeben.
Verwenden Sie für K8S-:
{
containerResourceRequirements = {
cpu = int
cpuLimit = int
fpga = int
gpu = int
memoryInGB = int
memoryInGBLimit = int
}
endpointComputeType = "K8S"
}
Verwenden Sie für verwaltete:
{
endpointComputeType = "Managed"
instanceType = "string"
readinessProbe = {
failureThreshold = int
initialDelay = "string"
period = "string"
successThreshold = int
timeout = "string"
}
}
OnlineScaleSettings-Objekte
Legen Sie die scaleType--Eigenschaft fest, um den Objekttyp anzugeben.
Verwenden Sie für automatischenFolgendes:
{
pollingInterval = "string"
scaleType = "Auto"
targetUtilizationPercentage = int
}
Verwenden Sie für manuellen:
{
instanceCount = int
scaleType = "Manual"
}
Eigenschaftswerte
AssetReferenceBase
Name | Beschreibung | Wert |
---|---|---|
referenceType | Legen Sie für den Typ DataPathAssetReference-auf "DataPath" fest. Set to 'ID' for type IdAssetReference. Legen Sie für den Typ OutputPathAssetReferenceauf 'OutputPath' fest. | 'DataPath' 'ID' 'OutputPath' (erforderlich) |
AutoScaleSettings
Name | Beschreibung | Wert |
---|---|---|
pollingInterval | Das Abrufintervall im ISO 8691-Format. Unterstützt nur die Dauer mit der Genauigkeit so niedrig wie Sekunden. | Schnur |
scaleType | [Erforderlich] Art des Bereitstellungsskalierungsalgorithmus | "Auto" (erforderlich) |
targetUtilizationPercentage | Die CPU-Zielauslastung für die Autoscaler. | Int |
CodeConfiguration
Name | Beschreibung | Wert |
---|---|---|
codeId | ARM-Ressourcen-ID der Coderessource. | Schnur |
scoringScript | [Erforderlich] Das Skript, das beim Start ausgeführt werden soll. Zb. "score.py" | Schnur Zwänge: Min. Länge = 1 Pattern = [a-zA-Z0-9_] (erforderlich) |
ContainerResourceRequirements
Name | Beschreibung | Wert |
---|---|---|
CPU | Die Mindestmenge an CPU-Kernen, die vom Container verwendet werden sollen. Weitere Informationen: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
Int |
cpuLimit | Die maximale Anzahl von CPU-Kernen, die vom Container verwendet werden dürfen. Weitere Informationen: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
Int |
fpga | Die Anzahl der FÜR den Container verfügbar gemachten FPGA PCIE-Geräte. Muss ein Vielfaches von 2 sein. | Int |
gpu | Die Anzahl der GPU-Kerne im Container. | Int |
memoryInGB | Die mindeste Arbeitsspeichermenge (in GB), die vom Container verwendet werden soll. Weitere Informationen: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
Int |
memoryInGBLimit | Die maximale Speichermenge (in GB), die vom Container verwendet werden darf. Weitere Informationen: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
Int |
DataPathAssetReference
Name | Beschreibung | Wert |
---|---|---|
datastoreId | ARM-Ressourcen-ID des Datenspeichers, in dem sich die Ressource befindet. | Schnur |
Pfad | Der Pfad der Datei/des Verzeichnisses im Datenspeicher. | Schnur |
referenceType | [Erforderlich] Gibt den Typ des Objektverweises an. | 'DataPath' (erforderlich) |
IdAssetReference
Name | Beschreibung | Wert |
---|---|---|
assetId | [Erforderlich] ARM-Ressourcen-ID der Ressource. | Schnur Zwänge: Pattern = [a-zA-Z0-9_] (erforderlich) |
referenceType | [Erforderlich] Gibt den Typ des Objektverweises an. | 'ID' (erforderlich) |
K8SOnlineDeployment
Name | Beschreibung | Wert |
---|---|---|
containerResourceRequirements | Ressourcenanforderungen für jede Containerinstanz innerhalb einer Onlinebereitstellung. | ContainerResourceRequirements |
endpointComputeType | [Erforderlich] Der Computetyp des Endpunkts. | 'K8S' (erforderlich) |
ManagedOnlineDeployment
Name | Beschreibung | Wert |
---|---|---|
endpointComputeType | [Erforderlich] Der Computetyp des Endpunkts. | "Verwaltet" (erforderlich) |
instanceType | Computeinstanztyp. | Schnur |
readinessProbe | Konfiguration der Bereitstellungscontainer-Live-/Bereitschaftstestkonfiguration. | ProbeSettings |
ManualScaleSettings
Name | Beschreibung | Wert |
---|---|---|
instanceCount | Die Anzahl der Instanzen für diese Bereitstellung wurde behoben. | Int |
scaleType | [Erforderlich] Art des Bereitstellungsskalierungsalgorithmus | "Manuell" (erforderlich) |
Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments
Name | Beschreibung | Wert |
---|---|---|
Identität | Dienstidentität, die einer Ressource zugeordnet ist. | ResourceIdentity- |
Art | Metadaten, die von Portal/Tooling/etc. verwendet werden, um unterschiedliche UX-Oberflächen für Ressourcen desselben Typs zu rendern. | Schnur |
Ort | Der geografische Standort, an dem sich die Ressource befindet | Zeichenfolge (erforderlich) |
Name | Der Ressourcenname | Schnur Zwänge: Pattern = ^[a-zA-Z0-9][a-zA-Z0-9\-_]{0,254}$ (erforderlich) |
parent_id | Die ID der Ressource, die das übergeordnete Element für diese Ressource ist. | ID für Ressource des Typs: Arbeitsbereiche/onlineEndpoints |
Eigenschaften | [Erforderlich] Zusätzliche Attribute der Entität. | OnlineDeployment- (erforderlich) |
Schilder | Ressourcentags | Wörterbuch der Tagnamen und -werte. |
Art | Der Ressourcentyp | "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2021-03-01-preview" |
OnlineDeployment
Name | Beschreibung | Wert |
---|---|---|
appInsightsEnabled | Wenn wahr, aktiviert die Application Insights-Protokollierung. | Bool |
codeConfiguration | Codekonfiguration für die Endpunktbereitstellung. | CodeConfiguration- |
Beschreibung | Beschreibung der Endpunktbereitstellung. | Schnur |
endpointComputeType | Legen Sie für den Typ K8SOnlineDeploymentauf "K8S" fest. Legen Sie für den Typ ManagedOnlineDeployment-auf "Verwaltet" fest. | 'K8S' "Verwaltet" (erforderlich) |
environmentId | ARM-Ressourcen-ID der Umgebungsspezifikation für die Endpunktbereitstellung. | Schnur |
environmentVariables | Umgebungsvariablenkonfiguration für die Bereitstellung. | OnlineDeploymentEnvironmentVariables- |
livenessProbe | Konfiguration der Bereitstellungscontainer-Live-/Bereitschaftstestkonfiguration. | ProbeSettings |
Modell | Verweis auf die Modellressource für die Endpunktbereitstellung. | AssetReferenceBase- |
Eigenschaften | Eigenschaftenwörterbuch. Eigenschaften können hinzugefügt, aber nicht entfernt oder geändert werden. | OnlineDeploymentProperties- |
requestSettings | Konfiguration von Onlinebereitstellungsbewertungsanforderungen. | OnlineRequestSettings |
scaleSettings | Konfiguration der Onlinebereitstellungsskalierung. | OnlineScaleSettings- |
OnlineDeploymentEnvironmentVariables
Name | Beschreibung | Wert |
---|
OnlineDeploymentProperties
Name | Beschreibung | Wert |
---|
OnlineRequestSettings
Name | Beschreibung | Wert |
---|---|---|
maxConcurrentRequestsPerInstance | Die Anzahl der Anforderungen, die für diese Bereitstellung gleichzeitig in die Warteschlange gestellt werden dürfen. | Int |
maxQueueWait | Die maximale Wartezeit der Warteschlange im ISO 8601-Format. Unterstützt Millisekundengenauigkeit. | Schnur |
requestTimeout | Das Anforderungstimeout im ISO 8601-Format. Unterstützt Millisekundengenauigkeit. | Schnur |
OnlineScaleSettings
Name | Beschreibung | Wert |
---|---|---|
maxInstances | Maximale Anzahl von Instanzen für diese Bereitstellung. | Int |
minInstances | Mindestanzahl von Instanzen für diese Bereitstellung. | Int |
scaleType | Legen Sie für den Typ AutoScaleSettingsauf "Auto" fest. Set to 'Manual' for type ManualScaleSettings. | "Auto" "Manuell" (erforderlich) |
OutputPathAssetReference
Name | Beschreibung | Wert |
---|---|---|
jobId | ARM-Ressourcen-ID des Auftrags. | Schnur |
Pfad | Der Pfad der Datei/des Verzeichnisses in der Auftragsausgabe. | Schnur |
referenceType | [Erforderlich] Gibt den Typ des Objektverweises an. | 'OutputPath' (erforderlich) |
ProbeSettings
Name | Beschreibung | Wert |
---|---|---|
failureThreshold | Die Anzahl der Fehler, die zugelassen werden sollen, bevor ein fehlerhafter Status zurückgegeben wird. | Int |
initialDelay | Die Verzögerung vor der ersten Probe im ISO 8601-Format. | Schnur |
Periode | Die Dauer zwischen Probes im ISO 8601-Format. | Schnur |
successThreshold | Die Anzahl der erfolgreichen Probe, bevor ein fehlerfreier Status zurückgegeben wird. | Int |
Zeitüberschreitung | Das Timeout der Probe im ISO 8601-Format. | Schnur |
ResourceIdentity
Name | Beschreibung | Wert |
---|---|---|
Art | Definiert Werte für den Typ "ResourceIdentity". | 'None' 'SystemAssigned' "SystemAssigned,UserAssigned" "UserAssigned" |
userAssignedIdentities | Das Wörterbuch der vom Benutzer zugewiesenen Identitäten, schlüssel ist die ARM-Ressourcen-ID der UAI. | ResourceIdentityUserAssignedIdentities- |
ResourceIdentityUserAssignedIdentities
Name | Beschreibung | Wert |
---|
TrackedResourceTags
Name | Beschreibung | Wert |
---|
UserAssignedIdentityMeta
Name | Beschreibung | Wert |
---|---|---|
clientId | Aka application ID, a unique identifier generated by Azure AD that is tied to an application and service principal during its initial provisioning. | Schnur |
principalId | Die Objekt-ID des Dienstprinzipalobjekts für Ihre verwaltete Identität, die verwendet wird, um rollenbasierten Zugriff auf eine Azure-Ressource zu gewähren. | Schnur |