Freigeben über


Microsoft.MachineLearningServices-Arbeitsbereiche/onlineEndpoints/deployments 2021-03-01-preview

Bicep-Ressourcendefinition

Der Ressourcentyp "workspaces/onlineEndpoints/deployments" kann mit Vorgängen bereitgestellt werden, die auf Folgendes abzielen:

Eine Liste der geänderten Eigenschaften in jeder API-Version finden Sie unter Änderungsprotokoll.

Ressourcenformat

Um eine Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments-Ressource zu erstellen, fügen Sie ihrer Vorlage die folgende Bicep hinzu.

resource symbolicname 'Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2021-03-01-preview' = {
  parent: resourceSymbolicName
  identity: {
    type: 'string'
    userAssignedIdentities: {
      {customized property}: {
        clientId: 'string'
        principalId: 'string'
      }
    }
  }
  kind: 'string'
  location: 'string'
  name: 'string'
  properties: {
    appInsightsEnabled: bool
    codeConfiguration: {
      codeId: 'string'
      scoringScript: 'string'
    }
    description: 'string'
    environmentId: 'string'
    environmentVariables: {
      {customized property}: 'string'
    }
    livenessProbe: {
      failureThreshold: int
      initialDelay: 'string'
      period: 'string'
      successThreshold: int
      timeout: 'string'
    }
    model: {
      referenceType: 'string'
      // For remaining properties, see AssetReferenceBase objects
    }
    properties: {
      {customized property}: 'string'
    }
    requestSettings: {
      maxConcurrentRequestsPerInstance: int
      maxQueueWait: 'string'
      requestTimeout: 'string'
    }
    scaleSettings: {
      maxInstances: int
      minInstances: int
      scaleType: 'string'
      // For remaining properties, see OnlineScaleSettings objects
    }
    endpointComputeType: 'string'
    // For remaining properties, see OnlineDeployment objects
  }
  tags: {
    {customized property}: 'string'
  }
}

AssetReferenceBase-Objekte

Legen Sie die referenceType-Eigenschaft fest, um den Objekttyp anzugeben.

Verwenden Sie für DataPath-:

{
  datastoreId: 'string'
  path: 'string'
  referenceType: 'DataPath'
}

Verwenden Sie für -ID-:

{
  assetId: 'string'
  referenceType: 'Id'
}

Verwenden Sie für OutputPath-:

{
  jobId: 'string'
  path: 'string'
  referenceType: 'OutputPath'
}

OnlineDeployment-Objekte

Legen Sie die eigenschaft endpointComputeType fest, um den Objekttyp anzugeben.

Verwenden Sie für K8S-:

{
  containerResourceRequirements: {
    cpu: int
    cpuLimit: int
    fpga: int
    gpu: int
    memoryInGB: int
    memoryInGBLimit: int
  }
  endpointComputeType: 'K8S'
}

Verwenden Sie für verwaltete:

{
  endpointComputeType: 'Managed'
  instanceType: 'string'
  readinessProbe: {
    failureThreshold: int
    initialDelay: 'string'
    period: 'string'
    successThreshold: int
    timeout: 'string'
  }
}

OnlineScaleSettings-Objekte

Legen Sie die scaleType--Eigenschaft fest, um den Objekttyp anzugeben.

Verwenden Sie für automatischenFolgendes:

{
  pollingInterval: 'string'
  scaleType: 'Auto'
  targetUtilizationPercentage: int
}

Verwenden Sie für manuellen:

{
  instanceCount: int
  scaleType: 'Manual'
}

Eigenschaftswerte

AssetReferenceBase

Name Beschreibung Wert
referenceType Legen Sie für den Typ DataPathAssetReference-auf "DataPath" fest. Set to 'ID' for type IdAssetReference. Legen Sie für den Typ OutputPathAssetReferenceauf 'OutputPath' fest. 'DataPath'
'ID'
'OutputPath' (erforderlich)

AutoScaleSettings

Name Beschreibung Wert
pollingInterval Das Abrufintervall im ISO 8691-Format. Unterstützt nur die Dauer mit der Genauigkeit so niedrig wie Sekunden. Schnur
scaleType [Erforderlich] Art des Bereitstellungsskalierungsalgorithmus "Auto" (erforderlich)
targetUtilizationPercentage Die CPU-Zielauslastung für die Autoscaler. Int

CodeConfiguration

Name Beschreibung Wert
codeId ARM-Ressourcen-ID der Coderessource. Schnur
scoringScript [Erforderlich] Das Skript, das beim Start ausgeführt werden soll. Zb. "score.py" Schnur

Zwänge:
Min. Länge = 1
Pattern = [a-zA-Z0-9_] (erforderlich)

ContainerResourceRequirements

Name Beschreibung Wert
CPU Die Mindestmenge an CPU-Kernen, die vom Container verwendet werden sollen. Weitere Informationen:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
Int
cpuLimit Die maximale Anzahl von CPU-Kernen, die vom Container verwendet werden dürfen. Weitere Informationen:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
Int
fpga Die Anzahl der FÜR den Container verfügbar gemachten FPGA PCIE-Geräte. Muss ein Vielfaches von 2 sein. Int
gpu Die Anzahl der GPU-Kerne im Container. Int
memoryInGB Die mindeste Arbeitsspeichermenge (in GB), die vom Container verwendet werden soll. Weitere Informationen:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
Int
memoryInGBLimit Die maximale Speichermenge (in GB), die vom Container verwendet werden darf. Weitere Informationen:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
Int

DataPathAssetReference

Name Beschreibung Wert
datastoreId ARM-Ressourcen-ID des Datenspeichers, in dem sich die Ressource befindet. Schnur
Pfad Der Pfad der Datei/des Verzeichnisses im Datenspeicher. Schnur
referenceType [Erforderlich] Gibt den Typ des Objektverweises an. 'DataPath' (erforderlich)

IdAssetReference

Name Beschreibung Wert
assetId [Erforderlich] ARM-Ressourcen-ID der Ressource. Schnur

Zwänge:
Pattern = [a-zA-Z0-9_] (erforderlich)
referenceType [Erforderlich] Gibt den Typ des Objektverweises an. 'ID' (erforderlich)

K8SOnlineDeployment

Name Beschreibung Wert
containerResourceRequirements Ressourcenanforderungen für jede Containerinstanz innerhalb einer Onlinebereitstellung. ContainerResourceRequirements
endpointComputeType [Erforderlich] Der Computetyp des Endpunkts. 'K8S' (erforderlich)

ManagedOnlineDeployment

Name Beschreibung Wert
endpointComputeType [Erforderlich] Der Computetyp des Endpunkts. "Verwaltet" (erforderlich)
instanceType Computeinstanztyp. Schnur
readinessProbe Konfiguration der Bereitstellungscontainer-Live-/Bereitschaftstestkonfiguration. ProbeSettings

ManualScaleSettings

Name Beschreibung Wert
instanceCount Die Anzahl der Instanzen für diese Bereitstellung wurde behoben. Int
scaleType [Erforderlich] Art des Bereitstellungsskalierungsalgorithmus "Manuell" (erforderlich)

Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments

Name Beschreibung Wert
Identität Dienstidentität, die einer Ressource zugeordnet ist. ResourceIdentity-
Art Metadaten, die von Portal/Tooling/etc. verwendet werden, um unterschiedliche UX-Oberflächen für Ressourcen desselben Typs zu rendern. Schnur
Ort Der geografische Standort, an dem sich die Ressource befindet Zeichenfolge (erforderlich)
Name Der Ressourcenname Schnur

Zwänge:
Pattern = ^[a-zA-Z0-9][a-zA-Z0-9\-_]{0,254}$ (erforderlich)
Elternteil In Bicep können Sie die übergeordnete Ressource für eine untergeordnete Ressource angeben. Sie müssen diese Eigenschaft nur hinzufügen, wenn die untergeordnete Ressource außerhalb der übergeordneten Ressource deklariert wird.

Weitere Informationen finden Sie unter Untergeordnete Ressource außerhalb der übergeordneten Ressource.
Symbolischer Name für Ressource des Typs: Arbeitsbereiche/onlineEndpoints
Eigenschaften [Erforderlich] Zusätzliche Attribute der Entität. OnlineDeployment- (erforderlich)
Schilder Ressourcentags Wörterbuch der Tagnamen und -werte. Siehe Tags in Vorlagen

OnlineDeployment

Name Beschreibung Wert
appInsightsEnabled Wenn wahr, aktiviert die Application Insights-Protokollierung. Bool
codeConfiguration Codekonfiguration für die Endpunktbereitstellung. CodeConfiguration-
Beschreibung Beschreibung der Endpunktbereitstellung. Schnur
endpointComputeType Legen Sie für den Typ K8SOnlineDeploymentauf "K8S" fest. Legen Sie für den Typ ManagedOnlineDeployment-auf "Verwaltet" fest. 'K8S'
"Verwaltet" (erforderlich)
environmentId ARM-Ressourcen-ID der Umgebungsspezifikation für die Endpunktbereitstellung. Schnur
environmentVariables Umgebungsvariablenkonfiguration für die Bereitstellung. OnlineDeploymentEnvironmentVariables-
livenessProbe Konfiguration der Bereitstellungscontainer-Live-/Bereitschaftstestkonfiguration. ProbeSettings
Modell Verweis auf die Modellressource für die Endpunktbereitstellung. AssetReferenceBase-
Eigenschaften Eigenschaftenwörterbuch. Eigenschaften können hinzugefügt, aber nicht entfernt oder geändert werden. OnlineDeploymentProperties-
requestSettings Konfiguration von Onlinebereitstellungsbewertungsanforderungen. OnlineRequestSettings
scaleSettings Konfiguration der Onlinebereitstellungsskalierung. OnlineScaleSettings-

OnlineDeploymentEnvironmentVariables

Name Beschreibung Wert

OnlineDeploymentProperties

Name Beschreibung Wert

OnlineRequestSettings

Name Beschreibung Wert
maxConcurrentRequestsPerInstance Die Anzahl der Anforderungen, die für diese Bereitstellung gleichzeitig in die Warteschlange gestellt werden dürfen. Int
maxQueueWait Die maximale Wartezeit der Warteschlange im ISO 8601-Format. Unterstützt Millisekundengenauigkeit. Schnur
requestTimeout Das Anforderungstimeout im ISO 8601-Format. Unterstützt Millisekundengenauigkeit. Schnur

OnlineScaleSettings

Name Beschreibung Wert
maxInstances Maximale Anzahl von Instanzen für diese Bereitstellung. Int
minInstances Mindestanzahl von Instanzen für diese Bereitstellung. Int
scaleType Legen Sie für den Typ AutoScaleSettingsauf "Auto" fest. Set to 'Manual' for type ManualScaleSettings. "Auto"
"Manuell" (erforderlich)

OutputPathAssetReference

Name Beschreibung Wert
jobId ARM-Ressourcen-ID des Auftrags. Schnur
Pfad Der Pfad der Datei/des Verzeichnisses in der Auftragsausgabe. Schnur
referenceType [Erforderlich] Gibt den Typ des Objektverweises an. 'OutputPath' (erforderlich)

ProbeSettings

Name Beschreibung Wert
failureThreshold Die Anzahl der Fehler, die zugelassen werden sollen, bevor ein fehlerhafter Status zurückgegeben wird. Int
initialDelay Die Verzögerung vor der ersten Probe im ISO 8601-Format. Schnur
Periode Die Dauer zwischen Probes im ISO 8601-Format. Schnur
successThreshold Die Anzahl der erfolgreichen Probe, bevor ein fehlerfreier Status zurückgegeben wird. Int
Zeitüberschreitung Das Timeout der Probe im ISO 8601-Format. Schnur

ResourceIdentity

Name Beschreibung Wert
Art Definiert Werte für den Typ "ResourceIdentity". 'None'
'SystemAssigned'
"SystemAssigned,UserAssigned"
"UserAssigned"
userAssignedIdentities Das Wörterbuch der vom Benutzer zugewiesenen Identitäten, schlüssel ist die ARM-Ressourcen-ID der UAI. ResourceIdentityUserAssignedIdentities-

ResourceIdentityUserAssignedIdentities

Name Beschreibung Wert

TrackedResourceTags

Name Beschreibung Wert

UserAssignedIdentityMeta

Name Beschreibung Wert
clientId Aka application ID, a unique identifier generated by Azure AD that is tied to an application and service principal during its initial provisioning. Schnur
principalId Die Objekt-ID des Dienstprinzipalobjekts für Ihre verwaltete Identität, die verwendet wird, um rollenbasierten Zugriff auf eine Azure-Ressource zu gewähren. Schnur

ARM-Vorlagenressourcendefinition

Der Ressourcentyp "workspaces/onlineEndpoints/deployments" kann mit Vorgängen bereitgestellt werden, die auf Folgendes abzielen:

Eine Liste der geänderten Eigenschaften in jeder API-Version finden Sie unter Änderungsprotokoll.

Ressourcenformat

Um eine Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments-Ressource zu erstellen, fügen Sie ihrer Vorlage den folgenden JSON-Code hinzu.

{
  "type": "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments",
  "apiVersion": "2021-03-01-preview",
  "name": "string",
  "identity": {
    "type": "string",
    "userAssignedIdentities": {
      "{customized property}": {
        "clientId": "string",
        "principalId": "string"
      }
    }
  },
  "kind": "string",
  "location": "string",
  "properties": {
    "appInsightsEnabled": "bool",
    "codeConfiguration": {
      "codeId": "string",
      "scoringScript": "string"
    },
    "description": "string",
    "environmentId": "string",
    "environmentVariables": {
      "{customized property}": "string"
    },
    "livenessProbe": {
      "failureThreshold": "int",
      "initialDelay": "string",
      "period": "string",
      "successThreshold": "int",
      "timeout": "string"
    },
    "model": {
      "referenceType": "string"
      // For remaining properties, see AssetReferenceBase objects
    },
    "properties": {
      "{customized property}": "string"
    },
    "requestSettings": {
      "maxConcurrentRequestsPerInstance": "int",
      "maxQueueWait": "string",
      "requestTimeout": "string"
    },
    "scaleSettings": {
      "maxInstances": "int",
      "minInstances": "int",
      "scaleType": "string"
      // For remaining properties, see OnlineScaleSettings objects
    },
    "endpointComputeType": "string"
    // For remaining properties, see OnlineDeployment objects
  },
  "tags": {
    "{customized property}": "string"
  }
}

AssetReferenceBase-Objekte

Legen Sie die referenceType-Eigenschaft fest, um den Objekttyp anzugeben.

Verwenden Sie für DataPath-:

{
  "datastoreId": "string",
  "path": "string",
  "referenceType": "DataPath"
}

Verwenden Sie für -ID-:

{
  "assetId": "string",
  "referenceType": "Id"
}

Verwenden Sie für OutputPath-:

{
  "jobId": "string",
  "path": "string",
  "referenceType": "OutputPath"
}

OnlineDeployment-Objekte

Legen Sie die eigenschaft endpointComputeType fest, um den Objekttyp anzugeben.

Verwenden Sie für K8S-:

{
  "containerResourceRequirements": {
    "cpu": "int",
    "cpuLimit": "int",
    "fpga": "int",
    "gpu": "int",
    "memoryInGB": "int",
    "memoryInGBLimit": "int"
  },
  "endpointComputeType": "K8S"
}

Verwenden Sie für verwaltete:

{
  "endpointComputeType": "Managed",
  "instanceType": "string",
  "readinessProbe": {
    "failureThreshold": "int",
    "initialDelay": "string",
    "period": "string",
    "successThreshold": "int",
    "timeout": "string"
  }
}

OnlineScaleSettings-Objekte

Legen Sie die scaleType--Eigenschaft fest, um den Objekttyp anzugeben.

Verwenden Sie für automatischenFolgendes:

{
  "pollingInterval": "string",
  "scaleType": "Auto",
  "targetUtilizationPercentage": "int"
}

Verwenden Sie für manuellen:

{
  "instanceCount": "int",
  "scaleType": "Manual"
}

Eigenschaftswerte

AssetReferenceBase

Name Beschreibung Wert
referenceType Legen Sie für den Typ DataPathAssetReference-auf "DataPath" fest. Set to 'ID' for type IdAssetReference. Legen Sie für den Typ OutputPathAssetReferenceauf 'OutputPath' fest. 'DataPath'
'ID'
'OutputPath' (erforderlich)

AutoScaleSettings

Name Beschreibung Wert
pollingInterval Das Abrufintervall im ISO 8691-Format. Unterstützt nur die Dauer mit der Genauigkeit so niedrig wie Sekunden. Schnur
scaleType [Erforderlich] Art des Bereitstellungsskalierungsalgorithmus "Auto" (erforderlich)
targetUtilizationPercentage Die CPU-Zielauslastung für die Autoscaler. Int

CodeConfiguration

Name Beschreibung Wert
codeId ARM-Ressourcen-ID der Coderessource. Schnur
scoringScript [Erforderlich] Das Skript, das beim Start ausgeführt werden soll. Zb. "score.py" Schnur

Zwänge:
Min. Länge = 1
Pattern = [a-zA-Z0-9_] (erforderlich)

ContainerResourceRequirements

Name Beschreibung Wert
CPU Die Mindestmenge an CPU-Kernen, die vom Container verwendet werden sollen. Weitere Informationen:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
Int
cpuLimit Die maximale Anzahl von CPU-Kernen, die vom Container verwendet werden dürfen. Weitere Informationen:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
Int
fpga Die Anzahl der FÜR den Container verfügbar gemachten FPGA PCIE-Geräte. Muss ein Vielfaches von 2 sein. Int
gpu Die Anzahl der GPU-Kerne im Container. Int
memoryInGB Die mindeste Arbeitsspeichermenge (in GB), die vom Container verwendet werden soll. Weitere Informationen:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
Int
memoryInGBLimit Die maximale Speichermenge (in GB), die vom Container verwendet werden darf. Weitere Informationen:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
Int

DataPathAssetReference

Name Beschreibung Wert
datastoreId ARM-Ressourcen-ID des Datenspeichers, in dem sich die Ressource befindet. Schnur
Pfad Der Pfad der Datei/des Verzeichnisses im Datenspeicher. Schnur
referenceType [Erforderlich] Gibt den Typ des Objektverweises an. 'DataPath' (erforderlich)

IdAssetReference

Name Beschreibung Wert
assetId [Erforderlich] ARM-Ressourcen-ID der Ressource. Schnur

Zwänge:
Pattern = [a-zA-Z0-9_] (erforderlich)
referenceType [Erforderlich] Gibt den Typ des Objektverweises an. 'ID' (erforderlich)

K8SOnlineDeployment

Name Beschreibung Wert
containerResourceRequirements Ressourcenanforderungen für jede Containerinstanz innerhalb einer Onlinebereitstellung. ContainerResourceRequirements
endpointComputeType [Erforderlich] Der Computetyp des Endpunkts. 'K8S' (erforderlich)

ManagedOnlineDeployment

Name Beschreibung Wert
endpointComputeType [Erforderlich] Der Computetyp des Endpunkts. "Verwaltet" (erforderlich)
instanceType Computeinstanztyp. Schnur
readinessProbe Konfiguration der Bereitstellungscontainer-Live-/Bereitschaftstestkonfiguration. ProbeSettings

ManualScaleSettings

Name Beschreibung Wert
instanceCount Die Anzahl der Instanzen für diese Bereitstellung wurde behoben. Int
scaleType [Erforderlich] Art des Bereitstellungsskalierungsalgorithmus "Manuell" (erforderlich)

Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments

Name Beschreibung Wert
apiVersion Die API-Version "2021-03-01-preview"
Identität Dienstidentität, die einer Ressource zugeordnet ist. ResourceIdentity-
Art Metadaten, die von Portal/Tooling/etc. verwendet werden, um unterschiedliche UX-Oberflächen für Ressourcen desselben Typs zu rendern. Schnur
Ort Der geografische Standort, an dem sich die Ressource befindet Zeichenfolge (erforderlich)
Name Der Ressourcenname Schnur

Zwänge:
Pattern = ^[a-zA-Z0-9][a-zA-Z0-9\-_]{0,254}$ (erforderlich)
Eigenschaften [Erforderlich] Zusätzliche Attribute der Entität. OnlineDeployment- (erforderlich)
Schilder Ressourcentags Wörterbuch der Tagnamen und -werte. Siehe Tags in Vorlagen
Art Der Ressourcentyp "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments"

OnlineDeployment

Name Beschreibung Wert
appInsightsEnabled Wenn wahr, aktiviert die Application Insights-Protokollierung. Bool
codeConfiguration Codekonfiguration für die Endpunktbereitstellung. CodeConfiguration-
Beschreibung Beschreibung der Endpunktbereitstellung. Schnur
endpointComputeType Legen Sie für den Typ K8SOnlineDeploymentauf "K8S" fest. Legen Sie für den Typ ManagedOnlineDeployment-auf "Verwaltet" fest. 'K8S'
"Verwaltet" (erforderlich)
environmentId ARM-Ressourcen-ID der Umgebungsspezifikation für die Endpunktbereitstellung. Schnur
environmentVariables Umgebungsvariablenkonfiguration für die Bereitstellung. OnlineDeploymentEnvironmentVariables-
livenessProbe Konfiguration der Bereitstellungscontainer-Live-/Bereitschaftstestkonfiguration. ProbeSettings
Modell Verweis auf die Modellressource für die Endpunktbereitstellung. AssetReferenceBase-
Eigenschaften Eigenschaftenwörterbuch. Eigenschaften können hinzugefügt, aber nicht entfernt oder geändert werden. OnlineDeploymentProperties-
requestSettings Konfiguration von Onlinebereitstellungsbewertungsanforderungen. OnlineRequestSettings
scaleSettings Konfiguration der Onlinebereitstellungsskalierung. OnlineScaleSettings-

OnlineDeploymentEnvironmentVariables

Name Beschreibung Wert

OnlineDeploymentProperties

Name Beschreibung Wert

OnlineRequestSettings

Name Beschreibung Wert
maxConcurrentRequestsPerInstance Die Anzahl der Anforderungen, die für diese Bereitstellung gleichzeitig in die Warteschlange gestellt werden dürfen. Int
maxQueueWait Die maximale Wartezeit der Warteschlange im ISO 8601-Format. Unterstützt Millisekundengenauigkeit. Schnur
requestTimeout Das Anforderungstimeout im ISO 8601-Format. Unterstützt Millisekundengenauigkeit. Schnur

OnlineScaleSettings

Name Beschreibung Wert
maxInstances Maximale Anzahl von Instanzen für diese Bereitstellung. Int
minInstances Mindestanzahl von Instanzen für diese Bereitstellung. Int
scaleType Legen Sie für den Typ AutoScaleSettingsauf "Auto" fest. Set to 'Manual' for type ManualScaleSettings. "Auto"
"Manuell" (erforderlich)

OutputPathAssetReference

Name Beschreibung Wert
jobId ARM-Ressourcen-ID des Auftrags. Schnur
Pfad Der Pfad der Datei/des Verzeichnisses in der Auftragsausgabe. Schnur
referenceType [Erforderlich] Gibt den Typ des Objektverweises an. 'OutputPath' (erforderlich)

ProbeSettings

Name Beschreibung Wert
failureThreshold Die Anzahl der Fehler, die zugelassen werden sollen, bevor ein fehlerhafter Status zurückgegeben wird. Int
initialDelay Die Verzögerung vor der ersten Probe im ISO 8601-Format. Schnur
Periode Die Dauer zwischen Probes im ISO 8601-Format. Schnur
successThreshold Die Anzahl der erfolgreichen Probe, bevor ein fehlerfreier Status zurückgegeben wird. Int
Zeitüberschreitung Das Timeout der Probe im ISO 8601-Format. Schnur

ResourceIdentity

Name Beschreibung Wert
Art Definiert Werte für den Typ "ResourceIdentity". 'None'
'SystemAssigned'
"SystemAssigned,UserAssigned"
"UserAssigned"
userAssignedIdentities Das Wörterbuch der vom Benutzer zugewiesenen Identitäten, schlüssel ist die ARM-Ressourcen-ID der UAI. ResourceIdentityUserAssignedIdentities-

ResourceIdentityUserAssignedIdentities

Name Beschreibung Wert

TrackedResourceTags

Name Beschreibung Wert

UserAssignedIdentityMeta

Name Beschreibung Wert
clientId Aka application ID, a unique identifier generated by Azure AD that is tied to an application and service principal during its initial provisioning. Schnur
principalId Die Objekt-ID des Dienstprinzipalobjekts für Ihre verwaltete Identität, die verwendet wird, um rollenbasierten Zugriff auf eine Azure-Ressource zu gewähren. Schnur

Terraform -Ressourcendefinition (AzAPI-Anbieter)

Der Ressourcentyp "workspaces/onlineEndpoints/deployments" kann mit Vorgängen bereitgestellt werden, die auf Folgendes abzielen:

  • Ressourcengruppen

Eine Liste der geänderten Eigenschaften in jeder API-Version finden Sie unter Änderungsprotokoll.

Ressourcenformat

Um eine Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments-Ressource zu erstellen, fügen Sie Ihrer Vorlage die folgende Terraform hinzu.

resource "azapi_resource" "symbolicname" {
  type = "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2021-03-01-preview"
  name = "string"
  identity = {
    type = "string"
    userAssignedIdentities = {
      {customized property} = {
        clientId = "string"
        principalId = "string"
      }
    }
  }
  kind = "string"
  location = "string"
  tags = {
    {customized property} = "string"
  }
  body = jsonencode({
    properties = {
      appInsightsEnabled = bool
      codeConfiguration = {
        codeId = "string"
        scoringScript = "string"
      }
      description = "string"
      environmentId = "string"
      environmentVariables = {
        {customized property} = "string"
      }
      livenessProbe = {
        failureThreshold = int
        initialDelay = "string"
        period = "string"
        successThreshold = int
        timeout = "string"
      }
      model = {
        referenceType = "string"
        // For remaining properties, see AssetReferenceBase objects
      }
      properties = {
        {customized property} = "string"
      }
      requestSettings = {
        maxConcurrentRequestsPerInstance = int
        maxQueueWait = "string"
        requestTimeout = "string"
      }
      scaleSettings = {
        maxInstances = int
        minInstances = int
        scaleType = "string"
        // For remaining properties, see OnlineScaleSettings objects
      }
      endpointComputeType = "string"
      // For remaining properties, see OnlineDeployment objects
    }
  })
}

AssetReferenceBase-Objekte

Legen Sie die referenceType-Eigenschaft fest, um den Objekttyp anzugeben.

Verwenden Sie für DataPath-:

{
  datastoreId = "string"
  path = "string"
  referenceType = "DataPath"
}

Verwenden Sie für -ID-:

{
  assetId = "string"
  referenceType = "Id"
}

Verwenden Sie für OutputPath-:

{
  jobId = "string"
  path = "string"
  referenceType = "OutputPath"
}

OnlineDeployment-Objekte

Legen Sie die eigenschaft endpointComputeType fest, um den Objekttyp anzugeben.

Verwenden Sie für K8S-:

{
  containerResourceRequirements = {
    cpu = int
    cpuLimit = int
    fpga = int
    gpu = int
    memoryInGB = int
    memoryInGBLimit = int
  }
  endpointComputeType = "K8S"
}

Verwenden Sie für verwaltete:

{
  endpointComputeType = "Managed"
  instanceType = "string"
  readinessProbe = {
    failureThreshold = int
    initialDelay = "string"
    period = "string"
    successThreshold = int
    timeout = "string"
  }
}

OnlineScaleSettings-Objekte

Legen Sie die scaleType--Eigenschaft fest, um den Objekttyp anzugeben.

Verwenden Sie für automatischenFolgendes:

{
  pollingInterval = "string"
  scaleType = "Auto"
  targetUtilizationPercentage = int
}

Verwenden Sie für manuellen:

{
  instanceCount = int
  scaleType = "Manual"
}

Eigenschaftswerte

AssetReferenceBase

Name Beschreibung Wert
referenceType Legen Sie für den Typ DataPathAssetReference-auf "DataPath" fest. Set to 'ID' for type IdAssetReference. Legen Sie für den Typ OutputPathAssetReferenceauf 'OutputPath' fest. 'DataPath'
'ID'
'OutputPath' (erforderlich)

AutoScaleSettings

Name Beschreibung Wert
pollingInterval Das Abrufintervall im ISO 8691-Format. Unterstützt nur die Dauer mit der Genauigkeit so niedrig wie Sekunden. Schnur
scaleType [Erforderlich] Art des Bereitstellungsskalierungsalgorithmus "Auto" (erforderlich)
targetUtilizationPercentage Die CPU-Zielauslastung für die Autoscaler. Int

CodeConfiguration

Name Beschreibung Wert
codeId ARM-Ressourcen-ID der Coderessource. Schnur
scoringScript [Erforderlich] Das Skript, das beim Start ausgeführt werden soll. Zb. "score.py" Schnur

Zwänge:
Min. Länge = 1
Pattern = [a-zA-Z0-9_] (erforderlich)

ContainerResourceRequirements

Name Beschreibung Wert
CPU Die Mindestmenge an CPU-Kernen, die vom Container verwendet werden sollen. Weitere Informationen:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
Int
cpuLimit Die maximale Anzahl von CPU-Kernen, die vom Container verwendet werden dürfen. Weitere Informationen:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
Int
fpga Die Anzahl der FÜR den Container verfügbar gemachten FPGA PCIE-Geräte. Muss ein Vielfaches von 2 sein. Int
gpu Die Anzahl der GPU-Kerne im Container. Int
memoryInGB Die mindeste Arbeitsspeichermenge (in GB), die vom Container verwendet werden soll. Weitere Informationen:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
Int
memoryInGBLimit Die maximale Speichermenge (in GB), die vom Container verwendet werden darf. Weitere Informationen:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
Int

DataPathAssetReference

Name Beschreibung Wert
datastoreId ARM-Ressourcen-ID des Datenspeichers, in dem sich die Ressource befindet. Schnur
Pfad Der Pfad der Datei/des Verzeichnisses im Datenspeicher. Schnur
referenceType [Erforderlich] Gibt den Typ des Objektverweises an. 'DataPath' (erforderlich)

IdAssetReference

Name Beschreibung Wert
assetId [Erforderlich] ARM-Ressourcen-ID der Ressource. Schnur

Zwänge:
Pattern = [a-zA-Z0-9_] (erforderlich)
referenceType [Erforderlich] Gibt den Typ des Objektverweises an. 'ID' (erforderlich)

K8SOnlineDeployment

Name Beschreibung Wert
containerResourceRequirements Ressourcenanforderungen für jede Containerinstanz innerhalb einer Onlinebereitstellung. ContainerResourceRequirements
endpointComputeType [Erforderlich] Der Computetyp des Endpunkts. 'K8S' (erforderlich)

ManagedOnlineDeployment

Name Beschreibung Wert
endpointComputeType [Erforderlich] Der Computetyp des Endpunkts. "Verwaltet" (erforderlich)
instanceType Computeinstanztyp. Schnur
readinessProbe Konfiguration der Bereitstellungscontainer-Live-/Bereitschaftstestkonfiguration. ProbeSettings

ManualScaleSettings

Name Beschreibung Wert
instanceCount Die Anzahl der Instanzen für diese Bereitstellung wurde behoben. Int
scaleType [Erforderlich] Art des Bereitstellungsskalierungsalgorithmus "Manuell" (erforderlich)

Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments

Name Beschreibung Wert
Identität Dienstidentität, die einer Ressource zugeordnet ist. ResourceIdentity-
Art Metadaten, die von Portal/Tooling/etc. verwendet werden, um unterschiedliche UX-Oberflächen für Ressourcen desselben Typs zu rendern. Schnur
Ort Der geografische Standort, an dem sich die Ressource befindet Zeichenfolge (erforderlich)
Name Der Ressourcenname Schnur

Zwänge:
Pattern = ^[a-zA-Z0-9][a-zA-Z0-9\-_]{0,254}$ (erforderlich)
parent_id Die ID der Ressource, die das übergeordnete Element für diese Ressource ist. ID für Ressource des Typs: Arbeitsbereiche/onlineEndpoints
Eigenschaften [Erforderlich] Zusätzliche Attribute der Entität. OnlineDeployment- (erforderlich)
Schilder Ressourcentags Wörterbuch der Tagnamen und -werte.
Art Der Ressourcentyp "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2021-03-01-preview"

OnlineDeployment

Name Beschreibung Wert
appInsightsEnabled Wenn wahr, aktiviert die Application Insights-Protokollierung. Bool
codeConfiguration Codekonfiguration für die Endpunktbereitstellung. CodeConfiguration-
Beschreibung Beschreibung der Endpunktbereitstellung. Schnur
endpointComputeType Legen Sie für den Typ K8SOnlineDeploymentauf "K8S" fest. Legen Sie für den Typ ManagedOnlineDeployment-auf "Verwaltet" fest. 'K8S'
"Verwaltet" (erforderlich)
environmentId ARM-Ressourcen-ID der Umgebungsspezifikation für die Endpunktbereitstellung. Schnur
environmentVariables Umgebungsvariablenkonfiguration für die Bereitstellung. OnlineDeploymentEnvironmentVariables-
livenessProbe Konfiguration der Bereitstellungscontainer-Live-/Bereitschaftstestkonfiguration. ProbeSettings
Modell Verweis auf die Modellressource für die Endpunktbereitstellung. AssetReferenceBase-
Eigenschaften Eigenschaftenwörterbuch. Eigenschaften können hinzugefügt, aber nicht entfernt oder geändert werden. OnlineDeploymentProperties-
requestSettings Konfiguration von Onlinebereitstellungsbewertungsanforderungen. OnlineRequestSettings
scaleSettings Konfiguration der Onlinebereitstellungsskalierung. OnlineScaleSettings-

OnlineDeploymentEnvironmentVariables

Name Beschreibung Wert

OnlineDeploymentProperties

Name Beschreibung Wert

OnlineRequestSettings

Name Beschreibung Wert
maxConcurrentRequestsPerInstance Die Anzahl der Anforderungen, die für diese Bereitstellung gleichzeitig in die Warteschlange gestellt werden dürfen. Int
maxQueueWait Die maximale Wartezeit der Warteschlange im ISO 8601-Format. Unterstützt Millisekundengenauigkeit. Schnur
requestTimeout Das Anforderungstimeout im ISO 8601-Format. Unterstützt Millisekundengenauigkeit. Schnur

OnlineScaleSettings

Name Beschreibung Wert
maxInstances Maximale Anzahl von Instanzen für diese Bereitstellung. Int
minInstances Mindestanzahl von Instanzen für diese Bereitstellung. Int
scaleType Legen Sie für den Typ AutoScaleSettingsauf "Auto" fest. Set to 'Manual' for type ManualScaleSettings. "Auto"
"Manuell" (erforderlich)

OutputPathAssetReference

Name Beschreibung Wert
jobId ARM-Ressourcen-ID des Auftrags. Schnur
Pfad Der Pfad der Datei/des Verzeichnisses in der Auftragsausgabe. Schnur
referenceType [Erforderlich] Gibt den Typ des Objektverweises an. 'OutputPath' (erforderlich)

ProbeSettings

Name Beschreibung Wert
failureThreshold Die Anzahl der Fehler, die zugelassen werden sollen, bevor ein fehlerhafter Status zurückgegeben wird. Int
initialDelay Die Verzögerung vor der ersten Probe im ISO 8601-Format. Schnur
Periode Die Dauer zwischen Probes im ISO 8601-Format. Schnur
successThreshold Die Anzahl der erfolgreichen Probe, bevor ein fehlerfreier Status zurückgegeben wird. Int
Zeitüberschreitung Das Timeout der Probe im ISO 8601-Format. Schnur

ResourceIdentity

Name Beschreibung Wert
Art Definiert Werte für den Typ "ResourceIdentity". 'None'
'SystemAssigned'
"SystemAssigned,UserAssigned"
"UserAssigned"
userAssignedIdentities Das Wörterbuch der vom Benutzer zugewiesenen Identitäten, schlüssel ist die ARM-Ressourcen-ID der UAI. ResourceIdentityUserAssignedIdentities-

ResourceIdentityUserAssignedIdentities

Name Beschreibung Wert

TrackedResourceTags

Name Beschreibung Wert

UserAssignedIdentityMeta

Name Beschreibung Wert
clientId Aka application ID, a unique identifier generated by Azure AD that is tied to an application and service principal during its initial provisioning. Schnur
principalId Die Objekt-ID des Dienstprinzipalobjekts für Ihre verwaltete Identität, die verwendet wird, um rollenbasierten Zugriff auf eine Azure-Ressource zu gewähren. Schnur