Udostępnij za pośrednictwem


Microsoft.MachineLearningServices workspaces/onlineEndpoints/deployments 2021-03-01-preview

Definicja zasobu Bicep

Typ zasobu obszary robocze/onlineEndpoints/deployments można wdrożyć przy użyciu operacji docelowych:

Aby uzyskać listę zmienionych właściwości w każdej wersji interfejsu API, zobacz dziennika zmian.

Format zasobu

Aby utworzyć zasób Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments, dodaj następujący kod Bicep do szablonu.

resource symbolicname 'Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2021-03-01-preview' = {
  parent: resourceSymbolicName
  identity: {
    type: 'string'
    userAssignedIdentities: {
      {customized property}: {
        clientId: 'string'
        principalId: 'string'
      }
    }
  }
  kind: 'string'
  location: 'string'
  name: 'string'
  properties: {
    appInsightsEnabled: bool
    codeConfiguration: {
      codeId: 'string'
      scoringScript: 'string'
    }
    description: 'string'
    environmentId: 'string'
    environmentVariables: {
      {customized property}: 'string'
    }
    livenessProbe: {
      failureThreshold: int
      initialDelay: 'string'
      period: 'string'
      successThreshold: int
      timeout: 'string'
    }
    model: {
      referenceType: 'string'
      // For remaining properties, see AssetReferenceBase objects
    }
    properties: {
      {customized property}: 'string'
    }
    requestSettings: {
      maxConcurrentRequestsPerInstance: int
      maxQueueWait: 'string'
      requestTimeout: 'string'
    }
    scaleSettings: {
      maxInstances: int
      minInstances: int
      scaleType: 'string'
      // For remaining properties, see OnlineScaleSettings objects
    }
    endpointComputeType: 'string'
    // For remaining properties, see OnlineDeployment objects
  }
  tags: {
    {customized property}: 'string'
  }
}

Obiekty AssetReferenceBase

Ustaw właściwość referenceType, aby określić typ obiektu.

W przypadku DataPath użyj:

{
  datastoreId: 'string'
  path: 'string'
  referenceType: 'DataPath'
}

W przypadkuidentyfikatora użyj:

{
  assetId: 'string'
  referenceType: 'Id'
}

W przypadku OutputPathużyj:

{
  jobId: 'string'
  path: 'string'
  referenceType: 'OutputPath'
}

Obiekty OnlineDeployment

Ustaw właściwość endpointComputeType, aby określić typ obiektu.

W przypadku K8S użyj:

{
  containerResourceRequirements: {
    cpu: int
    cpuLimit: int
    fpga: int
    gpu: int
    memoryInGB: int
    memoryInGBLimit: int
  }
  endpointComputeType: 'K8S'
}

W przypadku zarządzanychużyj:

{
  endpointComputeType: 'Managed'
  instanceType: 'string'
  readinessProbe: {
    failureThreshold: int
    initialDelay: 'string'
    period: 'string'
    successThreshold: int
    timeout: 'string'
  }
}

Obiekty OnlineScaleSettings

Ustaw właściwość scaleType, aby określić typ obiektu.

W przypadku autoużyj:

{
  pollingInterval: 'string'
  scaleType: 'Auto'
  targetUtilizationPercentage: int
}

W przypadku ręcznegoużyj:

{
  instanceCount: int
  scaleType: 'Manual'
}

Wartości właściwości

AssetReferenceBase

Nazwa Opis Wartość
referenceType Ustaw wartość "DataPath" dla typu DataPathAssetReference. Ustaw wartość "Id" dla typu IdAssetReference. Ustaw wartość "OutputPath" dla typu OutputPathAssetReference. "DataPath"
"Id"
"OutputPath" (wymagane)

AutoskalowanieUstawienia

Nazwa Opis Wartość
pollingInterval Interwał sondowania w formacie ISO 8691. Obsługuje tylko czas trwania z dokładnością do sekund. struna
scaleType [Wymagane] Typ algorytmu skalowania wdrożenia "Auto" (wymagane)
targetU enterprisePercentage Docelowe użycie procesora CPU dla narzędzia do skalowania automatycznego. Int

Konfiguracja kodu

Nazwa Opis Wartość
codeId Identyfikator zasobu usługi ARM zasobu kodu. struna
scoringScript [Wymagane] Skrypt do wykonania podczas uruchamiania. Np. "score.py" struna

Ograniczenia:
Minimalna długość = 1
Wzorzec = [a-zA-Z0-9_] (wymagane)

ContainerResourceRequirements

Nazwa Opis Wartość
procesor Minimalna ilość rdzeni procesora CPU do użycia przez kontener. Więcej informacji:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
Int
cpuLimit Maksymalna liczba rdzeni procesora CPU, które mogą być używane przez kontener. Więcej informacji:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
Int
fpga Liczba urządzeń FPGA PCIE uwidocznionych w kontenerze. Musi mieć wielokrotność 2. Int
Gpu Liczba rdzeni procesora GPU w kontenerze. Int
memoryInGB Minimalna ilość pamięci (w GB) do użycia przez kontener. Więcej informacji:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
Int
memoryInGBLimit Maksymalna ilość pamięci (w GB) dozwolona do użycia przez kontener. Więcej informacji:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
Int

DataPathAssetReference

Nazwa Opis Wartość
datastoreId Identyfikator zasobu usługi ARM magazynu danych, w którym znajduje się zasób. struna
ścieżka Ścieżka pliku/katalogu w magazynie danych. struna
referenceType [Wymagane] Określa typ odwołania do zasobu. "DataPath" (wymagane)

IdAssetReference

Nazwa Opis Wartość
assetId [Wymagane] Identyfikator zasobu usługi ARM. struna

Ograniczenia:
Wzorzec = [a-zA-Z0-9_] (wymagane)
referenceType [Wymagane] Określa typ odwołania do zasobu. "Id" (wymagany)

K8SOnlineDeployment

Nazwa Opis Wartość
containerResourceRequirements Wymagania dotyczące zasobów dla każdego wystąpienia kontenera we wdrożeniu online. ContainerResourceRequirements
endpointComputeType [Wymagane] Typ obliczeniowy punktu końcowego. "K8S" (wymagane)

ManagedOnlineDeployment

Nazwa Opis Wartość
endpointComputeType [Wymagane] Typ obliczeniowy punktu końcowego. "Zarządzane" (wymagane)
instanceType Typ wystąpienia obliczeniowego. struna
gotowośćProbe Konfiguracja sondy liveness/readiness kontenera wdrożenia. ProbeSettings

ManualScaleSettings

Nazwa Opis Wartość
instanceCount Stała liczba wystąpień dla tego wdrożenia. Int
scaleType [Wymagane] Typ algorytmu skalowania wdrożenia "Ręczne" (wymagane)

Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments

Nazwa Opis Wartość
tożsamość Tożsamość usługi skojarzona z zasobem. ResourceIdentity
rodzaj Metadane używane przez portal/narzędzia/itp. do renderowania różnych środowisk środowiska użytkownika dla zasobów tego samego typu. struna
lokalizacja Lokalizacja geograficzna, w której znajduje się zasób ciąg (wymagany)
nazwa Nazwa zasobu struna

Ograniczenia:
Wzorzec = ^[a-zA-Z0-9][a-zA-Z0-9\-_]{0,254}$ (wymagane)
rodzic W Bicep można określić zasób nadrzędny dla zasobu podrzędnego. Tę właściwość należy dodać tylko wtedy, gdy zasób podrzędny jest zadeklarowany poza zasobem nadrzędnym.

Aby uzyskać więcej informacji, zobacz Zasób podrzędny poza zasobem nadrzędnym.
Nazwa symboliczna zasobu typu: obszarów roboczych/onlineEndpoints
Właściwości [Wymagane] Dodatkowe atrybuty jednostki. OnlineDeployment (wymagane)
Tagi Tagi zasobów Słownik nazw tagów i wartości. Zobacz tagi w szablonach

Wdrażanie w trybie online

Nazwa Opis Wartość
appInsightsEnabled Jeśli wartość true, włącza rejestrowanie usługi Application Insights. Bool
codeConfiguration Konfiguracja kodu dla wdrożenia punktu końcowego. CodeConfiguration
opis Opis wdrożenia punktu końcowego. struna
endpointComputeType Ustaw wartość "K8S" dla typu K8SOnlineDeployment. Ustaw wartość "Managed" dla typu ManagedOnlineDeployment. "K8S"
"Zarządzane" (wymagane)
environmentId Identyfikator zasobu usługi ARM specyfikacji środowiska dla wdrożenia punktu końcowego. struna
environmentVariables Konfiguracja zmiennych środowiskowych dla wdrożenia. OnlineDeploymentEnvironmentVariables
livenessProbe Konfiguracja sondy liveness/readiness kontenera wdrożenia. ProbeSettings
model Odwołanie do zasobu modelu dla wdrożenia punktu końcowego. AssetReferenceBase
Właściwości Słownik właściwości. Właściwości można dodawać, ale nie usuwać ani zmieniać. OnlineDeploymentProperties
requestSettings Konfiguracja żądań oceniania wdrożenia online. OnlineRequestSettings
scaleSettings Konfiguracja skalowania wdrożenia online. OnlineScaleSettings

OnlineDeploymentEnvironmentVariables

Nazwa Opis Wartość

Właściwości elementu OnlineDeploymentProperties

Nazwa Opis Wartość

OnlineRequestSettings

Nazwa Opis Wartość
maxConcurrentRequestsPerInstance Liczba żądań dozwolonych do kolejkowania jednocześnie dla tego wdrożenia. Int
maxQueueWait Maksymalny czas oczekiwania kolejki w formacie ISO 8601. Obsługuje precyzję milisekund. struna
requestTimeout Limit czasu żądania w formacie ISO 8601. Obsługuje precyzję milisekund. struna

OnlineScaleSettings

Nazwa Opis Wartość
maxInstances Maksymalna liczba wystąpień dla tego wdrożenia. Int
minInstances Minimalna liczba wystąpień dla tego wdrożenia. Int
scaleType Ustaw wartość "Auto" dla typu AutoScaleSettings. Ustaw wartość "Manual" dla typu ManualScaleSettings. "Auto"
"Ręczne" (wymagane)

OutputPathAssetReference

Nazwa Opis Wartość
identyfikator zadania Identyfikator zasobu usługi ARM zadania. struna
ścieżka Ścieżka pliku/katalogu w danych wyjściowych zadania. struna
referenceType [Wymagane] Określa typ odwołania do zasobu. "OutputPath" (wymagane)

ProbeSettings

Nazwa Opis Wartość
failureThreshold Liczba niepowodzeń, które mają być dozwolone przed zwróceniem stanu złej kondycji. Int
initialDelay Opóźnienie przed pierwszą sondą w formacie ISO 8601. struna
okres Czas między sondami w formacie ISO 8601. struna
successThreshold Liczba pomyślnych sond przed zwróceniem stanu dobrej kondycji. Int
Limit czasu Limit czasu sondy w formacie ISO 8601. struna

Identyfikator zasobu

Nazwa Opis Wartość
typ Definiuje wartości typu ResourceIdentity. "Brak"
"SystemAssigned"
"SystemAssigned,UserAssigned"
"UserAssigned"
userAssignedIdentities Słownik tożsamości przypisanych przez użytkownika, klucz jest identyfikatorem zasobu usługi ARM interfejsu użytkownika. ResourceIdentityUserAssignedIdentities

ResourceIdentityUserAssignedIdentities

Nazwa Opis Wartość

TrackedResourceTags

Nazwa Opis Wartość

UserAssignedIdentityMeta

Nazwa Opis Wartość
clientId Identyfikator aplikacji , unikatowy identyfikator wygenerowany przez usługę Azure AD, który jest powiązany z aplikacją i jednostką usługi podczas początkowej aprowizacji. struna
principalId Identyfikator obiektu jednostki usługi dla tożsamości zarządzanej, który służy do udzielania dostępu opartego na rolach do zasobu platformy Azure. struna

Definicja zasobu szablonu usługi ARM

Typ zasobu obszary robocze/onlineEndpoints/deployments można wdrożyć przy użyciu operacji docelowych:

Aby uzyskać listę zmienionych właściwości w każdej wersji interfejsu API, zobacz dziennika zmian.

Format zasobu

Aby utworzyć zasób Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments, dodaj następujący kod JSON do szablonu.

{
  "type": "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments",
  "apiVersion": "2021-03-01-preview",
  "name": "string",
  "identity": {
    "type": "string",
    "userAssignedIdentities": {
      "{customized property}": {
        "clientId": "string",
        "principalId": "string"
      }
    }
  },
  "kind": "string",
  "location": "string",
  "properties": {
    "appInsightsEnabled": "bool",
    "codeConfiguration": {
      "codeId": "string",
      "scoringScript": "string"
    },
    "description": "string",
    "environmentId": "string",
    "environmentVariables": {
      "{customized property}": "string"
    },
    "livenessProbe": {
      "failureThreshold": "int",
      "initialDelay": "string",
      "period": "string",
      "successThreshold": "int",
      "timeout": "string"
    },
    "model": {
      "referenceType": "string"
      // For remaining properties, see AssetReferenceBase objects
    },
    "properties": {
      "{customized property}": "string"
    },
    "requestSettings": {
      "maxConcurrentRequestsPerInstance": "int",
      "maxQueueWait": "string",
      "requestTimeout": "string"
    },
    "scaleSettings": {
      "maxInstances": "int",
      "minInstances": "int",
      "scaleType": "string"
      // For remaining properties, see OnlineScaleSettings objects
    },
    "endpointComputeType": "string"
    // For remaining properties, see OnlineDeployment objects
  },
  "tags": {
    "{customized property}": "string"
  }
}

Obiekty AssetReferenceBase

Ustaw właściwość referenceType, aby określić typ obiektu.

W przypadku DataPath użyj:

{
  "datastoreId": "string",
  "path": "string",
  "referenceType": "DataPath"
}

W przypadkuidentyfikatora użyj:

{
  "assetId": "string",
  "referenceType": "Id"
}

W przypadku OutputPathużyj:

{
  "jobId": "string",
  "path": "string",
  "referenceType": "OutputPath"
}

Obiekty OnlineDeployment

Ustaw właściwość endpointComputeType, aby określić typ obiektu.

W przypadku K8S użyj:

{
  "containerResourceRequirements": {
    "cpu": "int",
    "cpuLimit": "int",
    "fpga": "int",
    "gpu": "int",
    "memoryInGB": "int",
    "memoryInGBLimit": "int"
  },
  "endpointComputeType": "K8S"
}

W przypadku zarządzanychużyj:

{
  "endpointComputeType": "Managed",
  "instanceType": "string",
  "readinessProbe": {
    "failureThreshold": "int",
    "initialDelay": "string",
    "period": "string",
    "successThreshold": "int",
    "timeout": "string"
  }
}

Obiekty OnlineScaleSettings

Ustaw właściwość scaleType, aby określić typ obiektu.

W przypadku autoużyj:

{
  "pollingInterval": "string",
  "scaleType": "Auto",
  "targetUtilizationPercentage": "int"
}

W przypadku ręcznegoużyj:

{
  "instanceCount": "int",
  "scaleType": "Manual"
}

Wartości właściwości

AssetReferenceBase

Nazwa Opis Wartość
referenceType Ustaw wartość "DataPath" dla typu DataPathAssetReference. Ustaw wartość "Id" dla typu IdAssetReference. Ustaw wartość "OutputPath" dla typu OutputPathAssetReference. "DataPath"
"Id"
"OutputPath" (wymagane)

AutoskalowanieUstawienia

Nazwa Opis Wartość
pollingInterval Interwał sondowania w formacie ISO 8691. Obsługuje tylko czas trwania z dokładnością do sekund. struna
scaleType [Wymagane] Typ algorytmu skalowania wdrożenia "Auto" (wymagane)
targetU enterprisePercentage Docelowe użycie procesora CPU dla narzędzia do skalowania automatycznego. Int

Konfiguracja kodu

Nazwa Opis Wartość
codeId Identyfikator zasobu usługi ARM zasobu kodu. struna
scoringScript [Wymagane] Skrypt do wykonania podczas uruchamiania. Np. "score.py" struna

Ograniczenia:
Minimalna długość = 1
Wzorzec = [a-zA-Z0-9_] (wymagane)

ContainerResourceRequirements

Nazwa Opis Wartość
procesor Minimalna ilość rdzeni procesora CPU do użycia przez kontener. Więcej informacji:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
Int
cpuLimit Maksymalna liczba rdzeni procesora CPU, które mogą być używane przez kontener. Więcej informacji:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
Int
fpga Liczba urządzeń FPGA PCIE uwidocznionych w kontenerze. Musi mieć wielokrotność 2. Int
Gpu Liczba rdzeni procesora GPU w kontenerze. Int
memoryInGB Minimalna ilość pamięci (w GB) do użycia przez kontener. Więcej informacji:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
Int
memoryInGBLimit Maksymalna ilość pamięci (w GB) dozwolona do użycia przez kontener. Więcej informacji:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
Int

DataPathAssetReference

Nazwa Opis Wartość
datastoreId Identyfikator zasobu usługi ARM magazynu danych, w którym znajduje się zasób. struna
ścieżka Ścieżka pliku/katalogu w magazynie danych. struna
referenceType [Wymagane] Określa typ odwołania do zasobu. "DataPath" (wymagane)

IdAssetReference

Nazwa Opis Wartość
assetId [Wymagane] Identyfikator zasobu usługi ARM. struna

Ograniczenia:
Wzorzec = [a-zA-Z0-9_] (wymagane)
referenceType [Wymagane] Określa typ odwołania do zasobu. "Id" (wymagany)

K8SOnlineDeployment

Nazwa Opis Wartość
containerResourceRequirements Wymagania dotyczące zasobów dla każdego wystąpienia kontenera we wdrożeniu online. ContainerResourceRequirements
endpointComputeType [Wymagane] Typ obliczeniowy punktu końcowego. "K8S" (wymagane)

ManagedOnlineDeployment

Nazwa Opis Wartość
endpointComputeType [Wymagane] Typ obliczeniowy punktu końcowego. "Zarządzane" (wymagane)
instanceType Typ wystąpienia obliczeniowego. struna
gotowośćProbe Konfiguracja sondy liveness/readiness kontenera wdrożenia. ProbeSettings

ManualScaleSettings

Nazwa Opis Wartość
instanceCount Stała liczba wystąpień dla tego wdrożenia. Int
scaleType [Wymagane] Typ algorytmu skalowania wdrożenia "Ręczne" (wymagane)

Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments

Nazwa Opis Wartość
apiVersion Wersja interfejsu API "2021-03-01-preview"
tożsamość Tożsamość usługi skojarzona z zasobem. ResourceIdentity
rodzaj Metadane używane przez portal/narzędzia/itp. do renderowania różnych środowisk środowiska użytkownika dla zasobów tego samego typu. struna
lokalizacja Lokalizacja geograficzna, w której znajduje się zasób ciąg (wymagany)
nazwa Nazwa zasobu struna

Ograniczenia:
Wzorzec = ^[a-zA-Z0-9][a-zA-Z0-9\-_]{0,254}$ (wymagane)
Właściwości [Wymagane] Dodatkowe atrybuty jednostki. OnlineDeployment (wymagane)
Tagi Tagi zasobów Słownik nazw tagów i wartości. Zobacz tagi w szablonach
typ Typ zasobu "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments"

Wdrażanie w trybie online

Nazwa Opis Wartość
appInsightsEnabled Jeśli wartość true, włącza rejestrowanie usługi Application Insights. Bool
codeConfiguration Konfiguracja kodu dla wdrożenia punktu końcowego. CodeConfiguration
opis Opis wdrożenia punktu końcowego. struna
endpointComputeType Ustaw wartość "K8S" dla typu K8SOnlineDeployment. Ustaw wartość "Managed" dla typu ManagedOnlineDeployment. "K8S"
"Zarządzane" (wymagane)
environmentId Identyfikator zasobu usługi ARM specyfikacji środowiska dla wdrożenia punktu końcowego. struna
environmentVariables Konfiguracja zmiennych środowiskowych dla wdrożenia. OnlineDeploymentEnvironmentVariables
livenessProbe Konfiguracja sondy liveness/readiness kontenera wdrożenia. ProbeSettings
model Odwołanie do zasobu modelu dla wdrożenia punktu końcowego. AssetReferenceBase
Właściwości Słownik właściwości. Właściwości można dodawać, ale nie usuwać ani zmieniać. OnlineDeploymentProperties
requestSettings Konfiguracja żądań oceniania wdrożenia online. OnlineRequestSettings
scaleSettings Konfiguracja skalowania wdrożenia online. OnlineScaleSettings

OnlineDeploymentEnvironmentVariables

Nazwa Opis Wartość

Właściwości elementu OnlineDeploymentProperties

Nazwa Opis Wartość

OnlineRequestSettings

Nazwa Opis Wartość
maxConcurrentRequestsPerInstance Liczba żądań dozwolonych do kolejkowania jednocześnie dla tego wdrożenia. Int
maxQueueWait Maksymalny czas oczekiwania kolejki w formacie ISO 8601. Obsługuje precyzję milisekund. struna
requestTimeout Limit czasu żądania w formacie ISO 8601. Obsługuje precyzję milisekund. struna

OnlineScaleSettings

Nazwa Opis Wartość
maxInstances Maksymalna liczba wystąpień dla tego wdrożenia. Int
minInstances Minimalna liczba wystąpień dla tego wdrożenia. Int
scaleType Ustaw wartość "Auto" dla typu AutoScaleSettings. Ustaw wartość "Manual" dla typu ManualScaleSettings. "Auto"
"Ręczne" (wymagane)

OutputPathAssetReference

Nazwa Opis Wartość
identyfikator zadania Identyfikator zasobu usługi ARM zadania. struna
ścieżka Ścieżka pliku/katalogu w danych wyjściowych zadania. struna
referenceType [Wymagane] Określa typ odwołania do zasobu. "OutputPath" (wymagane)

ProbeSettings

Nazwa Opis Wartość
failureThreshold Liczba niepowodzeń, które mają być dozwolone przed zwróceniem stanu złej kondycji. Int
initialDelay Opóźnienie przed pierwszą sondą w formacie ISO 8601. struna
okres Czas między sondami w formacie ISO 8601. struna
successThreshold Liczba pomyślnych sond przed zwróceniem stanu dobrej kondycji. Int
Limit czasu Limit czasu sondy w formacie ISO 8601. struna

Identyfikator zasobu

Nazwa Opis Wartość
typ Definiuje wartości typu ResourceIdentity. "Brak"
"SystemAssigned"
"SystemAssigned,UserAssigned"
"UserAssigned"
userAssignedIdentities Słownik tożsamości przypisanych przez użytkownika, klucz jest identyfikatorem zasobu usługi ARM interfejsu użytkownika. ResourceIdentityUserAssignedIdentities

ResourceIdentityUserAssignedIdentities

Nazwa Opis Wartość

TrackedResourceTags

Nazwa Opis Wartość

UserAssignedIdentityMeta

Nazwa Opis Wartość
clientId Identyfikator aplikacji , unikatowy identyfikator wygenerowany przez usługę Azure AD, który jest powiązany z aplikacją i jednostką usługi podczas początkowej aprowizacji. struna
principalId Identyfikator obiektu jednostki usługi dla tożsamości zarządzanej, który służy do udzielania dostępu opartego na rolach do zasobu platformy Azure. struna

Definicja zasobu narzędzia Terraform (dostawcy AzAPI)

Typ zasobu obszary robocze/onlineEndpoints/deployments można wdrożyć przy użyciu operacji docelowych:

  • grupy zasobów

Aby uzyskać listę zmienionych właściwości w każdej wersji interfejsu API, zobacz dziennika zmian.

Format zasobu

Aby utworzyć zasób Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments, dodaj następujący program Terraform do szablonu.

resource "azapi_resource" "symbolicname" {
  type = "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2021-03-01-preview"
  name = "string"
  identity = {
    type = "string"
    userAssignedIdentities = {
      {customized property} = {
        clientId = "string"
        principalId = "string"
      }
    }
  }
  kind = "string"
  location = "string"
  tags = {
    {customized property} = "string"
  }
  body = jsonencode({
    properties = {
      appInsightsEnabled = bool
      codeConfiguration = {
        codeId = "string"
        scoringScript = "string"
      }
      description = "string"
      environmentId = "string"
      environmentVariables = {
        {customized property} = "string"
      }
      livenessProbe = {
        failureThreshold = int
        initialDelay = "string"
        period = "string"
        successThreshold = int
        timeout = "string"
      }
      model = {
        referenceType = "string"
        // For remaining properties, see AssetReferenceBase objects
      }
      properties = {
        {customized property} = "string"
      }
      requestSettings = {
        maxConcurrentRequestsPerInstance = int
        maxQueueWait = "string"
        requestTimeout = "string"
      }
      scaleSettings = {
        maxInstances = int
        minInstances = int
        scaleType = "string"
        // For remaining properties, see OnlineScaleSettings objects
      }
      endpointComputeType = "string"
      // For remaining properties, see OnlineDeployment objects
    }
  })
}

Obiekty AssetReferenceBase

Ustaw właściwość referenceType, aby określić typ obiektu.

W przypadku DataPath użyj:

{
  datastoreId = "string"
  path = "string"
  referenceType = "DataPath"
}

W przypadkuidentyfikatora użyj:

{
  assetId = "string"
  referenceType = "Id"
}

W przypadku OutputPathużyj:

{
  jobId = "string"
  path = "string"
  referenceType = "OutputPath"
}

Obiekty OnlineDeployment

Ustaw właściwość endpointComputeType, aby określić typ obiektu.

W przypadku K8S użyj:

{
  containerResourceRequirements = {
    cpu = int
    cpuLimit = int
    fpga = int
    gpu = int
    memoryInGB = int
    memoryInGBLimit = int
  }
  endpointComputeType = "K8S"
}

W przypadku zarządzanychużyj:

{
  endpointComputeType = "Managed"
  instanceType = "string"
  readinessProbe = {
    failureThreshold = int
    initialDelay = "string"
    period = "string"
    successThreshold = int
    timeout = "string"
  }
}

Obiekty OnlineScaleSettings

Ustaw właściwość scaleType, aby określić typ obiektu.

W przypadku autoużyj:

{
  pollingInterval = "string"
  scaleType = "Auto"
  targetUtilizationPercentage = int
}

W przypadku ręcznegoużyj:

{
  instanceCount = int
  scaleType = "Manual"
}

Wartości właściwości

AssetReferenceBase

Nazwa Opis Wartość
referenceType Ustaw wartość "DataPath" dla typu DataPathAssetReference. Ustaw wartość "Id" dla typu IdAssetReference. Ustaw wartość "OutputPath" dla typu OutputPathAssetReference. "DataPath"
"Id"
"OutputPath" (wymagane)

AutoskalowanieUstawienia

Nazwa Opis Wartość
pollingInterval Interwał sondowania w formacie ISO 8691. Obsługuje tylko czas trwania z dokładnością do sekund. struna
scaleType [Wymagane] Typ algorytmu skalowania wdrożenia "Auto" (wymagane)
targetU enterprisePercentage Docelowe użycie procesora CPU dla narzędzia do skalowania automatycznego. Int

Konfiguracja kodu

Nazwa Opis Wartość
codeId Identyfikator zasobu usługi ARM zasobu kodu. struna
scoringScript [Wymagane] Skrypt do wykonania podczas uruchamiania. Np. "score.py" struna

Ograniczenia:
Minimalna długość = 1
Wzorzec = [a-zA-Z0-9_] (wymagane)

ContainerResourceRequirements

Nazwa Opis Wartość
procesor Minimalna ilość rdzeni procesora CPU do użycia przez kontener. Więcej informacji:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
Int
cpuLimit Maksymalna liczba rdzeni procesora CPU, które mogą być używane przez kontener. Więcej informacji:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
Int
fpga Liczba urządzeń FPGA PCIE uwidocznionych w kontenerze. Musi mieć wielokrotność 2. Int
Gpu Liczba rdzeni procesora GPU w kontenerze. Int
memoryInGB Minimalna ilość pamięci (w GB) do użycia przez kontener. Więcej informacji:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
Int
memoryInGBLimit Maksymalna ilość pamięci (w GB) dozwolona do użycia przez kontener. Więcej informacji:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
Int

DataPathAssetReference

Nazwa Opis Wartość
datastoreId Identyfikator zasobu usługi ARM magazynu danych, w którym znajduje się zasób. struna
ścieżka Ścieżka pliku/katalogu w magazynie danych. struna
referenceType [Wymagane] Określa typ odwołania do zasobu. "DataPath" (wymagane)

IdAssetReference

Nazwa Opis Wartość
assetId [Wymagane] Identyfikator zasobu usługi ARM. struna

Ograniczenia:
Wzorzec = [a-zA-Z0-9_] (wymagane)
referenceType [Wymagane] Określa typ odwołania do zasobu. "Id" (wymagany)

K8SOnlineDeployment

Nazwa Opis Wartość
containerResourceRequirements Wymagania dotyczące zasobów dla każdego wystąpienia kontenera we wdrożeniu online. ContainerResourceRequirements
endpointComputeType [Wymagane] Typ obliczeniowy punktu końcowego. "K8S" (wymagane)

ManagedOnlineDeployment

Nazwa Opis Wartość
endpointComputeType [Wymagane] Typ obliczeniowy punktu końcowego. "Zarządzane" (wymagane)
instanceType Typ wystąpienia obliczeniowego. struna
gotowośćProbe Konfiguracja sondy liveness/readiness kontenera wdrożenia. ProbeSettings

ManualScaleSettings

Nazwa Opis Wartość
instanceCount Stała liczba wystąpień dla tego wdrożenia. Int
scaleType [Wymagane] Typ algorytmu skalowania wdrożenia "Ręczne" (wymagane)

Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments

Nazwa Opis Wartość
tożsamość Tożsamość usługi skojarzona z zasobem. ResourceIdentity
rodzaj Metadane używane przez portal/narzędzia/itp. do renderowania różnych środowisk środowiska użytkownika dla zasobów tego samego typu. struna
lokalizacja Lokalizacja geograficzna, w której znajduje się zasób ciąg (wymagany)
nazwa Nazwa zasobu struna

Ograniczenia:
Wzorzec = ^[a-zA-Z0-9][a-zA-Z0-9\-_]{0,254}$ (wymagane)
parent_id Identyfikator zasobu, który jest elementem nadrzędnym dla tego zasobu. Identyfikator zasobu typu: obszarów roboczych/onlineEndpoints
Właściwości [Wymagane] Dodatkowe atrybuty jednostki. OnlineDeployment (wymagane)
Tagi Tagi zasobów Słownik nazw tagów i wartości.
typ Typ zasobu "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2021-03-01-preview"

Wdrażanie w trybie online

Nazwa Opis Wartość
appInsightsEnabled Jeśli wartość true, włącza rejestrowanie usługi Application Insights. Bool
codeConfiguration Konfiguracja kodu dla wdrożenia punktu końcowego. CodeConfiguration
opis Opis wdrożenia punktu końcowego. struna
endpointComputeType Ustaw wartość "K8S" dla typu K8SOnlineDeployment. Ustaw wartość "Managed" dla typu ManagedOnlineDeployment. "K8S"
"Zarządzane" (wymagane)
environmentId Identyfikator zasobu usługi ARM specyfikacji środowiska dla wdrożenia punktu końcowego. struna
environmentVariables Konfiguracja zmiennych środowiskowych dla wdrożenia. OnlineDeploymentEnvironmentVariables
livenessProbe Konfiguracja sondy liveness/readiness kontenera wdrożenia. ProbeSettings
model Odwołanie do zasobu modelu dla wdrożenia punktu końcowego. AssetReferenceBase
Właściwości Słownik właściwości. Właściwości można dodawać, ale nie usuwać ani zmieniać. OnlineDeploymentProperties
requestSettings Konfiguracja żądań oceniania wdrożenia online. OnlineRequestSettings
scaleSettings Konfiguracja skalowania wdrożenia online. OnlineScaleSettings

OnlineDeploymentEnvironmentVariables

Nazwa Opis Wartość

Właściwości elementu OnlineDeploymentProperties

Nazwa Opis Wartość

OnlineRequestSettings

Nazwa Opis Wartość
maxConcurrentRequestsPerInstance Liczba żądań dozwolonych do kolejkowania jednocześnie dla tego wdrożenia. Int
maxQueueWait Maksymalny czas oczekiwania kolejki w formacie ISO 8601. Obsługuje precyzję milisekund. struna
requestTimeout Limit czasu żądania w formacie ISO 8601. Obsługuje precyzję milisekund. struna

OnlineScaleSettings

Nazwa Opis Wartość
maxInstances Maksymalna liczba wystąpień dla tego wdrożenia. Int
minInstances Minimalna liczba wystąpień dla tego wdrożenia. Int
scaleType Ustaw wartość "Auto" dla typu AutoScaleSettings. Ustaw wartość "Manual" dla typu ManualScaleSettings. "Auto"
"Ręczne" (wymagane)

OutputPathAssetReference

Nazwa Opis Wartość
identyfikator zadania Identyfikator zasobu usługi ARM zadania. struna
ścieżka Ścieżka pliku/katalogu w danych wyjściowych zadania. struna
referenceType [Wymagane] Określa typ odwołania do zasobu. "OutputPath" (wymagane)

ProbeSettings

Nazwa Opis Wartość
failureThreshold Liczba niepowodzeń, które mają być dozwolone przed zwróceniem stanu złej kondycji. Int
initialDelay Opóźnienie przed pierwszą sondą w formacie ISO 8601. struna
okres Czas między sondami w formacie ISO 8601. struna
successThreshold Liczba pomyślnych sond przed zwróceniem stanu dobrej kondycji. Int
Limit czasu Limit czasu sondy w formacie ISO 8601. struna

Identyfikator zasobu

Nazwa Opis Wartość
typ Definiuje wartości typu ResourceIdentity. "Brak"
"SystemAssigned"
"SystemAssigned,UserAssigned"
"UserAssigned"
userAssignedIdentities Słownik tożsamości przypisanych przez użytkownika, klucz jest identyfikatorem zasobu usługi ARM interfejsu użytkownika. ResourceIdentityUserAssignedIdentities

ResourceIdentityUserAssignedIdentities

Nazwa Opis Wartość

TrackedResourceTags

Nazwa Opis Wartość

UserAssignedIdentityMeta

Nazwa Opis Wartość
clientId Identyfikator aplikacji , unikatowy identyfikator wygenerowany przez usługę Azure AD, który jest powiązany z aplikacją i jednostką usługi podczas początkowej aprowizacji. struna
principalId Identyfikator obiektu jednostki usługi dla tożsamości zarządzanej, który służy do udzielania dostępu opartego na rolach do zasobu platformy Azure. struna