Microsoft.MachineLearningServices workspaces/onlineEndpoints/deployments 2021-03-01-preview
- najnowsze
- 2024-10-01
- 2024-10-01-preview
- 2024-07-01-preview
- 2024-04-01
- 2024-04-01-preview
- 2024-01-01-preview
- 2023-10-01
-
2023-08-01-preview - 2023-06-01-preview
- 2023-04-01
- 2023-04-01-preview
- 2023-02-01-preview
- 2022-12-01-preview
- 2022-10-01
- 2022-10-01-preview
- 2022-06-01-preview
- 2022-05-01
- 2022-02-01-preview
- 2021-03-01-preview
Definicja zasobu Bicep
Typ zasobu obszary robocze/onlineEndpoints/deployments można wdrożyć przy użyciu operacji docelowych:
- grupy zasobów — zobacz polecenia wdrażania grupy zasobów
Aby uzyskać listę zmienionych właściwości w każdej wersji interfejsu API, zobacz dziennika zmian.
Format zasobu
Aby utworzyć zasób Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments, dodaj następujący kod Bicep do szablonu.
resource symbolicname 'Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2021-03-01-preview' = {
parent: resourceSymbolicName
identity: {
type: 'string'
userAssignedIdentities: {
{customized property}: {
clientId: 'string'
principalId: 'string'
}
}
}
kind: 'string'
location: 'string'
name: 'string'
properties: {
appInsightsEnabled: bool
codeConfiguration: {
codeId: 'string'
scoringScript: 'string'
}
description: 'string'
environmentId: 'string'
environmentVariables: {
{customized property}: 'string'
}
livenessProbe: {
failureThreshold: int
initialDelay: 'string'
period: 'string'
successThreshold: int
timeout: 'string'
}
model: {
referenceType: 'string'
// For remaining properties, see AssetReferenceBase objects
}
properties: {
{customized property}: 'string'
}
requestSettings: {
maxConcurrentRequestsPerInstance: int
maxQueueWait: 'string'
requestTimeout: 'string'
}
scaleSettings: {
maxInstances: int
minInstances: int
scaleType: 'string'
// For remaining properties, see OnlineScaleSettings objects
}
endpointComputeType: 'string'
// For remaining properties, see OnlineDeployment objects
}
tags: {
{customized property}: 'string'
}
}
Obiekty AssetReferenceBase
Ustaw właściwość referenceType, aby określić typ obiektu.
W przypadku DataPath użyj:
{
datastoreId: 'string'
path: 'string'
referenceType: 'DataPath'
}
W przypadkuidentyfikatora
{
assetId: 'string'
referenceType: 'Id'
}
W przypadku OutputPathużyj:
{
jobId: 'string'
path: 'string'
referenceType: 'OutputPath'
}
Obiekty OnlineDeployment
Ustaw właściwość endpointComputeType, aby określić typ obiektu.
W przypadku K8S użyj:
{
containerResourceRequirements: {
cpu: int
cpuLimit: int
fpga: int
gpu: int
memoryInGB: int
memoryInGBLimit: int
}
endpointComputeType: 'K8S'
}
W przypadku zarządzanychużyj:
{
endpointComputeType: 'Managed'
instanceType: 'string'
readinessProbe: {
failureThreshold: int
initialDelay: 'string'
period: 'string'
successThreshold: int
timeout: 'string'
}
}
Obiekty OnlineScaleSettings
Ustaw właściwość scaleType, aby określić typ obiektu.
W przypadku autoużyj:
{
pollingInterval: 'string'
scaleType: 'Auto'
targetUtilizationPercentage: int
}
W przypadku ręcznegoużyj:
{
instanceCount: int
scaleType: 'Manual'
}
Wartości właściwości
AssetReferenceBase
Nazwa | Opis | Wartość |
---|---|---|
referenceType | Ustaw wartość "DataPath" dla typu DataPathAssetReference. Ustaw wartość "Id" dla typu IdAssetReference. Ustaw wartość "OutputPath" dla typu OutputPathAssetReference. | "DataPath" "Id" "OutputPath" (wymagane) |
AutoskalowanieUstawienia
Nazwa | Opis | Wartość |
---|---|---|
pollingInterval | Interwał sondowania w formacie ISO 8691. Obsługuje tylko czas trwania z dokładnością do sekund. | struna |
scaleType | [Wymagane] Typ algorytmu skalowania wdrożenia | "Auto" (wymagane) |
targetU enterprisePercentage | Docelowe użycie procesora CPU dla narzędzia do skalowania automatycznego. | Int |
Konfiguracja kodu
Nazwa | Opis | Wartość |
---|---|---|
codeId | Identyfikator zasobu usługi ARM zasobu kodu. | struna |
scoringScript | [Wymagane] Skrypt do wykonania podczas uruchamiania. Np. "score.py" | struna Ograniczenia: Minimalna długość = 1 Wzorzec = [a-zA-Z0-9_] (wymagane) |
ContainerResourceRequirements
Nazwa | Opis | Wartość |
---|---|---|
procesor | Minimalna ilość rdzeni procesora CPU do użycia przez kontener. Więcej informacji: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
Int |
cpuLimit | Maksymalna liczba rdzeni procesora CPU, które mogą być używane przez kontener. Więcej informacji: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
Int |
fpga | Liczba urządzeń FPGA PCIE uwidocznionych w kontenerze. Musi mieć wielokrotność 2. | Int |
Gpu | Liczba rdzeni procesora GPU w kontenerze. | Int |
memoryInGB | Minimalna ilość pamięci (w GB) do użycia przez kontener. Więcej informacji: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
Int |
memoryInGBLimit | Maksymalna ilość pamięci (w GB) dozwolona do użycia przez kontener. Więcej informacji: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
Int |
DataPathAssetReference
Nazwa | Opis | Wartość |
---|---|---|
datastoreId | Identyfikator zasobu usługi ARM magazynu danych, w którym znajduje się zasób. | struna |
ścieżka | Ścieżka pliku/katalogu w magazynie danych. | struna |
referenceType | [Wymagane] Określa typ odwołania do zasobu. | "DataPath" (wymagane) |
IdAssetReference
Nazwa | Opis | Wartość |
---|---|---|
assetId | [Wymagane] Identyfikator zasobu usługi ARM. | struna Ograniczenia: Wzorzec = [a-zA-Z0-9_] (wymagane) |
referenceType | [Wymagane] Określa typ odwołania do zasobu. | "Id" (wymagany) |
K8SOnlineDeployment
Nazwa | Opis | Wartość |
---|---|---|
containerResourceRequirements | Wymagania dotyczące zasobów dla każdego wystąpienia kontenera we wdrożeniu online. | ContainerResourceRequirements |
endpointComputeType | [Wymagane] Typ obliczeniowy punktu końcowego. | "K8S" (wymagane) |
ManagedOnlineDeployment
Nazwa | Opis | Wartość |
---|---|---|
endpointComputeType | [Wymagane] Typ obliczeniowy punktu końcowego. | "Zarządzane" (wymagane) |
instanceType | Typ wystąpienia obliczeniowego. | struna |
gotowośćProbe | Konfiguracja sondy liveness/readiness kontenera wdrożenia. | ProbeSettings |
ManualScaleSettings
Nazwa | Opis | Wartość |
---|---|---|
instanceCount | Stała liczba wystąpień dla tego wdrożenia. | Int |
scaleType | [Wymagane] Typ algorytmu skalowania wdrożenia | "Ręczne" (wymagane) |
Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments
Nazwa | Opis | Wartość |
---|---|---|
tożsamość | Tożsamość usługi skojarzona z zasobem. | ResourceIdentity |
rodzaj | Metadane używane przez portal/narzędzia/itp. do renderowania różnych środowisk środowiska użytkownika dla zasobów tego samego typu. | struna |
lokalizacja | Lokalizacja geograficzna, w której znajduje się zasób | ciąg (wymagany) |
nazwa | Nazwa zasobu | struna Ograniczenia: Wzorzec = ^[a-zA-Z0-9][a-zA-Z0-9\-_]{0,254}$ (wymagane) |
rodzic | W Bicep można określić zasób nadrzędny dla zasobu podrzędnego. Tę właściwość należy dodać tylko wtedy, gdy zasób podrzędny jest zadeklarowany poza zasobem nadrzędnym. Aby uzyskać więcej informacji, zobacz Zasób podrzędny poza zasobem nadrzędnym. |
Nazwa symboliczna zasobu typu: obszarów roboczych/onlineEndpoints |
Właściwości | [Wymagane] Dodatkowe atrybuty jednostki. | OnlineDeployment (wymagane) |
Tagi | Tagi zasobów | Słownik nazw tagów i wartości. Zobacz tagi w szablonach |
Wdrażanie w trybie online
Nazwa | Opis | Wartość |
---|---|---|
appInsightsEnabled | Jeśli wartość true, włącza rejestrowanie usługi Application Insights. | Bool |
codeConfiguration | Konfiguracja kodu dla wdrożenia punktu końcowego. | CodeConfiguration |
opis | Opis wdrożenia punktu końcowego. | struna |
endpointComputeType | Ustaw wartość "K8S" dla typu K8SOnlineDeployment. Ustaw wartość "Managed" dla typu ManagedOnlineDeployment. | "K8S" "Zarządzane" (wymagane) |
environmentId | Identyfikator zasobu usługi ARM specyfikacji środowiska dla wdrożenia punktu końcowego. | struna |
environmentVariables | Konfiguracja zmiennych środowiskowych dla wdrożenia. | OnlineDeploymentEnvironmentVariables |
livenessProbe | Konfiguracja sondy liveness/readiness kontenera wdrożenia. | ProbeSettings |
model | Odwołanie do zasobu modelu dla wdrożenia punktu końcowego. | AssetReferenceBase |
Właściwości | Słownik właściwości. Właściwości można dodawać, ale nie usuwać ani zmieniać. | OnlineDeploymentProperties |
requestSettings | Konfiguracja żądań oceniania wdrożenia online. | |
scaleSettings | Konfiguracja skalowania wdrożenia online. | OnlineScaleSettings |
OnlineDeploymentEnvironmentVariables
Nazwa | Opis | Wartość |
---|
Właściwości elementu OnlineDeploymentProperties
Nazwa | Opis | Wartość |
---|
OnlineRequestSettings
Nazwa | Opis | Wartość |
---|---|---|
maxConcurrentRequestsPerInstance | Liczba żądań dozwolonych do kolejkowania jednocześnie dla tego wdrożenia. | Int |
maxQueueWait | Maksymalny czas oczekiwania kolejki w formacie ISO 8601. Obsługuje precyzję milisekund. | struna |
requestTimeout | Limit czasu żądania w formacie ISO 8601. Obsługuje precyzję milisekund. | struna |
OnlineScaleSettings
Nazwa | Opis | Wartość |
---|---|---|
maxInstances | Maksymalna liczba wystąpień dla tego wdrożenia. | Int |
minInstances | Minimalna liczba wystąpień dla tego wdrożenia. | Int |
scaleType | Ustaw wartość "Auto" dla typu AutoScaleSettings. Ustaw wartość "Manual" dla typu ManualScaleSettings. | "Auto" "Ręczne" (wymagane) |
OutputPathAssetReference
Nazwa | Opis | Wartość |
---|---|---|
identyfikator zadania | Identyfikator zasobu usługi ARM zadania. | struna |
ścieżka | Ścieżka pliku/katalogu w danych wyjściowych zadania. | struna |
referenceType | [Wymagane] Określa typ odwołania do zasobu. | "OutputPath" (wymagane) |
ProbeSettings
Nazwa | Opis | Wartość |
---|---|---|
failureThreshold | Liczba niepowodzeń, które mają być dozwolone przed zwróceniem stanu złej kondycji. | Int |
initialDelay | Opóźnienie przed pierwszą sondą w formacie ISO 8601. | struna |
okres | Czas między sondami w formacie ISO 8601. | struna |
successThreshold | Liczba pomyślnych sond przed zwróceniem stanu dobrej kondycji. | Int |
Limit czasu | Limit czasu sondy w formacie ISO 8601. | struna |
Identyfikator zasobu
Nazwa | Opis | Wartość |
---|---|---|
typ | Definiuje wartości typu ResourceIdentity. | "Brak" "SystemAssigned" "SystemAssigned,UserAssigned" "UserAssigned" |
userAssignedIdentities | Słownik tożsamości przypisanych przez użytkownika, klucz jest identyfikatorem zasobu usługi ARM interfejsu użytkownika. | ResourceIdentityUserAssignedIdentities |
ResourceIdentityUserAssignedIdentities
Nazwa | Opis | Wartość |
---|
TrackedResourceTags
Nazwa | Opis | Wartość |
---|
UserAssignedIdentityMeta
Nazwa | Opis | Wartość |
---|---|---|
clientId | Identyfikator aplikacji , unikatowy identyfikator wygenerowany przez usługę Azure AD, który jest powiązany z aplikacją i jednostką usługi podczas początkowej aprowizacji. | struna |
principalId | Identyfikator obiektu jednostki usługi dla tożsamości zarządzanej, który służy do udzielania dostępu opartego na rolach do zasobu platformy Azure. | struna |
Definicja zasobu szablonu usługi ARM
Typ zasobu obszary robocze/onlineEndpoints/deployments można wdrożyć przy użyciu operacji docelowych:
- grupy zasobów — zobacz polecenia wdrażania grupy zasobów
Aby uzyskać listę zmienionych właściwości w każdej wersji interfejsu API, zobacz dziennika zmian.
Format zasobu
Aby utworzyć zasób Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments, dodaj następujący kod JSON do szablonu.
{
"type": "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments",
"apiVersion": "2021-03-01-preview",
"name": "string",
"identity": {
"type": "string",
"userAssignedIdentities": {
"{customized property}": {
"clientId": "string",
"principalId": "string"
}
}
},
"kind": "string",
"location": "string",
"properties": {
"appInsightsEnabled": "bool",
"codeConfiguration": {
"codeId": "string",
"scoringScript": "string"
},
"description": "string",
"environmentId": "string",
"environmentVariables": {
"{customized property}": "string"
},
"livenessProbe": {
"failureThreshold": "int",
"initialDelay": "string",
"period": "string",
"successThreshold": "int",
"timeout": "string"
},
"model": {
"referenceType": "string"
// For remaining properties, see AssetReferenceBase objects
},
"properties": {
"{customized property}": "string"
},
"requestSettings": {
"maxConcurrentRequestsPerInstance": "int",
"maxQueueWait": "string",
"requestTimeout": "string"
},
"scaleSettings": {
"maxInstances": "int",
"minInstances": "int",
"scaleType": "string"
// For remaining properties, see OnlineScaleSettings objects
},
"endpointComputeType": "string"
// For remaining properties, see OnlineDeployment objects
},
"tags": {
"{customized property}": "string"
}
}
Obiekty AssetReferenceBase
Ustaw właściwość referenceType, aby określić typ obiektu.
W przypadku DataPath użyj:
{
"datastoreId": "string",
"path": "string",
"referenceType": "DataPath"
}
W przypadkuidentyfikatora
{
"assetId": "string",
"referenceType": "Id"
}
W przypadku OutputPathużyj:
{
"jobId": "string",
"path": "string",
"referenceType": "OutputPath"
}
Obiekty OnlineDeployment
Ustaw właściwość endpointComputeType, aby określić typ obiektu.
W przypadku K8S użyj:
{
"containerResourceRequirements": {
"cpu": "int",
"cpuLimit": "int",
"fpga": "int",
"gpu": "int",
"memoryInGB": "int",
"memoryInGBLimit": "int"
},
"endpointComputeType": "K8S"
}
W przypadku zarządzanychużyj:
{
"endpointComputeType": "Managed",
"instanceType": "string",
"readinessProbe": {
"failureThreshold": "int",
"initialDelay": "string",
"period": "string",
"successThreshold": "int",
"timeout": "string"
}
}
Obiekty OnlineScaleSettings
Ustaw właściwość scaleType, aby określić typ obiektu.
W przypadku autoużyj:
{
"pollingInterval": "string",
"scaleType": "Auto",
"targetUtilizationPercentage": "int"
}
W przypadku ręcznegoużyj:
{
"instanceCount": "int",
"scaleType": "Manual"
}
Wartości właściwości
AssetReferenceBase
Nazwa | Opis | Wartość |
---|---|---|
referenceType | Ustaw wartość "DataPath" dla typu DataPathAssetReference. Ustaw wartość "Id" dla typu IdAssetReference. Ustaw wartość "OutputPath" dla typu OutputPathAssetReference. | "DataPath" "Id" "OutputPath" (wymagane) |
AutoskalowanieUstawienia
Nazwa | Opis | Wartość |
---|---|---|
pollingInterval | Interwał sondowania w formacie ISO 8691. Obsługuje tylko czas trwania z dokładnością do sekund. | struna |
scaleType | [Wymagane] Typ algorytmu skalowania wdrożenia | "Auto" (wymagane) |
targetU enterprisePercentage | Docelowe użycie procesora CPU dla narzędzia do skalowania automatycznego. | Int |
Konfiguracja kodu
Nazwa | Opis | Wartość |
---|---|---|
codeId | Identyfikator zasobu usługi ARM zasobu kodu. | struna |
scoringScript | [Wymagane] Skrypt do wykonania podczas uruchamiania. Np. "score.py" | struna Ograniczenia: Minimalna długość = 1 Wzorzec = [a-zA-Z0-9_] (wymagane) |
ContainerResourceRequirements
Nazwa | Opis | Wartość |
---|---|---|
procesor | Minimalna ilość rdzeni procesora CPU do użycia przez kontener. Więcej informacji: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
Int |
cpuLimit | Maksymalna liczba rdzeni procesora CPU, które mogą być używane przez kontener. Więcej informacji: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
Int |
fpga | Liczba urządzeń FPGA PCIE uwidocznionych w kontenerze. Musi mieć wielokrotność 2. | Int |
Gpu | Liczba rdzeni procesora GPU w kontenerze. | Int |
memoryInGB | Minimalna ilość pamięci (w GB) do użycia przez kontener. Więcej informacji: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
Int |
memoryInGBLimit | Maksymalna ilość pamięci (w GB) dozwolona do użycia przez kontener. Więcej informacji: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
Int |
DataPathAssetReference
Nazwa | Opis | Wartość |
---|---|---|
datastoreId | Identyfikator zasobu usługi ARM magazynu danych, w którym znajduje się zasób. | struna |
ścieżka | Ścieżka pliku/katalogu w magazynie danych. | struna |
referenceType | [Wymagane] Określa typ odwołania do zasobu. | "DataPath" (wymagane) |
IdAssetReference
Nazwa | Opis | Wartość |
---|---|---|
assetId | [Wymagane] Identyfikator zasobu usługi ARM. | struna Ograniczenia: Wzorzec = [a-zA-Z0-9_] (wymagane) |
referenceType | [Wymagane] Określa typ odwołania do zasobu. | "Id" (wymagany) |
K8SOnlineDeployment
Nazwa | Opis | Wartość |
---|---|---|
containerResourceRequirements | Wymagania dotyczące zasobów dla każdego wystąpienia kontenera we wdrożeniu online. | ContainerResourceRequirements |
endpointComputeType | [Wymagane] Typ obliczeniowy punktu końcowego. | "K8S" (wymagane) |
ManagedOnlineDeployment
Nazwa | Opis | Wartość |
---|---|---|
endpointComputeType | [Wymagane] Typ obliczeniowy punktu końcowego. | "Zarządzane" (wymagane) |
instanceType | Typ wystąpienia obliczeniowego. | struna |
gotowośćProbe | Konfiguracja sondy liveness/readiness kontenera wdrożenia. | ProbeSettings |
ManualScaleSettings
Nazwa | Opis | Wartość |
---|---|---|
instanceCount | Stała liczba wystąpień dla tego wdrożenia. | Int |
scaleType | [Wymagane] Typ algorytmu skalowania wdrożenia | "Ręczne" (wymagane) |
Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments
Nazwa | Opis | Wartość |
---|---|---|
apiVersion | Wersja interfejsu API | "2021-03-01-preview" |
tożsamość | Tożsamość usługi skojarzona z zasobem. | ResourceIdentity |
rodzaj | Metadane używane przez portal/narzędzia/itp. do renderowania różnych środowisk środowiska użytkownika dla zasobów tego samego typu. | struna |
lokalizacja | Lokalizacja geograficzna, w której znajduje się zasób | ciąg (wymagany) |
nazwa | Nazwa zasobu | struna Ograniczenia: Wzorzec = ^[a-zA-Z0-9][a-zA-Z0-9\-_]{0,254}$ (wymagane) |
Właściwości | [Wymagane] Dodatkowe atrybuty jednostki. | OnlineDeployment (wymagane) |
Tagi | Tagi zasobów | Słownik nazw tagów i wartości. Zobacz tagi w szablonach |
typ | Typ zasobu | "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments" |
Wdrażanie w trybie online
Nazwa | Opis | Wartość |
---|---|---|
appInsightsEnabled | Jeśli wartość true, włącza rejestrowanie usługi Application Insights. | Bool |
codeConfiguration | Konfiguracja kodu dla wdrożenia punktu końcowego. | CodeConfiguration |
opis | Opis wdrożenia punktu końcowego. | struna |
endpointComputeType | Ustaw wartość "K8S" dla typu K8SOnlineDeployment. Ustaw wartość "Managed" dla typu ManagedOnlineDeployment. | "K8S" "Zarządzane" (wymagane) |
environmentId | Identyfikator zasobu usługi ARM specyfikacji środowiska dla wdrożenia punktu końcowego. | struna |
environmentVariables | Konfiguracja zmiennych środowiskowych dla wdrożenia. | OnlineDeploymentEnvironmentVariables |
livenessProbe | Konfiguracja sondy liveness/readiness kontenera wdrożenia. | ProbeSettings |
model | Odwołanie do zasobu modelu dla wdrożenia punktu końcowego. | AssetReferenceBase |
Właściwości | Słownik właściwości. Właściwości można dodawać, ale nie usuwać ani zmieniać. | OnlineDeploymentProperties |
requestSettings | Konfiguracja żądań oceniania wdrożenia online. | |
scaleSettings | Konfiguracja skalowania wdrożenia online. | OnlineScaleSettings |
OnlineDeploymentEnvironmentVariables
Nazwa | Opis | Wartość |
---|
Właściwości elementu OnlineDeploymentProperties
Nazwa | Opis | Wartość |
---|
OnlineRequestSettings
Nazwa | Opis | Wartość |
---|---|---|
maxConcurrentRequestsPerInstance | Liczba żądań dozwolonych do kolejkowania jednocześnie dla tego wdrożenia. | Int |
maxQueueWait | Maksymalny czas oczekiwania kolejki w formacie ISO 8601. Obsługuje precyzję milisekund. | struna |
requestTimeout | Limit czasu żądania w formacie ISO 8601. Obsługuje precyzję milisekund. | struna |
OnlineScaleSettings
Nazwa | Opis | Wartość |
---|---|---|
maxInstances | Maksymalna liczba wystąpień dla tego wdrożenia. | Int |
minInstances | Minimalna liczba wystąpień dla tego wdrożenia. | Int |
scaleType | Ustaw wartość "Auto" dla typu AutoScaleSettings. Ustaw wartość "Manual" dla typu ManualScaleSettings. | "Auto" "Ręczne" (wymagane) |
OutputPathAssetReference
Nazwa | Opis | Wartość |
---|---|---|
identyfikator zadania | Identyfikator zasobu usługi ARM zadania. | struna |
ścieżka | Ścieżka pliku/katalogu w danych wyjściowych zadania. | struna |
referenceType | [Wymagane] Określa typ odwołania do zasobu. | "OutputPath" (wymagane) |
ProbeSettings
Nazwa | Opis | Wartość |
---|---|---|
failureThreshold | Liczba niepowodzeń, które mają być dozwolone przed zwróceniem stanu złej kondycji. | Int |
initialDelay | Opóźnienie przed pierwszą sondą w formacie ISO 8601. | struna |
okres | Czas między sondami w formacie ISO 8601. | struna |
successThreshold | Liczba pomyślnych sond przed zwróceniem stanu dobrej kondycji. | Int |
Limit czasu | Limit czasu sondy w formacie ISO 8601. | struna |
Identyfikator zasobu
Nazwa | Opis | Wartość |
---|---|---|
typ | Definiuje wartości typu ResourceIdentity. | "Brak" "SystemAssigned" "SystemAssigned,UserAssigned" "UserAssigned" |
userAssignedIdentities | Słownik tożsamości przypisanych przez użytkownika, klucz jest identyfikatorem zasobu usługi ARM interfejsu użytkownika. | ResourceIdentityUserAssignedIdentities |
ResourceIdentityUserAssignedIdentities
Nazwa | Opis | Wartość |
---|
TrackedResourceTags
Nazwa | Opis | Wartość |
---|
UserAssignedIdentityMeta
Nazwa | Opis | Wartość |
---|---|---|
clientId | Identyfikator aplikacji , unikatowy identyfikator wygenerowany przez usługę Azure AD, który jest powiązany z aplikacją i jednostką usługi podczas początkowej aprowizacji. | struna |
principalId | Identyfikator obiektu jednostki usługi dla tożsamości zarządzanej, który służy do udzielania dostępu opartego na rolach do zasobu platformy Azure. | struna |
Definicja zasobu narzędzia Terraform (dostawcy AzAPI)
Typ zasobu obszary robocze/onlineEndpoints/deployments można wdrożyć przy użyciu operacji docelowych:
- grupy zasobów
Aby uzyskać listę zmienionych właściwości w każdej wersji interfejsu API, zobacz dziennika zmian.
Format zasobu
Aby utworzyć zasób Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments, dodaj następujący program Terraform do szablonu.
resource "azapi_resource" "symbolicname" {
type = "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2021-03-01-preview"
name = "string"
identity = {
type = "string"
userAssignedIdentities = {
{customized property} = {
clientId = "string"
principalId = "string"
}
}
}
kind = "string"
location = "string"
tags = {
{customized property} = "string"
}
body = jsonencode({
properties = {
appInsightsEnabled = bool
codeConfiguration = {
codeId = "string"
scoringScript = "string"
}
description = "string"
environmentId = "string"
environmentVariables = {
{customized property} = "string"
}
livenessProbe = {
failureThreshold = int
initialDelay = "string"
period = "string"
successThreshold = int
timeout = "string"
}
model = {
referenceType = "string"
// For remaining properties, see AssetReferenceBase objects
}
properties = {
{customized property} = "string"
}
requestSettings = {
maxConcurrentRequestsPerInstance = int
maxQueueWait = "string"
requestTimeout = "string"
}
scaleSettings = {
maxInstances = int
minInstances = int
scaleType = "string"
// For remaining properties, see OnlineScaleSettings objects
}
endpointComputeType = "string"
// For remaining properties, see OnlineDeployment objects
}
})
}
Obiekty AssetReferenceBase
Ustaw właściwość referenceType, aby określić typ obiektu.
W przypadku DataPath użyj:
{
datastoreId = "string"
path = "string"
referenceType = "DataPath"
}
W przypadkuidentyfikatora
{
assetId = "string"
referenceType = "Id"
}
W przypadku OutputPathużyj:
{
jobId = "string"
path = "string"
referenceType = "OutputPath"
}
Obiekty OnlineDeployment
Ustaw właściwość endpointComputeType, aby określić typ obiektu.
W przypadku K8S użyj:
{
containerResourceRequirements = {
cpu = int
cpuLimit = int
fpga = int
gpu = int
memoryInGB = int
memoryInGBLimit = int
}
endpointComputeType = "K8S"
}
W przypadku zarządzanychużyj:
{
endpointComputeType = "Managed"
instanceType = "string"
readinessProbe = {
failureThreshold = int
initialDelay = "string"
period = "string"
successThreshold = int
timeout = "string"
}
}
Obiekty OnlineScaleSettings
Ustaw właściwość scaleType, aby określić typ obiektu.
W przypadku autoużyj:
{
pollingInterval = "string"
scaleType = "Auto"
targetUtilizationPercentage = int
}
W przypadku ręcznegoużyj:
{
instanceCount = int
scaleType = "Manual"
}
Wartości właściwości
AssetReferenceBase
Nazwa | Opis | Wartość |
---|---|---|
referenceType | Ustaw wartość "DataPath" dla typu DataPathAssetReference. Ustaw wartość "Id" dla typu IdAssetReference. Ustaw wartość "OutputPath" dla typu OutputPathAssetReference. | "DataPath" "Id" "OutputPath" (wymagane) |
AutoskalowanieUstawienia
Nazwa | Opis | Wartość |
---|---|---|
pollingInterval | Interwał sondowania w formacie ISO 8691. Obsługuje tylko czas trwania z dokładnością do sekund. | struna |
scaleType | [Wymagane] Typ algorytmu skalowania wdrożenia | "Auto" (wymagane) |
targetU enterprisePercentage | Docelowe użycie procesora CPU dla narzędzia do skalowania automatycznego. | Int |
Konfiguracja kodu
Nazwa | Opis | Wartość |
---|---|---|
codeId | Identyfikator zasobu usługi ARM zasobu kodu. | struna |
scoringScript | [Wymagane] Skrypt do wykonania podczas uruchamiania. Np. "score.py" | struna Ograniczenia: Minimalna długość = 1 Wzorzec = [a-zA-Z0-9_] (wymagane) |
ContainerResourceRequirements
Nazwa | Opis | Wartość |
---|---|---|
procesor | Minimalna ilość rdzeni procesora CPU do użycia przez kontener. Więcej informacji: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
Int |
cpuLimit | Maksymalna liczba rdzeni procesora CPU, które mogą być używane przez kontener. Więcej informacji: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
Int |
fpga | Liczba urządzeń FPGA PCIE uwidocznionych w kontenerze. Musi mieć wielokrotność 2. | Int |
Gpu | Liczba rdzeni procesora GPU w kontenerze. | Int |
memoryInGB | Minimalna ilość pamięci (w GB) do użycia przez kontener. Więcej informacji: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
Int |
memoryInGBLimit | Maksymalna ilość pamięci (w GB) dozwolona do użycia przez kontener. Więcej informacji: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
Int |
DataPathAssetReference
Nazwa | Opis | Wartość |
---|---|---|
datastoreId | Identyfikator zasobu usługi ARM magazynu danych, w którym znajduje się zasób. | struna |
ścieżka | Ścieżka pliku/katalogu w magazynie danych. | struna |
referenceType | [Wymagane] Określa typ odwołania do zasobu. | "DataPath" (wymagane) |
IdAssetReference
Nazwa | Opis | Wartość |
---|---|---|
assetId | [Wymagane] Identyfikator zasobu usługi ARM. | struna Ograniczenia: Wzorzec = [a-zA-Z0-9_] (wymagane) |
referenceType | [Wymagane] Określa typ odwołania do zasobu. | "Id" (wymagany) |
K8SOnlineDeployment
Nazwa | Opis | Wartość |
---|---|---|
containerResourceRequirements | Wymagania dotyczące zasobów dla każdego wystąpienia kontenera we wdrożeniu online. | ContainerResourceRequirements |
endpointComputeType | [Wymagane] Typ obliczeniowy punktu końcowego. | "K8S" (wymagane) |
ManagedOnlineDeployment
Nazwa | Opis | Wartość |
---|---|---|
endpointComputeType | [Wymagane] Typ obliczeniowy punktu końcowego. | "Zarządzane" (wymagane) |
instanceType | Typ wystąpienia obliczeniowego. | struna |
gotowośćProbe | Konfiguracja sondy liveness/readiness kontenera wdrożenia. | ProbeSettings |
ManualScaleSettings
Nazwa | Opis | Wartość |
---|---|---|
instanceCount | Stała liczba wystąpień dla tego wdrożenia. | Int |
scaleType | [Wymagane] Typ algorytmu skalowania wdrożenia | "Ręczne" (wymagane) |
Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments
Nazwa | Opis | Wartość |
---|---|---|
tożsamość | Tożsamość usługi skojarzona z zasobem. | ResourceIdentity |
rodzaj | Metadane używane przez portal/narzędzia/itp. do renderowania różnych środowisk środowiska użytkownika dla zasobów tego samego typu. | struna |
lokalizacja | Lokalizacja geograficzna, w której znajduje się zasób | ciąg (wymagany) |
nazwa | Nazwa zasobu | struna Ograniczenia: Wzorzec = ^[a-zA-Z0-9][a-zA-Z0-9\-_]{0,254}$ (wymagane) |
parent_id | Identyfikator zasobu, który jest elementem nadrzędnym dla tego zasobu. | Identyfikator zasobu typu: obszarów roboczych/onlineEndpoints |
Właściwości | [Wymagane] Dodatkowe atrybuty jednostki. | OnlineDeployment (wymagane) |
Tagi | Tagi zasobów | Słownik nazw tagów i wartości. |
typ | Typ zasobu | "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2021-03-01-preview" |
Wdrażanie w trybie online
Nazwa | Opis | Wartość |
---|---|---|
appInsightsEnabled | Jeśli wartość true, włącza rejestrowanie usługi Application Insights. | Bool |
codeConfiguration | Konfiguracja kodu dla wdrożenia punktu końcowego. | CodeConfiguration |
opis | Opis wdrożenia punktu końcowego. | struna |
endpointComputeType | Ustaw wartość "K8S" dla typu K8SOnlineDeployment. Ustaw wartość "Managed" dla typu ManagedOnlineDeployment. | "K8S" "Zarządzane" (wymagane) |
environmentId | Identyfikator zasobu usługi ARM specyfikacji środowiska dla wdrożenia punktu końcowego. | struna |
environmentVariables | Konfiguracja zmiennych środowiskowych dla wdrożenia. | OnlineDeploymentEnvironmentVariables |
livenessProbe | Konfiguracja sondy liveness/readiness kontenera wdrożenia. | ProbeSettings |
model | Odwołanie do zasobu modelu dla wdrożenia punktu końcowego. | AssetReferenceBase |
Właściwości | Słownik właściwości. Właściwości można dodawać, ale nie usuwać ani zmieniać. | OnlineDeploymentProperties |
requestSettings | Konfiguracja żądań oceniania wdrożenia online. | |
scaleSettings | Konfiguracja skalowania wdrożenia online. | OnlineScaleSettings |
OnlineDeploymentEnvironmentVariables
Nazwa | Opis | Wartość |
---|
Właściwości elementu OnlineDeploymentProperties
Nazwa | Opis | Wartość |
---|
OnlineRequestSettings
Nazwa | Opis | Wartość |
---|---|---|
maxConcurrentRequestsPerInstance | Liczba żądań dozwolonych do kolejkowania jednocześnie dla tego wdrożenia. | Int |
maxQueueWait | Maksymalny czas oczekiwania kolejki w formacie ISO 8601. Obsługuje precyzję milisekund. | struna |
requestTimeout | Limit czasu żądania w formacie ISO 8601. Obsługuje precyzję milisekund. | struna |
OnlineScaleSettings
Nazwa | Opis | Wartość |
---|---|---|
maxInstances | Maksymalna liczba wystąpień dla tego wdrożenia. | Int |
minInstances | Minimalna liczba wystąpień dla tego wdrożenia. | Int |
scaleType | Ustaw wartość "Auto" dla typu AutoScaleSettings. Ustaw wartość "Manual" dla typu ManualScaleSettings. | "Auto" "Ręczne" (wymagane) |
OutputPathAssetReference
Nazwa | Opis | Wartość |
---|---|---|
identyfikator zadania | Identyfikator zasobu usługi ARM zadania. | struna |
ścieżka | Ścieżka pliku/katalogu w danych wyjściowych zadania. | struna |
referenceType | [Wymagane] Określa typ odwołania do zasobu. | "OutputPath" (wymagane) |
ProbeSettings
Nazwa | Opis | Wartość |
---|---|---|
failureThreshold | Liczba niepowodzeń, które mają być dozwolone przed zwróceniem stanu złej kondycji. | Int |
initialDelay | Opóźnienie przed pierwszą sondą w formacie ISO 8601. | struna |
okres | Czas między sondami w formacie ISO 8601. | struna |
successThreshold | Liczba pomyślnych sond przed zwróceniem stanu dobrej kondycji. | Int |
Limit czasu | Limit czasu sondy w formacie ISO 8601. | struna |
Identyfikator zasobu
Nazwa | Opis | Wartość |
---|---|---|
typ | Definiuje wartości typu ResourceIdentity. | "Brak" "SystemAssigned" "SystemAssigned,UserAssigned" "UserAssigned" |
userAssignedIdentities | Słownik tożsamości przypisanych przez użytkownika, klucz jest identyfikatorem zasobu usługi ARM interfejsu użytkownika. | ResourceIdentityUserAssignedIdentities |
ResourceIdentityUserAssignedIdentities
Nazwa | Opis | Wartość |
---|
TrackedResourceTags
Nazwa | Opis | Wartość |
---|
UserAssignedIdentityMeta
Nazwa | Opis | Wartość |
---|---|---|
clientId | Identyfikator aplikacji , unikatowy identyfikator wygenerowany przez usługę Azure AD, który jest powiązany z aplikacją i jednostką usługi podczas początkowej aprowizacji. | struna |
principalId | Identyfikator obiektu jednostki usługi dla tożsamości zarządzanej, który służy do udzielania dostępu opartego na rolach do zasobu platformy Azure. | struna |