Microsoft.MachineLearningServices workspaces/onlineEndpoints/deployments 2023-06-01-preview
- najnowsze
- 2024-10-01
- 2024-10-01-preview
- 2024-07-01-preview
- 2024-04-01
- 2024-04-01-preview
- 2024-01-01-preview
- 2023-10-01
-
2023-08-01-preview - 2023-06-01-preview
- 2023-04-01
- 2023-04-01-preview
- 2023-02-01-preview
- 2022-12-01-preview
- 2022-10-01
- 2022-10-01-preview
- 2022-06-01-preview
- 2022-05-01
- 2022-02-01-preview
- 2021-03-01-preview
Definicja zasobu Bicep
Typ zasobu obszary robocze/onlineEndpoints/deployments można wdrożyć przy użyciu operacji docelowych:
- grupy zasobów — zobacz polecenia wdrażania grupy zasobów
Aby uzyskać listę zmienionych właściwości w każdej wersji interfejsu API, zobacz dziennika zmian.
Format zasobu
Aby utworzyć zasób Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments, dodaj następujący kod Bicep do szablonu.
resource symbolicname 'Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2023-06-01-preview' = {
identity: {
type: 'string'
userAssignedIdentities: {
{customized property}: {}
}
}
kind: 'string'
location: 'string'
name: 'string'
properties: {
appInsightsEnabled: bool
codeConfiguration: {
codeId: 'string'
scoringScript: 'string'
}
dataCollector: {
collections: {
{customized property}: {
clientId: 'string'
dataCollectionMode: 'string'
dataId: 'string'
samplingRate: int
}
}
requestLogging: {
captureHeaders: [
'string'
]
}
rollingRate: 'string'
}
description: 'string'
egressPublicNetworkAccess: 'string'
environmentId: 'string'
environmentVariables: {
{customized property}: 'string'
}
instanceType: 'string'
livenessProbe: {
failureThreshold: int
initialDelay: 'string'
period: 'string'
successThreshold: int
timeout: 'string'
}
model: 'string'
modelMountPath: 'string'
properties: {
{customized property}: 'string'
}
readinessProbe: {
failureThreshold: int
initialDelay: 'string'
period: 'string'
successThreshold: int
timeout: 'string'
}
requestSettings: {
maxConcurrentRequestsPerInstance: int
maxQueueWait: 'string'
requestTimeout: 'string'
}
scaleSettings: {
scaleType: 'string'
// For remaining properties, see OnlineScaleSettings objects
}
endpointComputeType: 'string'
// For remaining properties, see OnlineDeploymentProperties objects
}
sku: {
capacity: int
family: 'string'
name: 'string'
size: 'string'
tier: 'string'
}
tags: {
{customized property}: 'string'
}
}
Obiekty OnlineScaleSettings
Ustaw właściwość scaleType, aby określić typ obiektu.
W przypadku domyślnejużyj:
{
scaleType: 'Default'
}
W przypadku TargetUscsiużyj:
{
maxInstances: int
minInstances: int
pollingInterval: 'string'
scaleType: 'TargetUtilization'
targetUtilizationPercentage: int
}
Obiekty OnlineDeploymentProperties
Ustaw właściwość endpointComputeType, aby określić typ obiektu.
W przypadku Kubernetes użyj:
{
containerResourceRequirements: {
containerResourceLimits: {
cpu: 'string'
gpu: 'string'
memory: 'string'
}
containerResourceRequests: {
cpu: 'string'
gpu: 'string'
memory: 'string'
}
}
endpointComputeType: 'Kubernetes'
}
W przypadku zarządzanychużyj:
{
endpointComputeType: 'Managed'
}
Wartości właściwości
Konfiguracja kodu
Nazwa | Opis | Wartość |
---|---|---|
codeId | Identyfikator zasobu usługi ARM zasobu kodu. | struna |
scoringScript | [Wymagane] Skrypt do wykonania podczas uruchamiania. Np. "score.py" | struna Ograniczenia: Minimalna długość = 1 Wzorzec = [a-zA-Z0-9_] (wymagane) |
Kolekcja
Nazwa | Opis | Wartość |
---|---|---|
clientId | Identyfikator klienta msi używany do zbierania rejestrowania w magazynie obiektów blob. Jeśli ma wartość null, zaplecze wybierze zarejestrowaną tożsamość punktu końcowego do uwierzytelniania. | struna |
dataCollectionMode | Włączanie lub wyłączanie zbierania danych. | "Wyłączone" "Włączone" |
dataId | Identyfikator zasobu danych arm. Po stronie klienta upewni się, że zasób danych wskazuje magazyn obiektów blob, a zaplecze będzie zbierać dane do magazynu obiektów blob. | struna |
próbkowanieRate | Częstotliwość próbkowania dla kolekcji. Częstotliwość próbkowania 1,0 oznacza, że domyślnie zbieramy 100% danych. | Int |
ContainerResourceRequirements
Nazwa | Opis | Wartość |
---|---|---|
containerResourceLimits | Informacje o limicie zasobów kontenera: | ContainerResourceSettings |
containerResourceRequests | Informacje o żądaniu zasobu kontenera: | ContainerResourceSettings |
ContainerResourceSettings
Nazwa | Opis | Wartość |
---|---|---|
procesor | Liczba żądań/limitu procesorów wirtualnych dla kontenera. Więcej informacji: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
struna |
Gpu | Liczba żądań/limitów kart procesora GPU firmy Nvidia dla kontenera. Więcej informacji: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
struna |
pamięć | Żądanie/limit rozmiaru pamięci dla kontenera. Więcej informacji: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
struna |
DataCollector
Nazwa | Opis | Wartość |
---|---|---|
zbiory | [Wymagane] Konfiguracja kolekcji. Każda kolekcja ma własną konfigurację do zbierania danych modelu, a nazwa kolekcji może być dowolnym ciągiem. Moduł zbierający dane modelu może służyć do rejestrowania ładunku lub rejestrowania niestandardowego albo obu z nich. Żądanie kolekcji i odpowiedź są zarezerwowane do rejestrowania ładunków, inne są przeznaczone do rejestrowania niestandardowego. |
DataCollectorCollections (wymagane) |
requestLogging (rejestrowanie żądań) | Konfiguracja rejestrowania żądań dla usługi mdc zawiera zaawansowane ustawienia rejestrowania dla wszystkich kolekcji. Jest to opcjonalne. | |
rollingRate | Gdy dane modelu są zbierane do magazynu obiektów blob, musimy przerzucić dane do innej ścieżki, aby uniknąć rejestrowania wszystkich z nich w jednym pliku obiektów blob. Jeśli szybkość rolowania wynosi godzinę, wszystkie dane zostaną zebrane w ścieżce obiektu blob /rrrr/MM/dd/HH/. Jeśli jest to dzień, wszystkie dane zostaną zebrane w ścieżce obiektu blob /rrrr/MM/dd/. Inną zaletą ścieżki stopniowej jest to, że interfejs użytkownika monitorowania modelu jest w stanie bardzo szybko wybrać zakres czasu danych. |
"Dzień" "Godzina" "Minuta" "Miesiąc" "Rok" |
DataCollectorCollections
Nazwa | Opis | Wartość |
---|
DefaultScaleSettings
Nazwa | Opis | Wartość |
---|---|---|
scaleType | [Wymagane] Typ algorytmu skalowania wdrożenia | "Wartość domyślna" (wymagana) |
EndpointDeploymentPropertiesBaseEnvironmentVariables
Nazwa | Opis | Wartość |
---|
EndpointDeploymentPropertiesBaseProperties
Nazwa | Opis | Wartość |
---|
KubernetesOnlineDeployment
Nazwa | Opis | Wartość |
---|---|---|
containerResourceRequirements | Wymagania dotyczące zasobów dla kontenera (procesor i pamięć). | ContainerResourceRequirements |
endpointComputeType | [Wymagane] Typ obliczeniowy punktu końcowego. | "Kubernetes" (wymagane) |
ManagedOnlineDeployment
Nazwa | Opis | Wartość |
---|---|---|
endpointComputeType | [Wymagane] Typ obliczeniowy punktu końcowego. | "Zarządzane" (wymagane) |
ManagedServiceIdentity
Nazwa | Opis | Wartość |
---|---|---|
typ | Typ tożsamości usługi zarządzanej (gdzie dozwolone są typy SystemAssigned i UserAssigned). | "Brak" "SystemAssigned" "SystemAssigned,UserAssigned" "UserAssigned" (wymagane) |
userAssignedIdentities | Zestaw tożsamości przypisanych przez użytkownika skojarzonych z zasobem. Klucze słownika userAssignedIdentities będą identyfikatorami zasobów usługi ARM w postaci: "/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. Wartości słownika mogą być pustymi obiektami ({}) w żądaniach. | UserAssignedIdentities |
Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments
Nazwa | Opis | Wartość |
---|---|---|
tożsamość | Tożsamość usługi zarządzanej (tożsamości przypisane przez system i/lub tożsamości przypisane przez użytkownika) | ManagedServiceIdentity |
rodzaj | Metadane używane przez portal/narzędzia/itp. do renderowania różnych środowisk środowiska użytkownika dla zasobów tego samego typu. | struna |
lokalizacja | Lokalizacja geograficzna, w której znajduje się zasób | ciąg (wymagany) |
nazwa | Nazwa zasobu | struna Ograniczenia: Wzorzec = ^[a-zA-Z0-9][a-zA-Z0-9\-_]{0,254}$ (wymagane) |
rodzic | W Bicep można określić zasób nadrzędny dla zasobu podrzędnego. Tę właściwość należy dodać tylko wtedy, gdy zasób podrzędny jest zadeklarowany poza zasobem nadrzędnym. Aby uzyskać więcej informacji, zobacz Zasób podrzędny poza zasobem nadrzędnym. |
Nazwa symboliczna zasobu typu: obszarów roboczych/onlineEndpoints |
Właściwości | [Wymagane] Dodatkowe atrybuty jednostki. | OnlineDeploymentProperties (wymagane) |
Numer jednostki magazynowej | Szczegóły jednostki SKU wymagane dla kontraktu usługi ARM na potrzeby skalowania automatycznego. | sku |
Tagi | Tagi zasobów | Słownik nazw tagów i wartości. Zobacz tagi w szablonach |
Właściwości elementu OnlineDeploymentProperties
Nazwa | Opis | Wartość |
---|---|---|
appInsightsEnabled | Jeśli wartość true, włącza rejestrowanie usługi Application Insights. | Bool |
codeConfiguration | Konfiguracja kodu dla wdrożenia punktu końcowego. | CodeConfiguration |
dataCollector | Konfiguracja mdc wyłączamy wartość mdc, gdy ma wartość null. | DataCollector |
opis | Opis wdrożenia punktu końcowego. | struna |
egressPublicNetworkAccess | W przypadku włączenia zezwalaj na dostęp do sieci publicznej ruchu wychodzącego. Jeśli opcja Wyłączone, spowoduje to utworzenie bezpiecznego ruchu wychodzącego. Ustawienie domyślne: włączone. | "Wyłączone" "Włączone" |
endpointComputeType | Ustaw wartość "Kubernetes" dla typu KubernetesOnlineDeployment. Ustaw wartość "Managed" dla typu ManagedOnlineDeployment. | "Kubernetes" "Zarządzane" (wymagane) |
environmentId | Identyfikator zasobu usługi ARM specyfikacji środowiska dla wdrożenia punktu końcowego. | struna |
environmentVariables | Konfiguracja zmiennych środowiskowych dla wdrożenia. | EndpointDeploymentPropertiesBaseEnvironmentVariables |
instanceType | Typ wystąpienia obliczeniowego. | struna |
livenessProbe | Sonda liveness regularnie monitoruje kondycję kontenera. | ProbeSettings |
model | Ścieżka identyfikatora URI do modelu. | struna |
modelMountPath | Ścieżka do zainstalowania modelu w kontenerze niestandardowym. | struna |
Właściwości | Słownik właściwości. Właściwości można dodawać, ale nie usuwać ani zmieniać. | EndpointDeploymentPropertiesBaseProperties |
gotowośćProbe | Sonda gotowości sprawdza, czy kontener jest gotowy do obsługi ruchu. Właściwości i wartości domyślne są takie same jak sonda aktualności. | ProbeSettings |
requestSettings | Zażądaj ustawień wdrożenia. | |
scaleSettings | Ustawienia skalowania wdrożenia. Jeśli ma wartość null lub nie jest podana, wartość domyślna to TargetUscsiScaleSettings for KubernetesOnlineDeployment i na Wartość DefaultScaleSettings dla elementu ManagedOnlineDeployment. |
OnlineScaleSettings |
OnlineRequestSettings
Nazwa | Opis | Wartość |
---|---|---|
maxConcurrentRequestsPerInstance | Maksymalna liczba współbieżnych żądań na węzeł dozwolonych na wdrożenie. Wartość domyślna to 1. | Int |
maxQueueWait | Maksymalny czas, przez jaki żądanie pozostanie w kolejce w formacie ISO 8601. Wartość domyślna to 500 ms. |
struna |
requestTimeout | Limit czasu oceniania w formacie ISO 8601. Wartość domyślna to 5000 ms. |
struna |
OnlineScaleSettings
Nazwa | Opis | Wartość |
---|---|---|
scaleType | Ustaw wartość "Default" dla typu DefaultScaleSettings. Dla typu TargetUscsiScaleSettingsustaw wartość "TargetUscsi" na wartość . | "Wartość domyślna" "TargetUscsi" (wymagane) |
ProbeSettings
Nazwa | Opis | Wartość |
---|---|---|
failureThreshold | Liczba niepowodzeń, które mają być dozwolone przed zwróceniem stanu złej kondycji. | Int |
initialDelay | Opóźnienie przed pierwszą sondą w formacie ISO 8601. | struna |
okres | Czas między sondami w formacie ISO 8601. | struna |
successThreshold | Liczba pomyślnych sond przed zwróceniem stanu dobrej kondycji. | Int |
Limit czasu | Limit czasu sondy w formacie ISO 8601. | struna |
Rejestrowanie żądań
Nazwa | Opis | Wartość |
---|---|---|
captureHeaders | W przypadku rejestrowania ładunków zbieramy tylko ładunek domyślnie. Jeśli klienci chcą również zebrać określone nagłówki, mogą ustawić je w elementach captureHeaders, aby zaplecze zbierało te nagłówki wraz z ładunkiem. | string[] |
Numer jednostki magazynowej
Nazwa | Opis | Wartość |
---|---|---|
pojemność | Jeśli jednostka SKU obsługuje skalowanie w poziomie/w, należy uwzględnić liczbę całkowitą pojemności. Jeśli skalowanie w poziomie/w nie jest możliwe dla zasobu, może to zostać pominięte. | Int |
rodzina | Jeśli usługa ma różne generacje sprzętu, dla tej samej jednostki SKU, można je przechwycić tutaj. | struna |
nazwa | Nazwa jednostki SKU. Ex - P3. Zazwyczaj jest to kod z literą i cyfrą | ciąg (wymagany) |
rozmiar | Rozmiar jednostki SKU. Gdy pole nazwy jest kombinacją warstwy i innej wartości, będzie to autonomiczny kod. | struna |
kondygnacja | To pole jest wymagane do zaimplementowania przez dostawcę zasobów, jeśli usługa ma więcej niż jedną warstwę, ale nie jest wymagana w put. | "Podstawowa" "Bezpłatna" "Premium" "Standardowa" |
TargetUscsiScaleSettings
Nazwa | Opis | Wartość |
---|---|---|
maxInstances | Maksymalna liczba wystąpień, do których można skalować wdrożenie. Limit przydziału zostanie zarezerwowany dla max_instances. | Int |
minInstances | Minimalna liczba wystąpień, które mają być zawsze obecne. | Int |
pollingInterval | Interwał sondowania w formacie ISO 8691. Obsługuje tylko czas trwania z dokładnością do sekund. | struna |
scaleType | [Wymagane] Typ algorytmu skalowania wdrożenia | "TargetUscsi" (wymagane) |
targetU enterprisePercentage | Docelowe użycie procesora CPU dla narzędzia do skalowania automatycznego. | Int |
TrackedResourceTags
Nazwa | Opis | Wartość |
---|
UserAssignedIdentities
Nazwa | Opis | Wartość |
---|
UserAssignedIdentity
Nazwa | Opis | Wartość |
---|
Definicja zasobu szablonu usługi ARM
Typ zasobu obszary robocze/onlineEndpoints/deployments można wdrożyć przy użyciu operacji docelowych:
- grupy zasobów — zobacz polecenia wdrażania grupy zasobów
Aby uzyskać listę zmienionych właściwości w każdej wersji interfejsu API, zobacz dziennika zmian.
Format zasobu
Aby utworzyć zasób Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments, dodaj następujący kod JSON do szablonu.
{
"type": "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments",
"apiVersion": "2023-06-01-preview",
"name": "string",
"identity": {
"type": "string",
"userAssignedIdentities": {
"{customized property}": {
}
}
},
"kind": "string",
"location": "string",
"properties": {
"appInsightsEnabled": "bool",
"codeConfiguration": {
"codeId": "string",
"scoringScript": "string"
},
"dataCollector": {
"collections": {
"{customized property}": {
"clientId": "string",
"dataCollectionMode": "string",
"dataId": "string",
"samplingRate": "int"
}
},
"requestLogging": {
"captureHeaders": [ "string" ]
},
"rollingRate": "string"
},
"description": "string",
"egressPublicNetworkAccess": "string",
"environmentId": "string",
"environmentVariables": {
"{customized property}": "string"
},
"instanceType": "string",
"livenessProbe": {
"failureThreshold": "int",
"initialDelay": "string",
"period": "string",
"successThreshold": "int",
"timeout": "string"
},
"model": "string",
"modelMountPath": "string",
"properties": {
"{customized property}": "string"
},
"readinessProbe": {
"failureThreshold": "int",
"initialDelay": "string",
"period": "string",
"successThreshold": "int",
"timeout": "string"
},
"requestSettings": {
"maxConcurrentRequestsPerInstance": "int",
"maxQueueWait": "string",
"requestTimeout": "string"
},
"scaleSettings": {
"scaleType": "string"
// For remaining properties, see OnlineScaleSettings objects
},
"endpointComputeType": "string"
// For remaining properties, see OnlineDeploymentProperties objects
},
"sku": {
"capacity": "int",
"family": "string",
"name": "string",
"size": "string",
"tier": "string"
},
"tags": {
"{customized property}": "string"
}
}
Obiekty OnlineScaleSettings
Ustaw właściwość scaleType, aby określić typ obiektu.
W przypadku domyślnejużyj:
{
"scaleType": "Default"
}
W przypadku TargetUscsiużyj:
{
"maxInstances": "int",
"minInstances": "int",
"pollingInterval": "string",
"scaleType": "TargetUtilization",
"targetUtilizationPercentage": "int"
}
Obiekty OnlineDeploymentProperties
Ustaw właściwość endpointComputeType, aby określić typ obiektu.
W przypadku Kubernetes użyj:
{
"containerResourceRequirements": {
"containerResourceLimits": {
"cpu": "string",
"gpu": "string",
"memory": "string"
},
"containerResourceRequests": {
"cpu": "string",
"gpu": "string",
"memory": "string"
}
},
"endpointComputeType": "Kubernetes"
}
W przypadku zarządzanychużyj:
{
"endpointComputeType": "Managed"
}
Wartości właściwości
Konfiguracja kodu
Nazwa | Opis | Wartość |
---|---|---|
codeId | Identyfikator zasobu usługi ARM zasobu kodu. | struna |
scoringScript | [Wymagane] Skrypt do wykonania podczas uruchamiania. Np. "score.py" | struna Ograniczenia: Minimalna długość = 1 Wzorzec = [a-zA-Z0-9_] (wymagane) |
Kolekcja
Nazwa | Opis | Wartość |
---|---|---|
clientId | Identyfikator klienta msi używany do zbierania rejestrowania w magazynie obiektów blob. Jeśli ma wartość null, zaplecze wybierze zarejestrowaną tożsamość punktu końcowego do uwierzytelniania. | struna |
dataCollectionMode | Włączanie lub wyłączanie zbierania danych. | "Wyłączone" "Włączone" |
dataId | Identyfikator zasobu danych arm. Po stronie klienta upewni się, że zasób danych wskazuje magazyn obiektów blob, a zaplecze będzie zbierać dane do magazynu obiektów blob. | struna |
próbkowanieRate | Częstotliwość próbkowania dla kolekcji. Częstotliwość próbkowania 1,0 oznacza, że domyślnie zbieramy 100% danych. | Int |
ContainerResourceRequirements
Nazwa | Opis | Wartość |
---|---|---|
containerResourceLimits | Informacje o limicie zasobów kontenera: | ContainerResourceSettings |
containerResourceRequests | Informacje o żądaniu zasobu kontenera: | ContainerResourceSettings |
ContainerResourceSettings
Nazwa | Opis | Wartość |
---|---|---|
procesor | Liczba żądań/limitu procesorów wirtualnych dla kontenera. Więcej informacji: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
struna |
Gpu | Liczba żądań/limitów kart procesora GPU firmy Nvidia dla kontenera. Więcej informacji: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
struna |
pamięć | Żądanie/limit rozmiaru pamięci dla kontenera. Więcej informacji: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
struna |
DataCollector
Nazwa | Opis | Wartość |
---|---|---|
zbiory | [Wymagane] Konfiguracja kolekcji. Każda kolekcja ma własną konfigurację do zbierania danych modelu, a nazwa kolekcji może być dowolnym ciągiem. Moduł zbierający dane modelu może służyć do rejestrowania ładunku lub rejestrowania niestandardowego albo obu z nich. Żądanie kolekcji i odpowiedź są zarezerwowane do rejestrowania ładunków, inne są przeznaczone do rejestrowania niestandardowego. |
DataCollectorCollections (wymagane) |
requestLogging (rejestrowanie żądań) | Konfiguracja rejestrowania żądań dla usługi mdc zawiera zaawansowane ustawienia rejestrowania dla wszystkich kolekcji. Jest to opcjonalne. | |
rollingRate | Gdy dane modelu są zbierane do magazynu obiektów blob, musimy przerzucić dane do innej ścieżki, aby uniknąć rejestrowania wszystkich z nich w jednym pliku obiektów blob. Jeśli szybkość rolowania wynosi godzinę, wszystkie dane zostaną zebrane w ścieżce obiektu blob /rrrr/MM/dd/HH/. Jeśli jest to dzień, wszystkie dane zostaną zebrane w ścieżce obiektu blob /rrrr/MM/dd/. Inną zaletą ścieżki stopniowej jest to, że interfejs użytkownika monitorowania modelu jest w stanie bardzo szybko wybrać zakres czasu danych. |
"Dzień" "Godzina" "Minuta" "Miesiąc" "Rok" |
DataCollectorCollections
Nazwa | Opis | Wartość |
---|
DefaultScaleSettings
Nazwa | Opis | Wartość |
---|---|---|
scaleType | [Wymagane] Typ algorytmu skalowania wdrożenia | "Wartość domyślna" (wymagana) |
EndpointDeploymentPropertiesBaseEnvironmentVariables
Nazwa | Opis | Wartość |
---|
EndpointDeploymentPropertiesBaseProperties
Nazwa | Opis | Wartość |
---|
KubernetesOnlineDeployment
Nazwa | Opis | Wartość |
---|---|---|
containerResourceRequirements | Wymagania dotyczące zasobów dla kontenera (procesor i pamięć). | ContainerResourceRequirements |
endpointComputeType | [Wymagane] Typ obliczeniowy punktu końcowego. | "Kubernetes" (wymagane) |
ManagedOnlineDeployment
Nazwa | Opis | Wartość |
---|---|---|
endpointComputeType | [Wymagane] Typ obliczeniowy punktu końcowego. | "Zarządzane" (wymagane) |
ManagedServiceIdentity
Nazwa | Opis | Wartość |
---|---|---|
typ | Typ tożsamości usługi zarządzanej (gdzie dozwolone są typy SystemAssigned i UserAssigned). | "Brak" "SystemAssigned" "SystemAssigned,UserAssigned" "UserAssigned" (wymagane) |
userAssignedIdentities | Zestaw tożsamości przypisanych przez użytkownika skojarzonych z zasobem. Klucze słownika userAssignedIdentities będą identyfikatorami zasobów usługi ARM w postaci: "/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. Wartości słownika mogą być pustymi obiektami ({}) w żądaniach. | UserAssignedIdentities |
Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments
Nazwa | Opis | Wartość |
---|---|---|
apiVersion | Wersja interfejsu API | "2023-06-01-preview" |
tożsamość | Tożsamość usługi zarządzanej (tożsamości przypisane przez system i/lub tożsamości przypisane przez użytkownika) | ManagedServiceIdentity |
rodzaj | Metadane używane przez portal/narzędzia/itp. do renderowania różnych środowisk środowiska użytkownika dla zasobów tego samego typu. | struna |
lokalizacja | Lokalizacja geograficzna, w której znajduje się zasób | ciąg (wymagany) |
nazwa | Nazwa zasobu | struna Ograniczenia: Wzorzec = ^[a-zA-Z0-9][a-zA-Z0-9\-_]{0,254}$ (wymagane) |
Właściwości | [Wymagane] Dodatkowe atrybuty jednostki. | OnlineDeploymentProperties (wymagane) |
Numer jednostki magazynowej | Szczegóły jednostki SKU wymagane dla kontraktu usługi ARM na potrzeby skalowania automatycznego. | sku |
Tagi | Tagi zasobów | Słownik nazw tagów i wartości. Zobacz tagi w szablonach |
typ | Typ zasobu | "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments" |
Właściwości elementu OnlineDeploymentProperties
Nazwa | Opis | Wartość |
---|---|---|
appInsightsEnabled | Jeśli wartość true, włącza rejestrowanie usługi Application Insights. | Bool |
codeConfiguration | Konfiguracja kodu dla wdrożenia punktu końcowego. | CodeConfiguration |
dataCollector | Konfiguracja mdc wyłączamy wartość mdc, gdy ma wartość null. | DataCollector |
opis | Opis wdrożenia punktu końcowego. | struna |
egressPublicNetworkAccess | W przypadku włączenia zezwalaj na dostęp do sieci publicznej ruchu wychodzącego. Jeśli opcja Wyłączone, spowoduje to utworzenie bezpiecznego ruchu wychodzącego. Ustawienie domyślne: włączone. | "Wyłączone" "Włączone" |
endpointComputeType | Ustaw wartość "Kubernetes" dla typu KubernetesOnlineDeployment. Ustaw wartość "Managed" dla typu ManagedOnlineDeployment. | "Kubernetes" "Zarządzane" (wymagane) |
environmentId | Identyfikator zasobu usługi ARM specyfikacji środowiska dla wdrożenia punktu końcowego. | struna |
environmentVariables | Konfiguracja zmiennych środowiskowych dla wdrożenia. | EndpointDeploymentPropertiesBaseEnvironmentVariables |
instanceType | Typ wystąpienia obliczeniowego. | struna |
livenessProbe | Sonda liveness regularnie monitoruje kondycję kontenera. | ProbeSettings |
model | Ścieżka identyfikatora URI do modelu. | struna |
modelMountPath | Ścieżka do zainstalowania modelu w kontenerze niestandardowym. | struna |
Właściwości | Słownik właściwości. Właściwości można dodawać, ale nie usuwać ani zmieniać. | EndpointDeploymentPropertiesBaseProperties |
gotowośćProbe | Sonda gotowości sprawdza, czy kontener jest gotowy do obsługi ruchu. Właściwości i wartości domyślne są takie same jak sonda aktualności. | ProbeSettings |
requestSettings | Zażądaj ustawień wdrożenia. | |
scaleSettings | Ustawienia skalowania wdrożenia. Jeśli ma wartość null lub nie jest podana, wartość domyślna to TargetUscsiScaleSettings for KubernetesOnlineDeployment i na Wartość DefaultScaleSettings dla elementu ManagedOnlineDeployment. |
OnlineScaleSettings |
OnlineRequestSettings
Nazwa | Opis | Wartość |
---|---|---|
maxConcurrentRequestsPerInstance | Maksymalna liczba współbieżnych żądań na węzeł dozwolonych na wdrożenie. Wartość domyślna to 1. | Int |
maxQueueWait | Maksymalny czas, przez jaki żądanie pozostanie w kolejce w formacie ISO 8601. Wartość domyślna to 500 ms. |
struna |
requestTimeout | Limit czasu oceniania w formacie ISO 8601. Wartość domyślna to 5000 ms. |
struna |
OnlineScaleSettings
Nazwa | Opis | Wartość |
---|---|---|
scaleType | Ustaw wartość "Default" dla typu DefaultScaleSettings. Dla typu TargetUscsiScaleSettingsustaw wartość "TargetUscsi" na wartość . | "Wartość domyślna" "TargetUscsi" (wymagane) |
ProbeSettings
Nazwa | Opis | Wartość |
---|---|---|
failureThreshold | Liczba niepowodzeń, które mają być dozwolone przed zwróceniem stanu złej kondycji. | Int |
initialDelay | Opóźnienie przed pierwszą sondą w formacie ISO 8601. | struna |
okres | Czas między sondami w formacie ISO 8601. | struna |
successThreshold | Liczba pomyślnych sond przed zwróceniem stanu dobrej kondycji. | Int |
Limit czasu | Limit czasu sondy w formacie ISO 8601. | struna |
Rejestrowanie żądań
Nazwa | Opis | Wartość |
---|---|---|
captureHeaders | W przypadku rejestrowania ładunków zbieramy tylko ładunek domyślnie. Jeśli klienci chcą również zebrać określone nagłówki, mogą ustawić je w elementach captureHeaders, aby zaplecze zbierało te nagłówki wraz z ładunkiem. | string[] |
Numer jednostki magazynowej
Nazwa | Opis | Wartość |
---|---|---|
pojemność | Jeśli jednostka SKU obsługuje skalowanie w poziomie/w, należy uwzględnić liczbę całkowitą pojemności. Jeśli skalowanie w poziomie/w nie jest możliwe dla zasobu, może to zostać pominięte. | Int |
rodzina | Jeśli usługa ma różne generacje sprzętu, dla tej samej jednostki SKU, można je przechwycić tutaj. | struna |
nazwa | Nazwa jednostki SKU. Ex - P3. Zazwyczaj jest to kod z literą i cyfrą | ciąg (wymagany) |
rozmiar | Rozmiar jednostki SKU. Gdy pole nazwy jest kombinacją warstwy i innej wartości, będzie to autonomiczny kod. | struna |
kondygnacja | To pole jest wymagane do zaimplementowania przez dostawcę zasobów, jeśli usługa ma więcej niż jedną warstwę, ale nie jest wymagana w put. | "Podstawowa" "Bezpłatna" "Premium" "Standardowa" |
TargetUscsiScaleSettings
Nazwa | Opis | Wartość |
---|---|---|
maxInstances | Maksymalna liczba wystąpień, do których można skalować wdrożenie. Limit przydziału zostanie zarezerwowany dla max_instances. | Int |
minInstances | Minimalna liczba wystąpień, które mają być zawsze obecne. | Int |
pollingInterval | Interwał sondowania w formacie ISO 8691. Obsługuje tylko czas trwania z dokładnością do sekund. | struna |
scaleType | [Wymagane] Typ algorytmu skalowania wdrożenia | "TargetUscsi" (wymagane) |
targetU enterprisePercentage | Docelowe użycie procesora CPU dla narzędzia do skalowania automatycznego. | Int |
TrackedResourceTags
Nazwa | Opis | Wartość |
---|
UserAssignedIdentities
Nazwa | Opis | Wartość |
---|
UserAssignedIdentity
Nazwa | Opis | Wartość |
---|
Definicja zasobu narzędzia Terraform (dostawcy AzAPI)
Typ zasobu obszary robocze/onlineEndpoints/deployments można wdrożyć przy użyciu operacji docelowych:
- grupy zasobów
Aby uzyskać listę zmienionych właściwości w każdej wersji interfejsu API, zobacz dziennika zmian.
Format zasobu
Aby utworzyć zasób Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments, dodaj następujący program Terraform do szablonu.
resource "azapi_resource" "symbolicname" {
type = "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2023-06-01-preview"
name = "string"
identity = {
type = "string"
userAssignedIdentities = {
{customized property} = {
}
}
}
kind = "string"
location = "string"
body = jsonencode({
properties = {
appInsightsEnabled = bool
codeConfiguration = {
codeId = "string"
scoringScript = "string"
}
dataCollector = {
collections = {
{customized property} = {
clientId = "string"
dataCollectionMode = "string"
dataId = "string"
samplingRate = int
}
}
requestLogging = {
captureHeaders = [
"string"
]
}
rollingRate = "string"
}
description = "string"
egressPublicNetworkAccess = "string"
environmentId = "string"
environmentVariables = {
{customized property} = "string"
}
instanceType = "string"
livenessProbe = {
failureThreshold = int
initialDelay = "string"
period = "string"
successThreshold = int
timeout = "string"
}
model = "string"
modelMountPath = "string"
properties = {
{customized property} = "string"
}
readinessProbe = {
failureThreshold = int
initialDelay = "string"
period = "string"
successThreshold = int
timeout = "string"
}
requestSettings = {
maxConcurrentRequestsPerInstance = int
maxQueueWait = "string"
requestTimeout = "string"
}
scaleSettings = {
scaleType = "string"
// For remaining properties, see OnlineScaleSettings objects
}
endpointComputeType = "string"
// For remaining properties, see OnlineDeploymentProperties objects
}
})
sku = {
capacity = int
family = "string"
name = "string"
size = "string"
tier = "string"
}
tags = {
{customized property} = "string"
}
}
Obiekty OnlineScaleSettings
Ustaw właściwość scaleType, aby określić typ obiektu.
W przypadku domyślnejużyj:
{
scaleType = "Default"
}
W przypadku TargetUscsiużyj:
{
maxInstances = int
minInstances = int
pollingInterval = "string"
scaleType = "TargetUtilization"
targetUtilizationPercentage = int
}
Obiekty OnlineDeploymentProperties
Ustaw właściwość endpointComputeType, aby określić typ obiektu.
W przypadku Kubernetes użyj:
{
containerResourceRequirements = {
containerResourceLimits = {
cpu = "string"
gpu = "string"
memory = "string"
}
containerResourceRequests = {
cpu = "string"
gpu = "string"
memory = "string"
}
}
endpointComputeType = "Kubernetes"
}
W przypadku zarządzanychużyj:
{
endpointComputeType = "Managed"
}
Wartości właściwości
Konfiguracja kodu
Nazwa | Opis | Wartość |
---|---|---|
codeId | Identyfikator zasobu usługi ARM zasobu kodu. | struna |
scoringScript | [Wymagane] Skrypt do wykonania podczas uruchamiania. Np. "score.py" | struna Ograniczenia: Minimalna długość = 1 Wzorzec = [a-zA-Z0-9_] (wymagane) |
Kolekcja
Nazwa | Opis | Wartość |
---|---|---|
clientId | Identyfikator klienta msi używany do zbierania rejestrowania w magazynie obiektów blob. Jeśli ma wartość null, zaplecze wybierze zarejestrowaną tożsamość punktu końcowego do uwierzytelniania. | struna |
dataCollectionMode | Włączanie lub wyłączanie zbierania danych. | "Wyłączone" "Włączone" |
dataId | Identyfikator zasobu danych arm. Po stronie klienta upewni się, że zasób danych wskazuje magazyn obiektów blob, a zaplecze będzie zbierać dane do magazynu obiektów blob. | struna |
próbkowanieRate | Częstotliwość próbkowania dla kolekcji. Częstotliwość próbkowania 1,0 oznacza, że domyślnie zbieramy 100% danych. | Int |
ContainerResourceRequirements
Nazwa | Opis | Wartość |
---|---|---|
containerResourceLimits | Informacje o limicie zasobów kontenera: | ContainerResourceSettings |
containerResourceRequests | Informacje o żądaniu zasobu kontenera: | ContainerResourceSettings |
ContainerResourceSettings
Nazwa | Opis | Wartość |
---|---|---|
procesor | Liczba żądań/limitu procesorów wirtualnych dla kontenera. Więcej informacji: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
struna |
Gpu | Liczba żądań/limitów kart procesora GPU firmy Nvidia dla kontenera. Więcej informacji: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
struna |
pamięć | Żądanie/limit rozmiaru pamięci dla kontenera. Więcej informacji: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
struna |
DataCollector
Nazwa | Opis | Wartość |
---|---|---|
zbiory | [Wymagane] Konfiguracja kolekcji. Każda kolekcja ma własną konfigurację do zbierania danych modelu, a nazwa kolekcji może być dowolnym ciągiem. Moduł zbierający dane modelu może służyć do rejestrowania ładunku lub rejestrowania niestandardowego albo obu z nich. Żądanie kolekcji i odpowiedź są zarezerwowane do rejestrowania ładunków, inne są przeznaczone do rejestrowania niestandardowego. |
DataCollectorCollections (wymagane) |
requestLogging (rejestrowanie żądań) | Konfiguracja rejestrowania żądań dla usługi mdc zawiera zaawansowane ustawienia rejestrowania dla wszystkich kolekcji. Jest to opcjonalne. | |
rollingRate | Gdy dane modelu są zbierane do magazynu obiektów blob, musimy przerzucić dane do innej ścieżki, aby uniknąć rejestrowania wszystkich z nich w jednym pliku obiektów blob. Jeśli szybkość rolowania wynosi godzinę, wszystkie dane zostaną zebrane w ścieżce obiektu blob /rrrr/MM/dd/HH/. Jeśli jest to dzień, wszystkie dane zostaną zebrane w ścieżce obiektu blob /rrrr/MM/dd/. Inną zaletą ścieżki stopniowej jest to, że interfejs użytkownika monitorowania modelu jest w stanie bardzo szybko wybrać zakres czasu danych. |
"Dzień" "Godzina" "Minuta" "Miesiąc" "Rok" |
DataCollectorCollections
Nazwa | Opis | Wartość |
---|
DefaultScaleSettings
Nazwa | Opis | Wartość |
---|---|---|
scaleType | [Wymagane] Typ algorytmu skalowania wdrożenia | "Wartość domyślna" (wymagana) |
EndpointDeploymentPropertiesBaseEnvironmentVariables
Nazwa | Opis | Wartość |
---|
EndpointDeploymentPropertiesBaseProperties
Nazwa | Opis | Wartość |
---|
KubernetesOnlineDeployment
Nazwa | Opis | Wartość |
---|---|---|
containerResourceRequirements | Wymagania dotyczące zasobów dla kontenera (procesor i pamięć). | ContainerResourceRequirements |
endpointComputeType | [Wymagane] Typ obliczeniowy punktu końcowego. | "Kubernetes" (wymagane) |
ManagedOnlineDeployment
Nazwa | Opis | Wartość |
---|---|---|
endpointComputeType | [Wymagane] Typ obliczeniowy punktu końcowego. | "Zarządzane" (wymagane) |
ManagedServiceIdentity
Nazwa | Opis | Wartość |
---|---|---|
typ | Typ tożsamości usługi zarządzanej (gdzie dozwolone są typy SystemAssigned i UserAssigned). | "Brak" "SystemAssigned" "SystemAssigned,UserAssigned" "UserAssigned" (wymagane) |
userAssignedIdentities | Zestaw tożsamości przypisanych przez użytkownika skojarzonych z zasobem. Klucze słownika userAssignedIdentities będą identyfikatorami zasobów usługi ARM w postaci: "/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. Wartości słownika mogą być pustymi obiektami ({}) w żądaniach. | UserAssignedIdentities |
Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments
Nazwa | Opis | Wartość |
---|---|---|
tożsamość | Tożsamość usługi zarządzanej (tożsamości przypisane przez system i/lub tożsamości przypisane przez użytkownika) | ManagedServiceIdentity |
rodzaj | Metadane używane przez portal/narzędzia/itp. do renderowania różnych środowisk środowiska użytkownika dla zasobów tego samego typu. | struna |
lokalizacja | Lokalizacja geograficzna, w której znajduje się zasób | ciąg (wymagany) |
nazwa | Nazwa zasobu | struna Ograniczenia: Wzorzec = ^[a-zA-Z0-9][a-zA-Z0-9\-_]{0,254}$ (wymagane) |
parent_id | Identyfikator zasobu, który jest elementem nadrzędnym dla tego zasobu. | Identyfikator zasobu typu: obszarów roboczych/onlineEndpoints |
Właściwości | [Wymagane] Dodatkowe atrybuty jednostki. | OnlineDeploymentProperties (wymagane) |
Numer jednostki magazynowej | Szczegóły jednostki SKU wymagane dla kontraktu usługi ARM na potrzeby skalowania automatycznego. | sku |
Tagi | Tagi zasobów | Słownik nazw tagów i wartości. |
typ | Typ zasobu | "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2023-06-01-preview" |
Właściwości elementu OnlineDeploymentProperties
Nazwa | Opis | Wartość |
---|---|---|
appInsightsEnabled | Jeśli wartość true, włącza rejestrowanie usługi Application Insights. | Bool |
codeConfiguration | Konfiguracja kodu dla wdrożenia punktu końcowego. | CodeConfiguration |
dataCollector | Konfiguracja mdc wyłączamy wartość mdc, gdy ma wartość null. | DataCollector |
opis | Opis wdrożenia punktu końcowego. | struna |
egressPublicNetworkAccess | W przypadku włączenia zezwalaj na dostęp do sieci publicznej ruchu wychodzącego. Jeśli opcja Wyłączone, spowoduje to utworzenie bezpiecznego ruchu wychodzącego. Ustawienie domyślne: włączone. | "Wyłączone" "Włączone" |
endpointComputeType | Ustaw wartość "Kubernetes" dla typu KubernetesOnlineDeployment. Ustaw wartość "Managed" dla typu ManagedOnlineDeployment. | "Kubernetes" "Zarządzane" (wymagane) |
environmentId | Identyfikator zasobu usługi ARM specyfikacji środowiska dla wdrożenia punktu końcowego. | struna |
environmentVariables | Konfiguracja zmiennych środowiskowych dla wdrożenia. | EndpointDeploymentPropertiesBaseEnvironmentVariables |
instanceType | Typ wystąpienia obliczeniowego. | struna |
livenessProbe | Sonda liveness regularnie monitoruje kondycję kontenera. | ProbeSettings |
model | Ścieżka identyfikatora URI do modelu. | struna |
modelMountPath | Ścieżka do zainstalowania modelu w kontenerze niestandardowym. | struna |
Właściwości | Słownik właściwości. Właściwości można dodawać, ale nie usuwać ani zmieniać. | EndpointDeploymentPropertiesBaseProperties |
gotowośćProbe | Sonda gotowości sprawdza, czy kontener jest gotowy do obsługi ruchu. Właściwości i wartości domyślne są takie same jak sonda aktualności. | ProbeSettings |
requestSettings | Zażądaj ustawień wdrożenia. | |
scaleSettings | Ustawienia skalowania wdrożenia. Jeśli ma wartość null lub nie jest podana, wartość domyślna to TargetUscsiScaleSettings for KubernetesOnlineDeployment i na Wartość DefaultScaleSettings dla elementu ManagedOnlineDeployment. |
OnlineScaleSettings |
OnlineRequestSettings
Nazwa | Opis | Wartość |
---|---|---|
maxConcurrentRequestsPerInstance | Maksymalna liczba współbieżnych żądań na węzeł dozwolonych na wdrożenie. Wartość domyślna to 1. | Int |
maxQueueWait | Maksymalny czas, przez jaki żądanie pozostanie w kolejce w formacie ISO 8601. Wartość domyślna to 500 ms. |
struna |
requestTimeout | Limit czasu oceniania w formacie ISO 8601. Wartość domyślna to 5000 ms. |
struna |
OnlineScaleSettings
Nazwa | Opis | Wartość |
---|---|---|
scaleType | Ustaw wartość "Default" dla typu DefaultScaleSettings. Dla typu TargetUscsiScaleSettingsustaw wartość "TargetUscsi" na wartość . | "Wartość domyślna" "TargetUscsi" (wymagane) |
ProbeSettings
Nazwa | Opis | Wartość |
---|---|---|
failureThreshold | Liczba niepowodzeń, które mają być dozwolone przed zwróceniem stanu złej kondycji. | Int |
initialDelay | Opóźnienie przed pierwszą sondą w formacie ISO 8601. | struna |
okres | Czas między sondami w formacie ISO 8601. | struna |
successThreshold | Liczba pomyślnych sond przed zwróceniem stanu dobrej kondycji. | Int |
Limit czasu | Limit czasu sondy w formacie ISO 8601. | struna |
Rejestrowanie żądań
Nazwa | Opis | Wartość |
---|---|---|
captureHeaders | W przypadku rejestrowania ładunków zbieramy tylko ładunek domyślnie. Jeśli klienci chcą również zebrać określone nagłówki, mogą ustawić je w elementach captureHeaders, aby zaplecze zbierało te nagłówki wraz z ładunkiem. | string[] |
Numer jednostki magazynowej
Nazwa | Opis | Wartość |
---|---|---|
pojemność | Jeśli jednostka SKU obsługuje skalowanie w poziomie/w, należy uwzględnić liczbę całkowitą pojemności. Jeśli skalowanie w poziomie/w nie jest możliwe dla zasobu, może to zostać pominięte. | Int |
rodzina | Jeśli usługa ma różne generacje sprzętu, dla tej samej jednostki SKU, można je przechwycić tutaj. | struna |
nazwa | Nazwa jednostki SKU. Ex - P3. Zazwyczaj jest to kod z literą i cyfrą | ciąg (wymagany) |
rozmiar | Rozmiar jednostki SKU. Gdy pole nazwy jest kombinacją warstwy i innej wartości, będzie to autonomiczny kod. | struna |
kondygnacja | To pole jest wymagane do zaimplementowania przez dostawcę zasobów, jeśli usługa ma więcej niż jedną warstwę, ale nie jest wymagana w put. | "Podstawowa" "Bezpłatna" "Premium" "Standardowa" |
TargetUscsiScaleSettings
Nazwa | Opis | Wartość |
---|---|---|
maxInstances | Maksymalna liczba wystąpień, do których można skalować wdrożenie. Limit przydziału zostanie zarezerwowany dla max_instances. | Int |
minInstances | Minimalna liczba wystąpień, które mają być zawsze obecne. | Int |
pollingInterval | Interwał sondowania w formacie ISO 8691. Obsługuje tylko czas trwania z dokładnością do sekund. | struna |
scaleType | [Wymagane] Typ algorytmu skalowania wdrożenia | "TargetUscsi" (wymagane) |
targetU enterprisePercentage | Docelowe użycie procesora CPU dla narzędzia do skalowania automatycznego. | Int |
TrackedResourceTags
Nazwa | Opis | Wartość |
---|
UserAssignedIdentities
Nazwa | Opis | Wartość |
---|
UserAssignedIdentity
Nazwa | Opis | Wartość |
---|