Udostępnij za pośrednictwem


Microsoft.MachineLearningServices workspaces/onlineEndpoints/deployments 2023-06-01-preview

Definicja zasobu Bicep

Typ zasobu obszary robocze/onlineEndpoints/deployments można wdrożyć przy użyciu operacji docelowych:

Aby uzyskać listę zmienionych właściwości w każdej wersji interfejsu API, zobacz dziennika zmian.

Format zasobu

Aby utworzyć zasób Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments, dodaj następujący kod Bicep do szablonu.

resource symbolicname 'Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2023-06-01-preview' = {
  identity: {
    type: 'string'
    userAssignedIdentities: {
      {customized property}: {}
    }
  }
  kind: 'string'
  location: 'string'
  name: 'string'
  properties: {
    appInsightsEnabled: bool
    codeConfiguration: {
      codeId: 'string'
      scoringScript: 'string'
    }
    dataCollector: {
      collections: {
        {customized property}: {
          clientId: 'string'
          dataCollectionMode: 'string'
          dataId: 'string'
          samplingRate: int
        }
      }
      requestLogging: {
        captureHeaders: [
          'string'
        ]
      }
      rollingRate: 'string'
    }
    description: 'string'
    egressPublicNetworkAccess: 'string'
    environmentId: 'string'
    environmentVariables: {
      {customized property}: 'string'
    }
    instanceType: 'string'
    livenessProbe: {
      failureThreshold: int
      initialDelay: 'string'
      period: 'string'
      successThreshold: int
      timeout: 'string'
    }
    model: 'string'
    modelMountPath: 'string'
    properties: {
      {customized property}: 'string'
    }
    readinessProbe: {
      failureThreshold: int
      initialDelay: 'string'
      period: 'string'
      successThreshold: int
      timeout: 'string'
    }
    requestSettings: {
      maxConcurrentRequestsPerInstance: int
      maxQueueWait: 'string'
      requestTimeout: 'string'
    }
    scaleSettings: {
      scaleType: 'string'
      // For remaining properties, see OnlineScaleSettings objects
    }
    endpointComputeType: 'string'
    // For remaining properties, see OnlineDeploymentProperties objects
  }
  sku: {
    capacity: int
    family: 'string'
    name: 'string'
    size: 'string'
    tier: 'string'
  }
  tags: {
    {customized property}: 'string'
  }
}

Obiekty OnlineScaleSettings

Ustaw właściwość scaleType, aby określić typ obiektu.

W przypadku domyślnejużyj:

{
  scaleType: 'Default'
}

W przypadku TargetUscsiużyj:

{
  maxInstances: int
  minInstances: int
  pollingInterval: 'string'
  scaleType: 'TargetUtilization'
  targetUtilizationPercentage: int
}

Obiekty OnlineDeploymentProperties

Ustaw właściwość endpointComputeType, aby określić typ obiektu.

W przypadku Kubernetes użyj:

{
  containerResourceRequirements: {
    containerResourceLimits: {
      cpu: 'string'
      gpu: 'string'
      memory: 'string'
    }
    containerResourceRequests: {
      cpu: 'string'
      gpu: 'string'
      memory: 'string'
    }
  }
  endpointComputeType: 'Kubernetes'
}

W przypadku zarządzanychużyj:

{
  endpointComputeType: 'Managed'
}

Wartości właściwości

Konfiguracja kodu

Nazwa Opis Wartość
codeId Identyfikator zasobu usługi ARM zasobu kodu. struna
scoringScript [Wymagane] Skrypt do wykonania podczas uruchamiania. Np. "score.py" struna

Ograniczenia:
Minimalna długość = 1
Wzorzec = [a-zA-Z0-9_] (wymagane)

Kolekcja

Nazwa Opis Wartość
clientId Identyfikator klienta msi używany do zbierania rejestrowania w magazynie obiektów blob. Jeśli ma wartość null, zaplecze wybierze zarejestrowaną tożsamość punktu końcowego do uwierzytelniania. struna
dataCollectionMode Włączanie lub wyłączanie zbierania danych. "Wyłączone"
"Włączone"
dataId Identyfikator zasobu danych arm. Po stronie klienta upewni się, że zasób danych wskazuje magazyn obiektów blob, a zaplecze będzie zbierać dane do magazynu obiektów blob. struna
próbkowanieRate Częstotliwość próbkowania dla kolekcji. Częstotliwość próbkowania 1,0 oznacza, że domyślnie zbieramy 100% danych. Int

ContainerResourceRequirements

Nazwa Opis Wartość
containerResourceLimits Informacje o limicie zasobów kontenera: ContainerResourceSettings
containerResourceRequests Informacje o żądaniu zasobu kontenera: ContainerResourceSettings

ContainerResourceSettings

Nazwa Opis Wartość
procesor Liczba żądań/limitu procesorów wirtualnych dla kontenera. Więcej informacji:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
struna
Gpu Liczba żądań/limitów kart procesora GPU firmy Nvidia dla kontenera. Więcej informacji:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
struna
pamięć Żądanie/limit rozmiaru pamięci dla kontenera. Więcej informacji:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
struna

DataCollector

Nazwa Opis Wartość
zbiory [Wymagane] Konfiguracja kolekcji. Każda kolekcja ma własną konfigurację do zbierania danych modelu, a nazwa kolekcji może być dowolnym ciągiem.
Moduł zbierający dane modelu może służyć do rejestrowania ładunku lub rejestrowania niestandardowego albo obu z nich. Żądanie kolekcji i odpowiedź są zarezerwowane do rejestrowania ładunków, inne są przeznaczone do rejestrowania niestandardowego.
DataCollectorCollections (wymagane)
requestLogging (rejestrowanie żądań) Konfiguracja rejestrowania żądań dla usługi mdc zawiera zaawansowane ustawienia rejestrowania dla wszystkich kolekcji. Jest to opcjonalne. RequestLogging
rollingRate Gdy dane modelu są zbierane do magazynu obiektów blob, musimy przerzucić dane do innej ścieżki, aby uniknąć rejestrowania wszystkich z nich w jednym pliku obiektów blob.
Jeśli szybkość rolowania wynosi godzinę, wszystkie dane zostaną zebrane w ścieżce obiektu blob /rrrr/MM/dd/HH/.
Jeśli jest to dzień, wszystkie dane zostaną zebrane w ścieżce obiektu blob /rrrr/MM/dd/.
Inną zaletą ścieżki stopniowej jest to, że interfejs użytkownika monitorowania modelu jest w stanie bardzo szybko wybrać zakres czasu danych.
"Dzień"
"Godzina"
"Minuta"
"Miesiąc"
"Rok"

DataCollectorCollections

Nazwa Opis Wartość

DefaultScaleSettings

Nazwa Opis Wartość
scaleType [Wymagane] Typ algorytmu skalowania wdrożenia "Wartość domyślna" (wymagana)

EndpointDeploymentPropertiesBaseEnvironmentVariables

Nazwa Opis Wartość

EndpointDeploymentPropertiesBaseProperties

Nazwa Opis Wartość

KubernetesOnlineDeployment

Nazwa Opis Wartość
containerResourceRequirements Wymagania dotyczące zasobów dla kontenera (procesor i pamięć). ContainerResourceRequirements
endpointComputeType [Wymagane] Typ obliczeniowy punktu końcowego. "Kubernetes" (wymagane)

ManagedOnlineDeployment

Nazwa Opis Wartość
endpointComputeType [Wymagane] Typ obliczeniowy punktu końcowego. "Zarządzane" (wymagane)

ManagedServiceIdentity

Nazwa Opis Wartość
typ Typ tożsamości usługi zarządzanej (gdzie dozwolone są typy SystemAssigned i UserAssigned). "Brak"
"SystemAssigned"
"SystemAssigned,UserAssigned"
"UserAssigned" (wymagane)
userAssignedIdentities Zestaw tożsamości przypisanych przez użytkownika skojarzonych z zasobem. Klucze słownika userAssignedIdentities będą identyfikatorami zasobów usługi ARM w postaci: "/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. Wartości słownika mogą być pustymi obiektami ({}) w żądaniach. UserAssignedIdentities

Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments

Nazwa Opis Wartość
tożsamość Tożsamość usługi zarządzanej (tożsamości przypisane przez system i/lub tożsamości przypisane przez użytkownika) ManagedServiceIdentity
rodzaj Metadane używane przez portal/narzędzia/itp. do renderowania różnych środowisk środowiska użytkownika dla zasobów tego samego typu. struna
lokalizacja Lokalizacja geograficzna, w której znajduje się zasób ciąg (wymagany)
nazwa Nazwa zasobu struna

Ograniczenia:
Wzorzec = ^[a-zA-Z0-9][a-zA-Z0-9\-_]{0,254}$ (wymagane)
rodzic W Bicep można określić zasób nadrzędny dla zasobu podrzędnego. Tę właściwość należy dodać tylko wtedy, gdy zasób podrzędny jest zadeklarowany poza zasobem nadrzędnym.

Aby uzyskać więcej informacji, zobacz Zasób podrzędny poza zasobem nadrzędnym.
Nazwa symboliczna zasobu typu: obszarów roboczych/onlineEndpoints
Właściwości [Wymagane] Dodatkowe atrybuty jednostki. OnlineDeploymentProperties (wymagane)
Numer jednostki magazynowej Szczegóły jednostki SKU wymagane dla kontraktu usługi ARM na potrzeby skalowania automatycznego. sku
Tagi Tagi zasobów Słownik nazw tagów i wartości. Zobacz tagi w szablonach

Właściwości elementu OnlineDeploymentProperties

Nazwa Opis Wartość
appInsightsEnabled Jeśli wartość true, włącza rejestrowanie usługi Application Insights. Bool
codeConfiguration Konfiguracja kodu dla wdrożenia punktu końcowego. CodeConfiguration
dataCollector Konfiguracja mdc wyłączamy wartość mdc, gdy ma wartość null. DataCollector
opis Opis wdrożenia punktu końcowego. struna
egressPublicNetworkAccess W przypadku włączenia zezwalaj na dostęp do sieci publicznej ruchu wychodzącego. Jeśli opcja Wyłączone, spowoduje to utworzenie bezpiecznego ruchu wychodzącego. Ustawienie domyślne: włączone. "Wyłączone"
"Włączone"
endpointComputeType Ustaw wartość "Kubernetes" dla typu KubernetesOnlineDeployment. Ustaw wartość "Managed" dla typu ManagedOnlineDeployment. "Kubernetes"
"Zarządzane" (wymagane)
environmentId Identyfikator zasobu usługi ARM specyfikacji środowiska dla wdrożenia punktu końcowego. struna
environmentVariables Konfiguracja zmiennych środowiskowych dla wdrożenia. EndpointDeploymentPropertiesBaseEnvironmentVariables
instanceType Typ wystąpienia obliczeniowego. struna
livenessProbe Sonda liveness regularnie monitoruje kondycję kontenera. ProbeSettings
model Ścieżka identyfikatora URI do modelu. struna
modelMountPath Ścieżka do zainstalowania modelu w kontenerze niestandardowym. struna
Właściwości Słownik właściwości. Właściwości można dodawać, ale nie usuwać ani zmieniać. EndpointDeploymentPropertiesBaseProperties
gotowośćProbe Sonda gotowości sprawdza, czy kontener jest gotowy do obsługi ruchu. Właściwości i wartości domyślne są takie same jak sonda aktualności. ProbeSettings
requestSettings Zażądaj ustawień wdrożenia. OnlineRequestSettings
scaleSettings Ustawienia skalowania wdrożenia.
Jeśli ma wartość null lub nie jest podana,
wartość domyślna to TargetUscsiScaleSettings for KubernetesOnlineDeployment
i na Wartość DefaultScaleSettings dla elementu ManagedOnlineDeployment.
OnlineScaleSettings

OnlineRequestSettings

Nazwa Opis Wartość
maxConcurrentRequestsPerInstance Maksymalna liczba współbieżnych żądań na węzeł dozwolonych na wdrożenie. Wartość domyślna to 1. Int
maxQueueWait Maksymalny czas, przez jaki żądanie pozostanie w kolejce w formacie ISO 8601.
Wartość domyślna to 500 ms.
struna
requestTimeout Limit czasu oceniania w formacie ISO 8601.
Wartość domyślna to 5000 ms.
struna

OnlineScaleSettings

Nazwa Opis Wartość
scaleType Ustaw wartość "Default" dla typu DefaultScaleSettings. Dla typu TargetUscsiScaleSettingsustaw wartość "TargetUscsi" na wartość . "Wartość domyślna"
"TargetUscsi" (wymagane)

ProbeSettings

Nazwa Opis Wartość
failureThreshold Liczba niepowodzeń, które mają być dozwolone przed zwróceniem stanu złej kondycji. Int
initialDelay Opóźnienie przed pierwszą sondą w formacie ISO 8601. struna
okres Czas między sondami w formacie ISO 8601. struna
successThreshold Liczba pomyślnych sond przed zwróceniem stanu dobrej kondycji. Int
Limit czasu Limit czasu sondy w formacie ISO 8601. struna

Rejestrowanie żądań

Nazwa Opis Wartość
captureHeaders W przypadku rejestrowania ładunków zbieramy tylko ładunek domyślnie. Jeśli klienci chcą również zebrać określone nagłówki, mogą ustawić je w elementach captureHeaders, aby zaplecze zbierało te nagłówki wraz z ładunkiem. string[]

Numer jednostki magazynowej

Nazwa Opis Wartość
pojemność Jeśli jednostka SKU obsługuje skalowanie w poziomie/w, należy uwzględnić liczbę całkowitą pojemności. Jeśli skalowanie w poziomie/w nie jest możliwe dla zasobu, może to zostać pominięte. Int
rodzina Jeśli usługa ma różne generacje sprzętu, dla tej samej jednostki SKU, można je przechwycić tutaj. struna
nazwa Nazwa jednostki SKU. Ex - P3. Zazwyczaj jest to kod z literą i cyfrą ciąg (wymagany)
rozmiar Rozmiar jednostki SKU. Gdy pole nazwy jest kombinacją warstwy i innej wartości, będzie to autonomiczny kod. struna
kondygnacja To pole jest wymagane do zaimplementowania przez dostawcę zasobów, jeśli usługa ma więcej niż jedną warstwę, ale nie jest wymagana w put. "Podstawowa"
"Bezpłatna"
"Premium"
"Standardowa"

TargetUscsiScaleSettings

Nazwa Opis Wartość
maxInstances Maksymalna liczba wystąpień, do których można skalować wdrożenie. Limit przydziału zostanie zarezerwowany dla max_instances. Int
minInstances Minimalna liczba wystąpień, które mają być zawsze obecne. Int
pollingInterval Interwał sondowania w formacie ISO 8691. Obsługuje tylko czas trwania z dokładnością do sekund. struna
scaleType [Wymagane] Typ algorytmu skalowania wdrożenia "TargetUscsi" (wymagane)
targetU enterprisePercentage Docelowe użycie procesora CPU dla narzędzia do skalowania automatycznego. Int

TrackedResourceTags

Nazwa Opis Wartość

UserAssignedIdentities

Nazwa Opis Wartość

UserAssignedIdentity

Nazwa Opis Wartość

Definicja zasobu szablonu usługi ARM

Typ zasobu obszary robocze/onlineEndpoints/deployments można wdrożyć przy użyciu operacji docelowych:

Aby uzyskać listę zmienionych właściwości w każdej wersji interfejsu API, zobacz dziennika zmian.

Format zasobu

Aby utworzyć zasób Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments, dodaj następujący kod JSON do szablonu.

{
  "type": "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments",
  "apiVersion": "2023-06-01-preview",
  "name": "string",
  "identity": {
    "type": "string",
    "userAssignedIdentities": {
      "{customized property}": {
      }
    }
  },
  "kind": "string",
  "location": "string",
  "properties": {
    "appInsightsEnabled": "bool",
    "codeConfiguration": {
      "codeId": "string",
      "scoringScript": "string"
    },
    "dataCollector": {
      "collections": {
        "{customized property}": {
          "clientId": "string",
          "dataCollectionMode": "string",
          "dataId": "string",
          "samplingRate": "int"
        }
      },
      "requestLogging": {
        "captureHeaders": [ "string" ]
      },
      "rollingRate": "string"
    },
    "description": "string",
    "egressPublicNetworkAccess": "string",
    "environmentId": "string",
    "environmentVariables": {
      "{customized property}": "string"
    },
    "instanceType": "string",
    "livenessProbe": {
      "failureThreshold": "int",
      "initialDelay": "string",
      "period": "string",
      "successThreshold": "int",
      "timeout": "string"
    },
    "model": "string",
    "modelMountPath": "string",
    "properties": {
      "{customized property}": "string"
    },
    "readinessProbe": {
      "failureThreshold": "int",
      "initialDelay": "string",
      "period": "string",
      "successThreshold": "int",
      "timeout": "string"
    },
    "requestSettings": {
      "maxConcurrentRequestsPerInstance": "int",
      "maxQueueWait": "string",
      "requestTimeout": "string"
    },
    "scaleSettings": {
      "scaleType": "string"
      // For remaining properties, see OnlineScaleSettings objects
    },
    "endpointComputeType": "string"
    // For remaining properties, see OnlineDeploymentProperties objects
  },
  "sku": {
    "capacity": "int",
    "family": "string",
    "name": "string",
    "size": "string",
    "tier": "string"
  },
  "tags": {
    "{customized property}": "string"
  }
}

Obiekty OnlineScaleSettings

Ustaw właściwość scaleType, aby określić typ obiektu.

W przypadku domyślnejużyj:

{
  "scaleType": "Default"
}

W przypadku TargetUscsiużyj:

{
  "maxInstances": "int",
  "minInstances": "int",
  "pollingInterval": "string",
  "scaleType": "TargetUtilization",
  "targetUtilizationPercentage": "int"
}

Obiekty OnlineDeploymentProperties

Ustaw właściwość endpointComputeType, aby określić typ obiektu.

W przypadku Kubernetes użyj:

{
  "containerResourceRequirements": {
    "containerResourceLimits": {
      "cpu": "string",
      "gpu": "string",
      "memory": "string"
    },
    "containerResourceRequests": {
      "cpu": "string",
      "gpu": "string",
      "memory": "string"
    }
  },
  "endpointComputeType": "Kubernetes"
}

W przypadku zarządzanychużyj:

{
  "endpointComputeType": "Managed"
}

Wartości właściwości

Konfiguracja kodu

Nazwa Opis Wartość
codeId Identyfikator zasobu usługi ARM zasobu kodu. struna
scoringScript [Wymagane] Skrypt do wykonania podczas uruchamiania. Np. "score.py" struna

Ograniczenia:
Minimalna długość = 1
Wzorzec = [a-zA-Z0-9_] (wymagane)

Kolekcja

Nazwa Opis Wartość
clientId Identyfikator klienta msi używany do zbierania rejestrowania w magazynie obiektów blob. Jeśli ma wartość null, zaplecze wybierze zarejestrowaną tożsamość punktu końcowego do uwierzytelniania. struna
dataCollectionMode Włączanie lub wyłączanie zbierania danych. "Wyłączone"
"Włączone"
dataId Identyfikator zasobu danych arm. Po stronie klienta upewni się, że zasób danych wskazuje magazyn obiektów blob, a zaplecze będzie zbierać dane do magazynu obiektów blob. struna
próbkowanieRate Częstotliwość próbkowania dla kolekcji. Częstotliwość próbkowania 1,0 oznacza, że domyślnie zbieramy 100% danych. Int

ContainerResourceRequirements

Nazwa Opis Wartość
containerResourceLimits Informacje o limicie zasobów kontenera: ContainerResourceSettings
containerResourceRequests Informacje o żądaniu zasobu kontenera: ContainerResourceSettings

ContainerResourceSettings

Nazwa Opis Wartość
procesor Liczba żądań/limitu procesorów wirtualnych dla kontenera. Więcej informacji:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
struna
Gpu Liczba żądań/limitów kart procesora GPU firmy Nvidia dla kontenera. Więcej informacji:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
struna
pamięć Żądanie/limit rozmiaru pamięci dla kontenera. Więcej informacji:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
struna

DataCollector

Nazwa Opis Wartość
zbiory [Wymagane] Konfiguracja kolekcji. Każda kolekcja ma własną konfigurację do zbierania danych modelu, a nazwa kolekcji może być dowolnym ciągiem.
Moduł zbierający dane modelu może służyć do rejestrowania ładunku lub rejestrowania niestandardowego albo obu z nich. Żądanie kolekcji i odpowiedź są zarezerwowane do rejestrowania ładunków, inne są przeznaczone do rejestrowania niestandardowego.
DataCollectorCollections (wymagane)
requestLogging (rejestrowanie żądań) Konfiguracja rejestrowania żądań dla usługi mdc zawiera zaawansowane ustawienia rejestrowania dla wszystkich kolekcji. Jest to opcjonalne. RequestLogging
rollingRate Gdy dane modelu są zbierane do magazynu obiektów blob, musimy przerzucić dane do innej ścieżki, aby uniknąć rejestrowania wszystkich z nich w jednym pliku obiektów blob.
Jeśli szybkość rolowania wynosi godzinę, wszystkie dane zostaną zebrane w ścieżce obiektu blob /rrrr/MM/dd/HH/.
Jeśli jest to dzień, wszystkie dane zostaną zebrane w ścieżce obiektu blob /rrrr/MM/dd/.
Inną zaletą ścieżki stopniowej jest to, że interfejs użytkownika monitorowania modelu jest w stanie bardzo szybko wybrać zakres czasu danych.
"Dzień"
"Godzina"
"Minuta"
"Miesiąc"
"Rok"

DataCollectorCollections

Nazwa Opis Wartość

DefaultScaleSettings

Nazwa Opis Wartość
scaleType [Wymagane] Typ algorytmu skalowania wdrożenia "Wartość domyślna" (wymagana)

EndpointDeploymentPropertiesBaseEnvironmentVariables

Nazwa Opis Wartość

EndpointDeploymentPropertiesBaseProperties

Nazwa Opis Wartość

KubernetesOnlineDeployment

Nazwa Opis Wartość
containerResourceRequirements Wymagania dotyczące zasobów dla kontenera (procesor i pamięć). ContainerResourceRequirements
endpointComputeType [Wymagane] Typ obliczeniowy punktu końcowego. "Kubernetes" (wymagane)

ManagedOnlineDeployment

Nazwa Opis Wartość
endpointComputeType [Wymagane] Typ obliczeniowy punktu końcowego. "Zarządzane" (wymagane)

ManagedServiceIdentity

Nazwa Opis Wartość
typ Typ tożsamości usługi zarządzanej (gdzie dozwolone są typy SystemAssigned i UserAssigned). "Brak"
"SystemAssigned"
"SystemAssigned,UserAssigned"
"UserAssigned" (wymagane)
userAssignedIdentities Zestaw tożsamości przypisanych przez użytkownika skojarzonych z zasobem. Klucze słownika userAssignedIdentities będą identyfikatorami zasobów usługi ARM w postaci: "/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. Wartości słownika mogą być pustymi obiektami ({}) w żądaniach. UserAssignedIdentities

Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments

Nazwa Opis Wartość
apiVersion Wersja interfejsu API "2023-06-01-preview"
tożsamość Tożsamość usługi zarządzanej (tożsamości przypisane przez system i/lub tożsamości przypisane przez użytkownika) ManagedServiceIdentity
rodzaj Metadane używane przez portal/narzędzia/itp. do renderowania różnych środowisk środowiska użytkownika dla zasobów tego samego typu. struna
lokalizacja Lokalizacja geograficzna, w której znajduje się zasób ciąg (wymagany)
nazwa Nazwa zasobu struna

Ograniczenia:
Wzorzec = ^[a-zA-Z0-9][a-zA-Z0-9\-_]{0,254}$ (wymagane)
Właściwości [Wymagane] Dodatkowe atrybuty jednostki. OnlineDeploymentProperties (wymagane)
Numer jednostki magazynowej Szczegóły jednostki SKU wymagane dla kontraktu usługi ARM na potrzeby skalowania automatycznego. sku
Tagi Tagi zasobów Słownik nazw tagów i wartości. Zobacz tagi w szablonach
typ Typ zasobu "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments"

Właściwości elementu OnlineDeploymentProperties

Nazwa Opis Wartość
appInsightsEnabled Jeśli wartość true, włącza rejestrowanie usługi Application Insights. Bool
codeConfiguration Konfiguracja kodu dla wdrożenia punktu końcowego. CodeConfiguration
dataCollector Konfiguracja mdc wyłączamy wartość mdc, gdy ma wartość null. DataCollector
opis Opis wdrożenia punktu końcowego. struna
egressPublicNetworkAccess W przypadku włączenia zezwalaj na dostęp do sieci publicznej ruchu wychodzącego. Jeśli opcja Wyłączone, spowoduje to utworzenie bezpiecznego ruchu wychodzącego. Ustawienie domyślne: włączone. "Wyłączone"
"Włączone"
endpointComputeType Ustaw wartość "Kubernetes" dla typu KubernetesOnlineDeployment. Ustaw wartość "Managed" dla typu ManagedOnlineDeployment. "Kubernetes"
"Zarządzane" (wymagane)
environmentId Identyfikator zasobu usługi ARM specyfikacji środowiska dla wdrożenia punktu końcowego. struna
environmentVariables Konfiguracja zmiennych środowiskowych dla wdrożenia. EndpointDeploymentPropertiesBaseEnvironmentVariables
instanceType Typ wystąpienia obliczeniowego. struna
livenessProbe Sonda liveness regularnie monitoruje kondycję kontenera. ProbeSettings
model Ścieżka identyfikatora URI do modelu. struna
modelMountPath Ścieżka do zainstalowania modelu w kontenerze niestandardowym. struna
Właściwości Słownik właściwości. Właściwości można dodawać, ale nie usuwać ani zmieniać. EndpointDeploymentPropertiesBaseProperties
gotowośćProbe Sonda gotowości sprawdza, czy kontener jest gotowy do obsługi ruchu. Właściwości i wartości domyślne są takie same jak sonda aktualności. ProbeSettings
requestSettings Zażądaj ustawień wdrożenia. OnlineRequestSettings
scaleSettings Ustawienia skalowania wdrożenia.
Jeśli ma wartość null lub nie jest podana,
wartość domyślna to TargetUscsiScaleSettings for KubernetesOnlineDeployment
i na Wartość DefaultScaleSettings dla elementu ManagedOnlineDeployment.
OnlineScaleSettings

OnlineRequestSettings

Nazwa Opis Wartość
maxConcurrentRequestsPerInstance Maksymalna liczba współbieżnych żądań na węzeł dozwolonych na wdrożenie. Wartość domyślna to 1. Int
maxQueueWait Maksymalny czas, przez jaki żądanie pozostanie w kolejce w formacie ISO 8601.
Wartość domyślna to 500 ms.
struna
requestTimeout Limit czasu oceniania w formacie ISO 8601.
Wartość domyślna to 5000 ms.
struna

OnlineScaleSettings

Nazwa Opis Wartość
scaleType Ustaw wartość "Default" dla typu DefaultScaleSettings. Dla typu TargetUscsiScaleSettingsustaw wartość "TargetUscsi" na wartość . "Wartość domyślna"
"TargetUscsi" (wymagane)

ProbeSettings

Nazwa Opis Wartość
failureThreshold Liczba niepowodzeń, które mają być dozwolone przed zwróceniem stanu złej kondycji. Int
initialDelay Opóźnienie przed pierwszą sondą w formacie ISO 8601. struna
okres Czas między sondami w formacie ISO 8601. struna
successThreshold Liczba pomyślnych sond przed zwróceniem stanu dobrej kondycji. Int
Limit czasu Limit czasu sondy w formacie ISO 8601. struna

Rejestrowanie żądań

Nazwa Opis Wartość
captureHeaders W przypadku rejestrowania ładunków zbieramy tylko ładunek domyślnie. Jeśli klienci chcą również zebrać określone nagłówki, mogą ustawić je w elementach captureHeaders, aby zaplecze zbierało te nagłówki wraz z ładunkiem. string[]

Numer jednostki magazynowej

Nazwa Opis Wartość
pojemność Jeśli jednostka SKU obsługuje skalowanie w poziomie/w, należy uwzględnić liczbę całkowitą pojemności. Jeśli skalowanie w poziomie/w nie jest możliwe dla zasobu, może to zostać pominięte. Int
rodzina Jeśli usługa ma różne generacje sprzętu, dla tej samej jednostki SKU, można je przechwycić tutaj. struna
nazwa Nazwa jednostki SKU. Ex - P3. Zazwyczaj jest to kod z literą i cyfrą ciąg (wymagany)
rozmiar Rozmiar jednostki SKU. Gdy pole nazwy jest kombinacją warstwy i innej wartości, będzie to autonomiczny kod. struna
kondygnacja To pole jest wymagane do zaimplementowania przez dostawcę zasobów, jeśli usługa ma więcej niż jedną warstwę, ale nie jest wymagana w put. "Podstawowa"
"Bezpłatna"
"Premium"
"Standardowa"

TargetUscsiScaleSettings

Nazwa Opis Wartość
maxInstances Maksymalna liczba wystąpień, do których można skalować wdrożenie. Limit przydziału zostanie zarezerwowany dla max_instances. Int
minInstances Minimalna liczba wystąpień, które mają być zawsze obecne. Int
pollingInterval Interwał sondowania w formacie ISO 8691. Obsługuje tylko czas trwania z dokładnością do sekund. struna
scaleType [Wymagane] Typ algorytmu skalowania wdrożenia "TargetUscsi" (wymagane)
targetU enterprisePercentage Docelowe użycie procesora CPU dla narzędzia do skalowania automatycznego. Int

TrackedResourceTags

Nazwa Opis Wartość

UserAssignedIdentities

Nazwa Opis Wartość

UserAssignedIdentity

Nazwa Opis Wartość

Definicja zasobu narzędzia Terraform (dostawcy AzAPI)

Typ zasobu obszary robocze/onlineEndpoints/deployments można wdrożyć przy użyciu operacji docelowych:

  • grupy zasobów

Aby uzyskać listę zmienionych właściwości w każdej wersji interfejsu API, zobacz dziennika zmian.

Format zasobu

Aby utworzyć zasób Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments, dodaj następujący program Terraform do szablonu.

resource "azapi_resource" "symbolicname" {
  type = "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2023-06-01-preview"
  name = "string"
  identity = {
    type = "string"
    userAssignedIdentities = {
      {customized property} = {
      }
    }
  }
  kind = "string"
  location = "string"
  body = jsonencode({
    properties = {
      appInsightsEnabled = bool
      codeConfiguration = {
        codeId = "string"
        scoringScript = "string"
      }
      dataCollector = {
        collections = {
          {customized property} = {
            clientId = "string"
            dataCollectionMode = "string"
            dataId = "string"
            samplingRate = int
          }
        }
        requestLogging = {
          captureHeaders = [
            "string"
          ]
        }
        rollingRate = "string"
      }
      description = "string"
      egressPublicNetworkAccess = "string"
      environmentId = "string"
      environmentVariables = {
        {customized property} = "string"
      }
      instanceType = "string"
      livenessProbe = {
        failureThreshold = int
        initialDelay = "string"
        period = "string"
        successThreshold = int
        timeout = "string"
      }
      model = "string"
      modelMountPath = "string"
      properties = {
        {customized property} = "string"
      }
      readinessProbe = {
        failureThreshold = int
        initialDelay = "string"
        period = "string"
        successThreshold = int
        timeout = "string"
      }
      requestSettings = {
        maxConcurrentRequestsPerInstance = int
        maxQueueWait = "string"
        requestTimeout = "string"
      }
      scaleSettings = {
        scaleType = "string"
        // For remaining properties, see OnlineScaleSettings objects
      }
      endpointComputeType = "string"
      // For remaining properties, see OnlineDeploymentProperties objects
    }
  })
  sku = {
    capacity = int
    family = "string"
    name = "string"
    size = "string"
    tier = "string"
  }
  tags = {
    {customized property} = "string"
  }
}

Obiekty OnlineScaleSettings

Ustaw właściwość scaleType, aby określić typ obiektu.

W przypadku domyślnejużyj:

{
  scaleType = "Default"
}

W przypadku TargetUscsiużyj:

{
  maxInstances = int
  minInstances = int
  pollingInterval = "string"
  scaleType = "TargetUtilization"
  targetUtilizationPercentage = int
}

Obiekty OnlineDeploymentProperties

Ustaw właściwość endpointComputeType, aby określić typ obiektu.

W przypadku Kubernetes użyj:

{
  containerResourceRequirements = {
    containerResourceLimits = {
      cpu = "string"
      gpu = "string"
      memory = "string"
    }
    containerResourceRequests = {
      cpu = "string"
      gpu = "string"
      memory = "string"
    }
  }
  endpointComputeType = "Kubernetes"
}

W przypadku zarządzanychużyj:

{
  endpointComputeType = "Managed"
}

Wartości właściwości

Konfiguracja kodu

Nazwa Opis Wartość
codeId Identyfikator zasobu usługi ARM zasobu kodu. struna
scoringScript [Wymagane] Skrypt do wykonania podczas uruchamiania. Np. "score.py" struna

Ograniczenia:
Minimalna długość = 1
Wzorzec = [a-zA-Z0-9_] (wymagane)

Kolekcja

Nazwa Opis Wartość
clientId Identyfikator klienta msi używany do zbierania rejestrowania w magazynie obiektów blob. Jeśli ma wartość null, zaplecze wybierze zarejestrowaną tożsamość punktu końcowego do uwierzytelniania. struna
dataCollectionMode Włączanie lub wyłączanie zbierania danych. "Wyłączone"
"Włączone"
dataId Identyfikator zasobu danych arm. Po stronie klienta upewni się, że zasób danych wskazuje magazyn obiektów blob, a zaplecze będzie zbierać dane do magazynu obiektów blob. struna
próbkowanieRate Częstotliwość próbkowania dla kolekcji. Częstotliwość próbkowania 1,0 oznacza, że domyślnie zbieramy 100% danych. Int

ContainerResourceRequirements

Nazwa Opis Wartość
containerResourceLimits Informacje o limicie zasobów kontenera: ContainerResourceSettings
containerResourceRequests Informacje o żądaniu zasobu kontenera: ContainerResourceSettings

ContainerResourceSettings

Nazwa Opis Wartość
procesor Liczba żądań/limitu procesorów wirtualnych dla kontenera. Więcej informacji:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
struna
Gpu Liczba żądań/limitów kart procesora GPU firmy Nvidia dla kontenera. Więcej informacji:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
struna
pamięć Żądanie/limit rozmiaru pamięci dla kontenera. Więcej informacji:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
struna

DataCollector

Nazwa Opis Wartość
zbiory [Wymagane] Konfiguracja kolekcji. Każda kolekcja ma własną konfigurację do zbierania danych modelu, a nazwa kolekcji może być dowolnym ciągiem.
Moduł zbierający dane modelu może służyć do rejestrowania ładunku lub rejestrowania niestandardowego albo obu z nich. Żądanie kolekcji i odpowiedź są zarezerwowane do rejestrowania ładunków, inne są przeznaczone do rejestrowania niestandardowego.
DataCollectorCollections (wymagane)
requestLogging (rejestrowanie żądań) Konfiguracja rejestrowania żądań dla usługi mdc zawiera zaawansowane ustawienia rejestrowania dla wszystkich kolekcji. Jest to opcjonalne. RequestLogging
rollingRate Gdy dane modelu są zbierane do magazynu obiektów blob, musimy przerzucić dane do innej ścieżki, aby uniknąć rejestrowania wszystkich z nich w jednym pliku obiektów blob.
Jeśli szybkość rolowania wynosi godzinę, wszystkie dane zostaną zebrane w ścieżce obiektu blob /rrrr/MM/dd/HH/.
Jeśli jest to dzień, wszystkie dane zostaną zebrane w ścieżce obiektu blob /rrrr/MM/dd/.
Inną zaletą ścieżki stopniowej jest to, że interfejs użytkownika monitorowania modelu jest w stanie bardzo szybko wybrać zakres czasu danych.
"Dzień"
"Godzina"
"Minuta"
"Miesiąc"
"Rok"

DataCollectorCollections

Nazwa Opis Wartość

DefaultScaleSettings

Nazwa Opis Wartość
scaleType [Wymagane] Typ algorytmu skalowania wdrożenia "Wartość domyślna" (wymagana)

EndpointDeploymentPropertiesBaseEnvironmentVariables

Nazwa Opis Wartość

EndpointDeploymentPropertiesBaseProperties

Nazwa Opis Wartość

KubernetesOnlineDeployment

Nazwa Opis Wartość
containerResourceRequirements Wymagania dotyczące zasobów dla kontenera (procesor i pamięć). ContainerResourceRequirements
endpointComputeType [Wymagane] Typ obliczeniowy punktu końcowego. "Kubernetes" (wymagane)

ManagedOnlineDeployment

Nazwa Opis Wartość
endpointComputeType [Wymagane] Typ obliczeniowy punktu końcowego. "Zarządzane" (wymagane)

ManagedServiceIdentity

Nazwa Opis Wartość
typ Typ tożsamości usługi zarządzanej (gdzie dozwolone są typy SystemAssigned i UserAssigned). "Brak"
"SystemAssigned"
"SystemAssigned,UserAssigned"
"UserAssigned" (wymagane)
userAssignedIdentities Zestaw tożsamości przypisanych przez użytkownika skojarzonych z zasobem. Klucze słownika userAssignedIdentities będą identyfikatorami zasobów usługi ARM w postaci: "/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. Wartości słownika mogą być pustymi obiektami ({}) w żądaniach. UserAssignedIdentities

Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments

Nazwa Opis Wartość
tożsamość Tożsamość usługi zarządzanej (tożsamości przypisane przez system i/lub tożsamości przypisane przez użytkownika) ManagedServiceIdentity
rodzaj Metadane używane przez portal/narzędzia/itp. do renderowania różnych środowisk środowiska użytkownika dla zasobów tego samego typu. struna
lokalizacja Lokalizacja geograficzna, w której znajduje się zasób ciąg (wymagany)
nazwa Nazwa zasobu struna

Ograniczenia:
Wzorzec = ^[a-zA-Z0-9][a-zA-Z0-9\-_]{0,254}$ (wymagane)
parent_id Identyfikator zasobu, który jest elementem nadrzędnym dla tego zasobu. Identyfikator zasobu typu: obszarów roboczych/onlineEndpoints
Właściwości [Wymagane] Dodatkowe atrybuty jednostki. OnlineDeploymentProperties (wymagane)
Numer jednostki magazynowej Szczegóły jednostki SKU wymagane dla kontraktu usługi ARM na potrzeby skalowania automatycznego. sku
Tagi Tagi zasobów Słownik nazw tagów i wartości.
typ Typ zasobu "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2023-06-01-preview"

Właściwości elementu OnlineDeploymentProperties

Nazwa Opis Wartość
appInsightsEnabled Jeśli wartość true, włącza rejestrowanie usługi Application Insights. Bool
codeConfiguration Konfiguracja kodu dla wdrożenia punktu końcowego. CodeConfiguration
dataCollector Konfiguracja mdc wyłączamy wartość mdc, gdy ma wartość null. DataCollector
opis Opis wdrożenia punktu końcowego. struna
egressPublicNetworkAccess W przypadku włączenia zezwalaj na dostęp do sieci publicznej ruchu wychodzącego. Jeśli opcja Wyłączone, spowoduje to utworzenie bezpiecznego ruchu wychodzącego. Ustawienie domyślne: włączone. "Wyłączone"
"Włączone"
endpointComputeType Ustaw wartość "Kubernetes" dla typu KubernetesOnlineDeployment. Ustaw wartość "Managed" dla typu ManagedOnlineDeployment. "Kubernetes"
"Zarządzane" (wymagane)
environmentId Identyfikator zasobu usługi ARM specyfikacji środowiska dla wdrożenia punktu końcowego. struna
environmentVariables Konfiguracja zmiennych środowiskowych dla wdrożenia. EndpointDeploymentPropertiesBaseEnvironmentVariables
instanceType Typ wystąpienia obliczeniowego. struna
livenessProbe Sonda liveness regularnie monitoruje kondycję kontenera. ProbeSettings
model Ścieżka identyfikatora URI do modelu. struna
modelMountPath Ścieżka do zainstalowania modelu w kontenerze niestandardowym. struna
Właściwości Słownik właściwości. Właściwości można dodawać, ale nie usuwać ani zmieniać. EndpointDeploymentPropertiesBaseProperties
gotowośćProbe Sonda gotowości sprawdza, czy kontener jest gotowy do obsługi ruchu. Właściwości i wartości domyślne są takie same jak sonda aktualności. ProbeSettings
requestSettings Zażądaj ustawień wdrożenia. OnlineRequestSettings
scaleSettings Ustawienia skalowania wdrożenia.
Jeśli ma wartość null lub nie jest podana,
wartość domyślna to TargetUscsiScaleSettings for KubernetesOnlineDeployment
i na Wartość DefaultScaleSettings dla elementu ManagedOnlineDeployment.
OnlineScaleSettings

OnlineRequestSettings

Nazwa Opis Wartość
maxConcurrentRequestsPerInstance Maksymalna liczba współbieżnych żądań na węzeł dozwolonych na wdrożenie. Wartość domyślna to 1. Int
maxQueueWait Maksymalny czas, przez jaki żądanie pozostanie w kolejce w formacie ISO 8601.
Wartość domyślna to 500 ms.
struna
requestTimeout Limit czasu oceniania w formacie ISO 8601.
Wartość domyślna to 5000 ms.
struna

OnlineScaleSettings

Nazwa Opis Wartość
scaleType Ustaw wartość "Default" dla typu DefaultScaleSettings. Dla typu TargetUscsiScaleSettingsustaw wartość "TargetUscsi" na wartość . "Wartość domyślna"
"TargetUscsi" (wymagane)

ProbeSettings

Nazwa Opis Wartość
failureThreshold Liczba niepowodzeń, które mają być dozwolone przed zwróceniem stanu złej kondycji. Int
initialDelay Opóźnienie przed pierwszą sondą w formacie ISO 8601. struna
okres Czas między sondami w formacie ISO 8601. struna
successThreshold Liczba pomyślnych sond przed zwróceniem stanu dobrej kondycji. Int
Limit czasu Limit czasu sondy w formacie ISO 8601. struna

Rejestrowanie żądań

Nazwa Opis Wartość
captureHeaders W przypadku rejestrowania ładunków zbieramy tylko ładunek domyślnie. Jeśli klienci chcą również zebrać określone nagłówki, mogą ustawić je w elementach captureHeaders, aby zaplecze zbierało te nagłówki wraz z ładunkiem. string[]

Numer jednostki magazynowej

Nazwa Opis Wartość
pojemność Jeśli jednostka SKU obsługuje skalowanie w poziomie/w, należy uwzględnić liczbę całkowitą pojemności. Jeśli skalowanie w poziomie/w nie jest możliwe dla zasobu, może to zostać pominięte. Int
rodzina Jeśli usługa ma różne generacje sprzętu, dla tej samej jednostki SKU, można je przechwycić tutaj. struna
nazwa Nazwa jednostki SKU. Ex - P3. Zazwyczaj jest to kod z literą i cyfrą ciąg (wymagany)
rozmiar Rozmiar jednostki SKU. Gdy pole nazwy jest kombinacją warstwy i innej wartości, będzie to autonomiczny kod. struna
kondygnacja To pole jest wymagane do zaimplementowania przez dostawcę zasobów, jeśli usługa ma więcej niż jedną warstwę, ale nie jest wymagana w put. "Podstawowa"
"Bezpłatna"
"Premium"
"Standardowa"

TargetUscsiScaleSettings

Nazwa Opis Wartość
maxInstances Maksymalna liczba wystąpień, do których można skalować wdrożenie. Limit przydziału zostanie zarezerwowany dla max_instances. Int
minInstances Minimalna liczba wystąpień, które mają być zawsze obecne. Int
pollingInterval Interwał sondowania w formacie ISO 8691. Obsługuje tylko czas trwania z dokładnością do sekund. struna
scaleType [Wymagane] Typ algorytmu skalowania wdrożenia "TargetUscsi" (wymagane)
targetU enterprisePercentage Docelowe użycie procesora CPU dla narzędzia do skalowania automatycznego. Int

TrackedResourceTags

Nazwa Opis Wartość

UserAssignedIdentities

Nazwa Opis Wartość

UserAssignedIdentity

Nazwa Opis Wartość