Microsoft.MachineLearningServices 工作區/onlineEndpoints/deployments 2021-03-01-preview
- 最新
- 2024-10-01
- 2024-10-01-preview
- 2024-07-01-preview
- 2024-04-01
- 2024-04-01-preview
- 2024-01-01-preview
- 2023-10-01
- 2023-08-01-preview
- 2023-06-01-preview
- 2023-04-01
- 2023-04-01-preview
- 2023-02-01-preview
- 2022-12-01-preview
- 2022-10-01
- 2022-10-01-preview
- 2022-06-01-preview
- 2022-05-01
- 2022-02-01-preview
- 2021-03-01-preview
Bicep 資源定義
workspaces/onlineEndpoints/deployments 資源類型可以使用目標作業來部署:
- 資源群組 - 請參閱 資源群組部署命令
如需每個 API 版本中已變更屬性的清單,請參閱 變更記錄檔。
資源格式
若要建立 Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments 資源,請將下列 Bicep 新增至範本。
resource symbolicname 'Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2021-03-01-preview' = {
identity: {
type: 'string'
userAssignedIdentities: {
{customized property}: {
clientId: 'string'
principalId: 'string'
}
}
}
kind: 'string'
location: 'string'
name: 'string'
properties: {
appInsightsEnabled: bool
codeConfiguration: {
codeId: 'string'
scoringScript: 'string'
}
description: 'string'
environmentId: 'string'
environmentVariables: {
{customized property}: 'string'
}
livenessProbe: {
failureThreshold: int
initialDelay: 'string'
period: 'string'
successThreshold: int
timeout: 'string'
}
model: {
referenceType: 'string'
// For remaining properties, see AssetReferenceBase objects
}
properties: {
{customized property}: 'string'
}
requestSettings: {
maxConcurrentRequestsPerInstance: int
maxQueueWait: 'string'
requestTimeout: 'string'
}
scaleSettings: {
maxInstances: int
minInstances: int
scaleType: 'string'
// For remaining properties, see OnlineScaleSettings objects
}
endpointComputeType: 'string'
// For remaining properties, see OnlineDeployment objects
}
tags: {
{customized property}: 'string'
}
}
OnlineDeployment 物件
設定 endpointComputeType 屬性,以指定對象的類型。
針對 K8S,請使用:
{
containerResourceRequirements: {
cpu: int
cpuLimit: int
fpga: int
gpu: int
memoryInGB: int
memoryInGBLimit: int
}
endpointComputeType: 'K8S'
}
針對 Managed,請使用:
{
endpointComputeType: 'Managed'
instanceType: 'string'
readinessProbe: {
failureThreshold: int
initialDelay: 'string'
period: 'string'
successThreshold: int
timeout: 'string'
}
}
OnlineScaleSettings 物件
設定 scaleType 屬性,以指定物件的類型。
針對 Auto,請使用:
{
pollingInterval: 'string'
scaleType: 'Auto'
targetUtilizationPercentage: int
}
針對 手動,請使用:
{
instanceCount: int
scaleType: 'Manual'
}
AssetReferenceBase 物件
設定 referenceType 屬性,以指定對象的類型。
針對 DataPath,請使用:
{
datastoreId: 'string'
path: 'string'
referenceType: 'DataPath'
}
針對 識別碼,請使用:
{
assetId: 'string'
referenceType: 'Id'
}
針對 OutputPath,請使用:
{
jobId: 'string'
path: 'string'
referenceType: 'OutputPath'
}
屬性值
AssetReferenceBase
名字 | 描述 | 價值 |
---|---|---|
referenceType | 針對 dataPathAssetReference 類型 設定為 'DataPath',。 針對 idAssetReference 類型 設定為 'Id',。 將 type OutputPathAssetReference設定為 'OutputPath'。 | 'DataPath' 'Id' 'OutputPath' (必要) |
AutoScaleSettings
名字 | 描述 | 價值 |
---|---|---|
pollingInterval | ISO 8691 格式的輪詢間隔。 僅支援有效位數為秒數的持續時間。 | 字串 |
scaleType | [必要]部署調整演算法的類型 | 'Auto' (必要) |
targetUtilizationPercentage | 自動調整程式的目標 CPU 使用量。 | int |
CodeConfiguration
名字 | 描述 | 價值 |
---|---|---|
codeId | 程式代碼資產的 ARM 資源識別碼。 | 字串 |
scoringScript | [必要]在啟動時執行的腳本。 例如 “score.py” | 字串 約束: 最小長度 = 1 模式 = [a-zA-Z0-9_] (必要) |
ContainerResourceRequirements
名字 | 描述 | 價值 |
---|---|---|
中央處理器 | 容器要使用的 CPU 核心數量下限。 詳細資訊: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
int |
cpuLimit | 容器允許使用的 CPU 核心數量上限。 詳細資訊: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
int |
fpga | 公開給容器的 FPGA PCIE 裝置數目。 必須是 2 的倍數。 | int |
gpu | 容器中的 GPU 核心數目。 | int |
memoryInGB | 容器要使用的記憶體數量下限(以 GB 為單位)。 詳細資訊: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
int |
memoryInGBLimit | 容器允許使用的記憶體數量上限(以 GB 為單位)。 詳細資訊: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
int |
DataPathAssetReference
名字 | 描述 | 價值 |
---|---|---|
datastoreId | 資產所在數據存放區的 ARM 資源識別碼。 | 字串 |
路徑 | 數據存放區中檔案/目錄的路徑。 | 字串 |
referenceType | [必要]指定資產參考的類型。 | 'DataPath' (必要) |
IdAssetReference
名字 | 描述 | 價值 |
---|---|---|
assetId | [必要]資產的 ARM 資源識別碼。 | 字串 約束: 模式 = [a-zA-Z0-9_] (必要) |
referenceType | [必要]指定資產參考的類型。 | 'Id' (必要) |
K8SOnlineDeployment
名字 | 描述 | 價值 |
---|---|---|
containerResourceRequirements | 在線部署內每個容器實例的資源需求。 | ContainerResourceRequirements |
endpointComputeType | [必要]端點的計算類型。 | 'K8S' (必要) |
ManagedOnlineDeployment
名字 | 描述 | 價值 |
---|---|---|
endpointComputeType | [必要]端點的計算類型。 | 'Managed' (必要) |
instanceType | 計算實例類型。 | 字串 |
readinessProbe | 部署容器活躍度/整備探查組態。 | ProbeSettings |
ManualScaleSettings
名字 | 描述 | 價值 |
---|---|---|
instanceCount | 已修正此部署的實例數目。 | int |
scaleType | [必要]部署調整演算法的類型 | 'Manual' (必要) |
Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments
名字 | 描述 | 價值 |
---|---|---|
身份 | 與資源相關聯的服務識別。 | ResourceIdentity |
類 | 入口網站/工具等用來轉譯相同類型資源的不同UX體驗的元數據。 | 字串 |
位置 | 資源所在的地理位置 | 字串 (必要) |
名字 | 資源名稱 | 字串 約束: 模式 = ^[a-zA-Z0-9][a-zA-Z0-9\-_]{0,254}$ (必要) |
父母 | 在 Bicep 中,您可以指定子資源的父資源。 只有在父資源外部宣告子資源時,才需要新增這個屬性。 如需詳細資訊,請參閱 父資源外部的子資源。 |
類型資源的符號名稱:workspaces/onlineEndpoints |
性能 | [必要]實體的其他屬性。 | OnlineDeployment (必要) |
標籤 | 資源標籤 | 標記名稱和值的字典。 請參閱範本中的 標籤 |
OnlineDeployment
名字 | 描述 | 價值 |
---|---|---|
appInsightsEnabled | 如果為 true,請啟用 Application Insights 記錄。 | bool |
codeConfiguration | 端點部署的程式代碼組態。 | CodeConfiguration |
描述 | 端點部署的描述。 | 字串 |
endpointComputeType | 針對類型 K8SOnlineDeployment,設定為 'K8S'。 針對 managedOnlineDeployment 類型 設定為 'Managed',。 | 'K8S' 'Managed' (必要) |
environmentId | 端點部署環境規格的 ARM 資源識別碼。 | 字串 |
environmentVariables | 部署的環境變數組態。 | OnlineDeploymentEnvironmentVariables |
livenessProbe | 部署容器活躍度/整備探查組態。 | ProbeSettings |
型 | 端點部署的模型資產參考。 | AssetReferenceBase |
性能 | 屬性字典。 可以新增屬性,但無法移除或改變。 | OnlineDeploymentProperties |
requestSettings | 在線部署評分要求設定。 | OnlineRequestSettings |
scaleSettings | 在線部署調整設定。 | OnlineScaleSettings |
OnlineDeploymentEnvironmentVariables
名字 | 描述 | 價值 |
---|
OnlineDeploymentProperties
名字 | 描述 | 價值 |
---|
OnlineRequestSettings
名字 | 描述 | 價值 |
---|---|---|
maxConcurrentRequestsPerInstance | 此部署允許一次排入佇列的要求數目。 | int |
maxQueueWait | ISO 8601 格式的佇列等候時間上限。 支援毫秒有效位數。 | 字串 |
requestTimeout | ISO 8601 格式的要求逾時。 支援毫秒有效位數。 | 字串 |
OnlineScaleSettings
名字 | 描述 | 價值 |
---|---|---|
maxInstances | 此部署的實例數目上限。 | int |
minInstances | 此部署的實例數目下限。 | int |
scaleType | 針對 autoScaleSettings 類型設定為 'Auto',。 針對 manualScaleSettings type,設定為 'Manual'。 | 'Auto' 'Manual' (必要) |
OutputPathAssetReference
名字 | 描述 | 價值 |
---|---|---|
jobId | 作業的 ARM 資源識別碼。 | 字串 |
路徑 | 作業輸出中檔案/目錄的路徑。 | 字串 |
referenceType | [必要]指定資產參考的類型。 | 'OutputPath' (必要) |
ProbeSettings
名字 | 描述 | 價值 |
---|---|---|
failureThreshold | 傳回狀況不良狀態之前允許的失敗次數。 | int |
initialDelay | ISO 8601 格式第一個探查之前的延遲。 | 字串 |
時期 | ISO 8601 格式探查之間的時間長度。 | 字串 |
successThreshold | 傳回狀況良好狀態之前,成功探查的數目。 | int |
超時 | ISO 8601 格式的探查逾時。 | 字串 |
ResourceIdentity
名字 | 描述 | 價值 |
---|---|---|
類型 | 定義 ResourceIdentity 類型的值。 | 'None' 'SystemAssigned' 'SystemAssigned,UserAssigned' 'UserAssigned' |
userAssignedIdentities | 使用者指派身分識別的字典,索引鍵是 UAI 的 ARM 資源識別碼。 | ResourceIdentityUserAssignedIdentities |
ResourceIdentityUserAssignedIdentities
名字 | 描述 | 價值 |
---|
TrackedResourceTags
名字 | 描述 | 價值 |
---|
UserAssignedIdentityMeta
名字 | 描述 | 價值 |
---|---|---|
clientId | Aka 應用程式識別碼,這是 Azure AD 所產生的唯一標識碼,在初始布建期間系結至應用程式和服務主體。 | 字串 |
principalId | 受控識別的服務主體對象標識碼,用來授與 Azure 資源的角色型存取權。 | 字串 |
ARM 樣本資源定義
workspaces/onlineEndpoints/deployments 資源類型可以使用目標作業來部署:
- 資源群組 - 請參閱 資源群組部署命令
如需每個 API 版本中已變更屬性的清單,請參閱 變更記錄檔。
資源格式
若要建立 Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments 資源,請將下列 JSON 新增至範本。
{
"type": "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments",
"apiVersion": "2021-03-01-preview",
"name": "string",
"identity": {
"type": "string",
"userAssignedIdentities": {
"{customized property}": {
"clientId": "string",
"principalId": "string"
}
}
},
"kind": "string",
"location": "string",
"properties": {
"appInsightsEnabled": "bool",
"codeConfiguration": {
"codeId": "string",
"scoringScript": "string"
},
"description": "string",
"environmentId": "string",
"environmentVariables": {
"{customized property}": "string"
},
"livenessProbe": {
"failureThreshold": "int",
"initialDelay": "string",
"period": "string",
"successThreshold": "int",
"timeout": "string"
},
"model": {
"referenceType": "string"
// For remaining properties, see AssetReferenceBase objects
},
"properties": {
"{customized property}": "string"
},
"requestSettings": {
"maxConcurrentRequestsPerInstance": "int",
"maxQueueWait": "string",
"requestTimeout": "string"
},
"scaleSettings": {
"maxInstances": "int",
"minInstances": "int",
"scaleType": "string"
// For remaining properties, see OnlineScaleSettings objects
},
"endpointComputeType": "string"
// For remaining properties, see OnlineDeployment objects
},
"tags": {
"{customized property}": "string"
}
}
OnlineDeployment 物件
設定 endpointComputeType 屬性,以指定對象的類型。
針對 K8S,請使用:
{
"containerResourceRequirements": {
"cpu": "int",
"cpuLimit": "int",
"fpga": "int",
"gpu": "int",
"memoryInGB": "int",
"memoryInGBLimit": "int"
},
"endpointComputeType": "K8S"
}
針對 Managed,請使用:
{
"endpointComputeType": "Managed",
"instanceType": "string",
"readinessProbe": {
"failureThreshold": "int",
"initialDelay": "string",
"period": "string",
"successThreshold": "int",
"timeout": "string"
}
}
OnlineScaleSettings 物件
設定 scaleType 屬性,以指定物件的類型。
針對 Auto,請使用:
{
"pollingInterval": "string",
"scaleType": "Auto",
"targetUtilizationPercentage": "int"
}
針對 手動,請使用:
{
"instanceCount": "int",
"scaleType": "Manual"
}
AssetReferenceBase 物件
設定 referenceType 屬性,以指定對象的類型。
針對 DataPath,請使用:
{
"datastoreId": "string",
"path": "string",
"referenceType": "DataPath"
}
針對 識別碼,請使用:
{
"assetId": "string",
"referenceType": "Id"
}
針對 OutputPath,請使用:
{
"jobId": "string",
"path": "string",
"referenceType": "OutputPath"
}
屬性值
AssetReferenceBase
名字 | 描述 | 價值 |
---|---|---|
referenceType | 針對 dataPathAssetReference 類型 設定為 'DataPath',。 針對 idAssetReference 類型 設定為 'Id',。 將 type OutputPathAssetReference設定為 'OutputPath'。 | 'DataPath' 'Id' 'OutputPath' (必要) |
AutoScaleSettings
名字 | 描述 | 價值 |
---|---|---|
pollingInterval | ISO 8691 格式的輪詢間隔。 僅支援有效位數為秒數的持續時間。 | 字串 |
scaleType | [必要]部署調整演算法的類型 | 'Auto' (必要) |
targetUtilizationPercentage | 自動調整程式的目標 CPU 使用量。 | int |
CodeConfiguration
名字 | 描述 | 價值 |
---|---|---|
codeId | 程式代碼資產的 ARM 資源識別碼。 | 字串 |
scoringScript | [必要]在啟動時執行的腳本。 例如 “score.py” | 字串 約束: 最小長度 = 1 模式 = [a-zA-Z0-9_] (必要) |
ContainerResourceRequirements
名字 | 描述 | 價值 |
---|---|---|
中央處理器 | 容器要使用的 CPU 核心數量下限。 詳細資訊: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
int |
cpuLimit | 容器允許使用的 CPU 核心數量上限。 詳細資訊: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
int |
fpga | 公開給容器的 FPGA PCIE 裝置數目。 必須是 2 的倍數。 | int |
gpu | 容器中的 GPU 核心數目。 | int |
memoryInGB | 容器要使用的記憶體數量下限(以 GB 為單位)。 詳細資訊: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
int |
memoryInGBLimit | 容器允許使用的記憶體數量上限(以 GB 為單位)。 詳細資訊: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
int |
DataPathAssetReference
名字 | 描述 | 價值 |
---|---|---|
datastoreId | 資產所在數據存放區的 ARM 資源識別碼。 | 字串 |
路徑 | 數據存放區中檔案/目錄的路徑。 | 字串 |
referenceType | [必要]指定資產參考的類型。 | 'DataPath' (必要) |
IdAssetReference
名字 | 描述 | 價值 |
---|---|---|
assetId | [必要]資產的 ARM 資源識別碼。 | 字串 約束: 模式 = [a-zA-Z0-9_] (必要) |
referenceType | [必要]指定資產參考的類型。 | 'Id' (必要) |
K8SOnlineDeployment
名字 | 描述 | 價值 |
---|---|---|
containerResourceRequirements | 在線部署內每個容器實例的資源需求。 | ContainerResourceRequirements |
endpointComputeType | [必要]端點的計算類型。 | 'K8S' (必要) |
ManagedOnlineDeployment
名字 | 描述 | 價值 |
---|---|---|
endpointComputeType | [必要]端點的計算類型。 | 'Managed' (必要) |
instanceType | 計算實例類型。 | 字串 |
readinessProbe | 部署容器活躍度/整備探查組態。 | ProbeSettings |
ManualScaleSettings
名字 | 描述 | 價值 |
---|---|---|
instanceCount | 已修正此部署的實例數目。 | int |
scaleType | [必要]部署調整演算法的類型 | 'Manual' (必要) |
Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments
名字 | 描述 | 價值 |
---|---|---|
apiVersion | API 版本 | '2021-03-01-preview' |
身份 | 與資源相關聯的服務識別。 | ResourceIdentity |
類 | 入口網站/工具等用來轉譯相同類型資源的不同UX體驗的元數據。 | 字串 |
位置 | 資源所在的地理位置 | 字串 (必要) |
名字 | 資源名稱 | 字串 約束: 模式 = ^[a-zA-Z0-9][a-zA-Z0-9\-_]{0,254}$ (必要) |
性能 | [必要]實體的其他屬性。 | OnlineDeployment (必要) |
標籤 | 資源標籤 | 標記名稱和值的字典。 請參閱範本中的 標籤 |
類型 | 資源類型 | 'Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments' |
OnlineDeployment
名字 | 描述 | 價值 |
---|---|---|
appInsightsEnabled | 如果為 true,請啟用 Application Insights 記錄。 | bool |
codeConfiguration | 端點部署的程式代碼組態。 | CodeConfiguration |
描述 | 端點部署的描述。 | 字串 |
endpointComputeType | 針對類型 K8SOnlineDeployment,設定為 'K8S'。 針對 managedOnlineDeployment 類型 設定為 'Managed',。 | 'K8S' 'Managed' (必要) |
environmentId | 端點部署環境規格的 ARM 資源識別碼。 | 字串 |
environmentVariables | 部署的環境變數組態。 | OnlineDeploymentEnvironmentVariables |
livenessProbe | 部署容器活躍度/整備探查組態。 | ProbeSettings |
型 | 端點部署的模型資產參考。 | AssetReferenceBase |
性能 | 屬性字典。 可以新增屬性,但無法移除或改變。 | OnlineDeploymentProperties |
requestSettings | 在線部署評分要求設定。 | OnlineRequestSettings |
scaleSettings | 在線部署調整設定。 | OnlineScaleSettings |
OnlineDeploymentEnvironmentVariables
名字 | 描述 | 價值 |
---|
OnlineDeploymentProperties
名字 | 描述 | 價值 |
---|
OnlineRequestSettings
名字 | 描述 | 價值 |
---|---|---|
maxConcurrentRequestsPerInstance | 此部署允許一次排入佇列的要求數目。 | int |
maxQueueWait | ISO 8601 格式的佇列等候時間上限。 支援毫秒有效位數。 | 字串 |
requestTimeout | ISO 8601 格式的要求逾時。 支援毫秒有效位數。 | 字串 |
OnlineScaleSettings
名字 | 描述 | 價值 |
---|---|---|
maxInstances | 此部署的實例數目上限。 | int |
minInstances | 此部署的實例數目下限。 | int |
scaleType | 針對 autoScaleSettings 類型設定為 'Auto',。 針對 manualScaleSettings type,設定為 'Manual'。 | 'Auto' 'Manual' (必要) |
OutputPathAssetReference
名字 | 描述 | 價值 |
---|---|---|
jobId | 作業的 ARM 資源識別碼。 | 字串 |
路徑 | 作業輸出中檔案/目錄的路徑。 | 字串 |
referenceType | [必要]指定資產參考的類型。 | 'OutputPath' (必要) |
ProbeSettings
名字 | 描述 | 價值 |
---|---|---|
failureThreshold | 傳回狀況不良狀態之前允許的失敗次數。 | int |
initialDelay | ISO 8601 格式第一個探查之前的延遲。 | 字串 |
時期 | ISO 8601 格式探查之間的時間長度。 | 字串 |
successThreshold | 傳回狀況良好狀態之前,成功探查的數目。 | int |
超時 | ISO 8601 格式的探查逾時。 | 字串 |
ResourceIdentity
名字 | 描述 | 價值 |
---|---|---|
類型 | 定義 ResourceIdentity 類型的值。 | 'None' 'SystemAssigned' 'SystemAssigned,UserAssigned' 'UserAssigned' |
userAssignedIdentities | 使用者指派身分識別的字典,索引鍵是 UAI 的 ARM 資源識別碼。 | ResourceIdentityUserAssignedIdentities |
ResourceIdentityUserAssignedIdentities
名字 | 描述 | 價值 |
---|
TrackedResourceTags
名字 | 描述 | 價值 |
---|
UserAssignedIdentityMeta
名字 | 描述 | 價值 |
---|---|---|
clientId | Aka 應用程式識別碼,這是 Azure AD 所產生的唯一標識碼,在初始布建期間系結至應用程式和服務主體。 | 字串 |
principalId | 受控識別的服務主體對象標識碼,用來授與 Azure 資源的角色型存取權。 | 字串 |
Terraform (AzAPI 提供者) 資源定義
workspaces/onlineEndpoints/deployments 資源類型可以使用目標作業來部署:
- 資源群組
如需每個 API 版本中已變更屬性的清單,請參閱 變更記錄檔。
資源格式
若要建立 Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments 資源,請將下列 Terraform 新增至範本。
resource "azapi_resource" "symbolicname" {
type = "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2021-03-01-preview"
name = "string"
identity = {
type = "string"
userAssignedIdentities = {
{customized property} = {
clientId = "string"
principalId = "string"
}
}
}
kind = "string"
location = "string"
body = jsonencode({
properties = {
appInsightsEnabled = bool
codeConfiguration = {
codeId = "string"
scoringScript = "string"
}
description = "string"
environmentId = "string"
environmentVariables = {
{customized property} = "string"
}
livenessProbe = {
failureThreshold = int
initialDelay = "string"
period = "string"
successThreshold = int
timeout = "string"
}
model = {
referenceType = "string"
// For remaining properties, see AssetReferenceBase objects
}
properties = {
{customized property} = "string"
}
requestSettings = {
maxConcurrentRequestsPerInstance = int
maxQueueWait = "string"
requestTimeout = "string"
}
scaleSettings = {
maxInstances = int
minInstances = int
scaleType = "string"
// For remaining properties, see OnlineScaleSettings objects
}
endpointComputeType = "string"
// For remaining properties, see OnlineDeployment objects
}
})
tags = {
{customized property} = "string"
}
}
OnlineDeployment 物件
設定 endpointComputeType 屬性,以指定對象的類型。
針對 K8S,請使用:
{
containerResourceRequirements = {
cpu = int
cpuLimit = int
fpga = int
gpu = int
memoryInGB = int
memoryInGBLimit = int
}
endpointComputeType = "K8S"
}
針對 Managed,請使用:
{
endpointComputeType = "Managed"
instanceType = "string"
readinessProbe = {
failureThreshold = int
initialDelay = "string"
period = "string"
successThreshold = int
timeout = "string"
}
}
OnlineScaleSettings 物件
設定 scaleType 屬性,以指定物件的類型。
針對 Auto,請使用:
{
pollingInterval = "string"
scaleType = "Auto"
targetUtilizationPercentage = int
}
針對 手動,請使用:
{
instanceCount = int
scaleType = "Manual"
}
AssetReferenceBase 物件
設定 referenceType 屬性,以指定對象的類型。
針對 DataPath,請使用:
{
datastoreId = "string"
path = "string"
referenceType = "DataPath"
}
針對 識別碼,請使用:
{
assetId = "string"
referenceType = "Id"
}
針對 OutputPath,請使用:
{
jobId = "string"
path = "string"
referenceType = "OutputPath"
}
屬性值
AssetReferenceBase
名字 | 描述 | 價值 |
---|---|---|
referenceType | 針對 dataPathAssetReference 類型 設定為 'DataPath',。 針對 idAssetReference 類型 設定為 'Id',。 將 type OutputPathAssetReference設定為 'OutputPath'。 | 'DataPath' 'Id' 'OutputPath' (必要) |
AutoScaleSettings
名字 | 描述 | 價值 |
---|---|---|
pollingInterval | ISO 8691 格式的輪詢間隔。 僅支援有效位數為秒數的持續時間。 | 字串 |
scaleType | [必要]部署調整演算法的類型 | 'Auto' (必要) |
targetUtilizationPercentage | 自動調整程式的目標 CPU 使用量。 | int |
CodeConfiguration
名字 | 描述 | 價值 |
---|---|---|
codeId | 程式代碼資產的 ARM 資源識別碼。 | 字串 |
scoringScript | [必要]在啟動時執行的腳本。 例如 “score.py” | 字串 約束: 最小長度 = 1 模式 = [a-zA-Z0-9_] (必要) |
ContainerResourceRequirements
名字 | 描述 | 價值 |
---|---|---|
中央處理器 | 容器要使用的 CPU 核心數量下限。 詳細資訊: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
int |
cpuLimit | 容器允許使用的 CPU 核心數量上限。 詳細資訊: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
int |
fpga | 公開給容器的 FPGA PCIE 裝置數目。 必須是 2 的倍數。 | int |
gpu | 容器中的 GPU 核心數目。 | int |
memoryInGB | 容器要使用的記憶體數量下限(以 GB 為單位)。 詳細資訊: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
int |
memoryInGBLimit | 容器允許使用的記憶體數量上限(以 GB 為單位)。 詳細資訊: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
int |
DataPathAssetReference
名字 | 描述 | 價值 |
---|---|---|
datastoreId | 資產所在數據存放區的 ARM 資源識別碼。 | 字串 |
路徑 | 數據存放區中檔案/目錄的路徑。 | 字串 |
referenceType | [必要]指定資產參考的類型。 | 'DataPath' (必要) |
IdAssetReference
名字 | 描述 | 價值 |
---|---|---|
assetId | [必要]資產的 ARM 資源識別碼。 | 字串 約束: 模式 = [a-zA-Z0-9_] (必要) |
referenceType | [必要]指定資產參考的類型。 | 'Id' (必要) |
K8SOnlineDeployment
名字 | 描述 | 價值 |
---|---|---|
containerResourceRequirements | 在線部署內每個容器實例的資源需求。 | ContainerResourceRequirements |
endpointComputeType | [必要]端點的計算類型。 | 'K8S' (必要) |
ManagedOnlineDeployment
名字 | 描述 | 價值 |
---|---|---|
endpointComputeType | [必要]端點的計算類型。 | 'Managed' (必要) |
instanceType | 計算實例類型。 | 字串 |
readinessProbe | 部署容器活躍度/整備探查組態。 | ProbeSettings |
ManualScaleSettings
名字 | 描述 | 價值 |
---|---|---|
instanceCount | 已修正此部署的實例數目。 | int |
scaleType | [必要]部署調整演算法的類型 | 'Manual' (必要) |
Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments
名字 | 描述 | 價值 |
---|---|---|
身份 | 與資源相關聯的服務識別。 | ResourceIdentity |
類 | 入口網站/工具等用來轉譯相同類型資源的不同UX體驗的元數據。 | 字串 |
位置 | 資源所在的地理位置 | 字串 (必要) |
名字 | 資源名稱 | 字串 約束: 模式 = ^[a-zA-Z0-9][a-zA-Z0-9\-_]{0,254}$ (必要) |
parent_id | 此資源為父系之資源的標識碼。 | 類型資源的標識碼:工作區/onlineEndpoints |
性能 | [必要]實體的其他屬性。 | OnlineDeployment (必要) |
標籤 | 資源標籤 | 標記名稱和值的字典。 |
類型 | 資源類型 | “Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2021-03-01-preview” |
OnlineDeployment
名字 | 描述 | 價值 |
---|---|---|
appInsightsEnabled | 如果為 true,請啟用 Application Insights 記錄。 | bool |
codeConfiguration | 端點部署的程式代碼組態。 | CodeConfiguration |
描述 | 端點部署的描述。 | 字串 |
endpointComputeType | 針對類型 K8SOnlineDeployment,設定為 'K8S'。 針對 managedOnlineDeployment 類型 設定為 'Managed',。 | 'K8S' 'Managed' (必要) |
environmentId | 端點部署環境規格的 ARM 資源識別碼。 | 字串 |
environmentVariables | 部署的環境變數組態。 | OnlineDeploymentEnvironmentVariables |
livenessProbe | 部署容器活躍度/整備探查組態。 | ProbeSettings |
型 | 端點部署的模型資產參考。 | AssetReferenceBase |
性能 | 屬性字典。 可以新增屬性,但無法移除或改變。 | OnlineDeploymentProperties |
requestSettings | 在線部署評分要求設定。 | OnlineRequestSettings |
scaleSettings | 在線部署調整設定。 | OnlineScaleSettings |
OnlineDeploymentEnvironmentVariables
名字 | 描述 | 價值 |
---|
OnlineDeploymentProperties
名字 | 描述 | 價值 |
---|
OnlineRequestSettings
名字 | 描述 | 價值 |
---|---|---|
maxConcurrentRequestsPerInstance | 此部署允許一次排入佇列的要求數目。 | int |
maxQueueWait | ISO 8601 格式的佇列等候時間上限。 支援毫秒有效位數。 | 字串 |
requestTimeout | ISO 8601 格式的要求逾時。 支援毫秒有效位數。 | 字串 |
OnlineScaleSettings
名字 | 描述 | 價值 |
---|---|---|
maxInstances | 此部署的實例數目上限。 | int |
minInstances | 此部署的實例數目下限。 | int |
scaleType | 針對 autoScaleSettings 類型設定為 'Auto',。 針對 manualScaleSettings type,設定為 'Manual'。 | 'Auto' 'Manual' (必要) |
OutputPathAssetReference
名字 | 描述 | 價值 |
---|---|---|
jobId | 作業的 ARM 資源識別碼。 | 字串 |
路徑 | 作業輸出中檔案/目錄的路徑。 | 字串 |
referenceType | [必要]指定資產參考的類型。 | 'OutputPath' (必要) |
ProbeSettings
名字 | 描述 | 價值 |
---|---|---|
failureThreshold | 傳回狀況不良狀態之前允許的失敗次數。 | int |
initialDelay | ISO 8601 格式第一個探查之前的延遲。 | 字串 |
時期 | ISO 8601 格式探查之間的時間長度。 | 字串 |
successThreshold | 傳回狀況良好狀態之前,成功探查的數目。 | int |
超時 | ISO 8601 格式的探查逾時。 | 字串 |
ResourceIdentity
名字 | 描述 | 價值 |
---|---|---|
類型 | 定義 ResourceIdentity 類型的值。 | 'None' 'SystemAssigned' 'SystemAssigned,UserAssigned' 'UserAssigned' |
userAssignedIdentities | 使用者指派身分識別的字典,索引鍵是 UAI 的 ARM 資源識別碼。 | ResourceIdentityUserAssignedIdentities |
ResourceIdentityUserAssignedIdentities
名字 | 描述 | 價值 |
---|
TrackedResourceTags
名字 | 描述 | 價值 |
---|
UserAssignedIdentityMeta
名字 | 描述 | 價值 |
---|---|---|
clientId | Aka 應用程式識別碼,這是 Azure AD 所產生的唯一標識碼,在初始布建期間系結至應用程式和服務主體。 | 字串 |
principalId | 受控識別的服務主體對象標識碼,用來授與 Azure 資源的角色型存取權。 | 字串 |