Espaces de travail Microsoft.MachineLearningServices/inférencePools 2023-08-01-preview
Définition de ressource Bicep
Le type de ressource workspaces/inferencePools peut être déployé avec des opérations qui ciblent :
- groupes de ressources - Consultez commandes de déploiement de groupes de ressources
Pour obtenir la liste des propriétés modifiées dans chaque version de l’API, consultez journal des modifications.
Format de ressource
Pour créer une ressource Microsoft.MachineLearningServices/workspaces/inferencePools, ajoutez le bicep suivant à votre modèle.
resource symbolicname 'Microsoft.MachineLearningServices/workspaces/inferencePools@2023-08-01-preview' = {
name: 'string'
location: 'string'
tags: {
tagName1: 'tagValue1'
tagName2: 'tagValue2'
}
sku: {
capacity: int
family: 'string'
name: 'string'
size: 'string'
tier: 'string'
}
kind: 'string'
parent: resourceSymbolicName
identity: {
type: 'string'
userAssignedIdentities: {
{customized property}: {}
}
}
properties: {
codeConfiguration: {
codeId: 'string'
scoringScript: 'string'
}
description: 'string'
environmentConfiguration: {
environmentId: 'string'
environmentVariables: {
{customized property}: 'string'
}
livenessProbe: {
failureThreshold: int
initialDelay: 'string'
period: 'string'
successThreshold: int
timeout: 'string'
}
readinessProbe: {
failureThreshold: int
initialDelay: 'string'
period: 'string'
successThreshold: int
timeout: 'string'
}
startupProbe: {
failureThreshold: int
initialDelay: 'string'
period: 'string'
successThreshold: int
timeout: 'string'
}
}
modelConfiguration: {
modelId: 'string'
}
nodeSkuType: 'string'
properties: {
{customized property}: 'string'
}
requestConfiguration: {
maxConcurrentRequestsPerInstance: int
requestTimeout: 'string'
}
}
}
Valeurs de propriété
espaces de travail/inférencePools
Nom | Description | Valeur |
---|---|---|
nom | Nom de la ressource Découvrez comment définir des noms et des types pour les ressources enfants dans Bicep. |
chaîne (obligatoire) |
emplacement | Emplacement géographique où réside la ressource | chaîne (obligatoire) |
étiquettes | Balises de ressource. | Dictionnaire de noms et de valeurs d’étiquettes. Consultez les balises dans les modèles |
Sku | Détails de la référence SKU requis pour le contrat ARM pour la mise à l’échelle automatique. | référence SKU |
gentil | Métadonnées utilisées par le portail/l’outil/etc pour afficher différentes expériences d’expérience utilisateur pour les ressources du même type. | corde |
parent | Dans Bicep, vous pouvez spécifier la ressource parente d’une ressource enfant. Vous devez uniquement ajouter cette propriété lorsque la ressource enfant est déclarée en dehors de la ressource parente. Pour plus d’informations, consultez ressource enfant en dehors de la ressource parente. |
Nom symbolique de la ressource de type : espaces de travail |
identité | Identité de service managée (identités affectées par le système et/ou identités affectées par l’utilisateur) | ManagedServiceIdentity |
Propriétés | [Obligatoire] Attributs supplémentaires de l’entité. | InferencePoolProperties (obligatoire) |
ManagedServiceIdentity
Nom | Description | Valeur |
---|---|---|
type | Type d’identité de service managé (où les types SystemAssigned et UserAssigned sont autorisés). | 'None' 'SystemAssigned' 'SystemAssigned,UserAssigned' 'UserAssigned' (obligatoire) |
userAssignedIdentities | Ensemble d’identités affectées par l’utilisateur associées à la ressource. Les clés de dictionnaire userAssignedIdentities seront des ID de ressource ARM sous la forme : « /subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. Les valeurs de dictionnaire peuvent être des objets vides ({}) dans les requêtes. | UserAssignedIdentities |
UserAssignedIdentities
Nom | Description | Valeur |
---|---|---|
{propriété personnalisée} | UserAssignedIdentity |
UserAssignedIdentity
Cet objet ne contient aucune propriété à définir pendant le déploiement. Toutes les propriétés sont ReadOnly.
InferencePoolProperties
Nom | Description | Valeur |
---|---|---|
codeConfiguration | Configuration du code pour le pool d’inférence. | codeConfiguration |
description | Description de la ressource. | corde |
environmentConfiguration | EnvironmentConfiguration pour le pool d’inférences. | PoolEnvironmentConfiguration |
modelConfiguration | ModelConfiguration pour le pool d’inférences. | PoolModelConfiguration |
nodeSkuType | [Obligatoire] Type d’instance de calcul. | chaîne (obligatoire) Contraintes: Longueur minimale = 1 Modèle = [a-zA-Z0-9_] |
Propriétés | Dictionnaire de propriétés. Les propriétés peuvent être ajoutées, mais pas supprimées ou modifiées. | PropertiesBaseProperties |
requestConfiguration | Demander la configuration du pool d’inférences. | RequestConfiguration |
CodeConfiguration
Nom | Description | Valeur |
---|---|---|
codeId | ID de ressource ARM de la ressource de code. | corde |
scoringScript | [Obligatoire] Script à exécuter au démarrage. Eg. « score.py » | chaîne (obligatoire) Contraintes: Longueur minimale = 1 Modèle = [a-zA-Z0-9_] |
PoolEnvironmentConfiguration
Nom | Description | Valeur |
---|---|---|
environmentId | ID de ressource ARM de la spécification d’environnement pour le pool d’inférence. | corde |
environmentVariables | Configuration des variables d’environnement pour le pool d’inférence. | PoolEnvironmentConfigurationEnvironmentVariables |
livenessProbe | La sonde Liveness surveille régulièrement l’intégrité du conteneur. | probeSettings |
readinessProbe | La sonde Readiness valide si le conteneur est prêt à servir le trafic. Les propriétés et les valeurs par défaut sont identiques à celles de la sonde liveness. | probeSettings |
startupProbe | Cela vérifie si l’application dans un conteneur est démarrée. Les sondes de démarrage s’exécutent avant toute autre sonde et, à moins qu’elles ne se terminent correctement, désactive d’autres sondes. | probeSettings |
PoolEnvironmentConfigurationEnvironmentVariables
Nom | Description | Valeur |
---|---|---|
{propriété personnalisée} | corde |
ProbeSettings
Nom | Description | Valeur |
---|---|---|
failureThreshold | Nombre d’échecs à autoriser avant de retourner un état défectueux. | Int |
initialDelay | Délai avant la première sonde au format ISO 8601. | corde |
période | Durée entre les sondes au format ISO 8601. | corde |
successThreshold | Nombre de sondes réussies avant de retourner un état sain. | Int |
Timeout | Délai d’expiration de la sonde au format ISO 8601. | corde |
PoolModelConfiguration
Nom | Description | Valeur |
---|---|---|
modelId | Chemin d’ACCÈS DE l’URI au modèle. | corde |
PropertiesBaseProperties
Nom | Description | Valeur |
---|---|---|
{propriété personnalisée} | corde |
RequestConfiguration
Nom | Description | Valeur |
---|---|---|
maxConcurrentRequestsPerInstance | Nombre maximal de requêtes simultanées par nœud autorisé par déploiement. La valeur par défaut est 1. | Int |
requestTimeout | Délai d’expiration du score au format ISO 8601. La valeur par défaut est 5 000 ms. |
corde |
Sku
Nom | Description | Valeur |
---|---|---|
capacité | Si la référence SKU prend en charge le scale-out/in, l’entier de capacité doit être inclus. Si le scale-out/in n’est pas possible pour la ressource, cela peut être omis. | Int |
Famille | Si le service a différentes générations de matériel, pour la même référence SKU, vous pouvez le capturer ici. | corde |
nom | Nom de la référence SKU. Ex - P3. Il s’agit généralement d’une lettre+code numérique | chaîne (obligatoire) |
taille | Taille de la référence SKU. Lorsque le champ de nom est la combinaison de niveau et d’une autre valeur, il s’agit du code autonome. | corde |
niveau | Ce champ doit être implémenté par le fournisseur de ressources si le service a plusieurs niveaux, mais n’est pas obligatoire sur un PUT. | 'De base' 'Free' 'Premium' 'Standard' |
Définition de ressource de modèle ARM
Le type de ressource workspaces/inferencePools peut être déployé avec des opérations qui ciblent :
- groupes de ressources - Consultez commandes de déploiement de groupes de ressources
Pour obtenir la liste des propriétés modifiées dans chaque version de l’API, consultez journal des modifications.
Format de ressource
Pour créer une ressource Microsoft.MachineLearningServices/workspaces/inferencePools, ajoutez le code JSON suivant à votre modèle.
{
"type": "Microsoft.MachineLearningServices/workspaces/inferencePools",
"apiVersion": "2023-08-01-preview",
"name": "string",
"location": "string",
"tags": {
"tagName1": "tagValue1",
"tagName2": "tagValue2"
},
"sku": {
"capacity": "int",
"family": "string",
"name": "string",
"size": "string",
"tier": "string"
},
"kind": "string",
"identity": {
"type": "string",
"userAssignedIdentities": {
"{customized property}": {}
}
},
"properties": {
"codeConfiguration": {
"codeId": "string",
"scoringScript": "string"
},
"description": "string",
"environmentConfiguration": {
"environmentId": "string",
"environmentVariables": {
"{customized property}": "string"
},
"livenessProbe": {
"failureThreshold": "int",
"initialDelay": "string",
"period": "string",
"successThreshold": "int",
"timeout": "string"
},
"readinessProbe": {
"failureThreshold": "int",
"initialDelay": "string",
"period": "string",
"successThreshold": "int",
"timeout": "string"
},
"startupProbe": {
"failureThreshold": "int",
"initialDelay": "string",
"period": "string",
"successThreshold": "int",
"timeout": "string"
}
},
"modelConfiguration": {
"modelId": "string"
},
"nodeSkuType": "string",
"properties": {
"{customized property}": "string"
},
"requestConfiguration": {
"maxConcurrentRequestsPerInstance": "int",
"requestTimeout": "string"
}
}
}
Valeurs de propriété
espaces de travail/inférencePools
Nom | Description | Valeur |
---|---|---|
type | Type de ressource | 'Microsoft.MachineLearningServices/workspaces/inferencePools' |
apiVersion | Version de l’API de ressource | '2023-08-01-preview' |
nom | Nom de la ressource Découvrez comment définir des noms et des types pour les ressources enfants dans modèles ARM JSON. |
chaîne (obligatoire) |
emplacement | Emplacement géographique où réside la ressource | chaîne (obligatoire) |
étiquettes | Balises de ressource. | Dictionnaire de noms et de valeurs d’étiquettes. Consultez les balises dans les modèles |
Sku | Détails de la référence SKU requis pour le contrat ARM pour la mise à l’échelle automatique. | référence SKU |
gentil | Métadonnées utilisées par le portail/l’outil/etc pour afficher différentes expériences d’expérience utilisateur pour les ressources du même type. | corde |
identité | Identité de service managée (identités affectées par le système et/ou identités affectées par l’utilisateur) | ManagedServiceIdentity |
Propriétés | [Obligatoire] Attributs supplémentaires de l’entité. | InferencePoolProperties (obligatoire) |
ManagedServiceIdentity
Nom | Description | Valeur |
---|---|---|
type | Type d’identité de service managé (où les types SystemAssigned et UserAssigned sont autorisés). | 'None' 'SystemAssigned' 'SystemAssigned,UserAssigned' 'UserAssigned' (obligatoire) |
userAssignedIdentities | Ensemble d’identités affectées par l’utilisateur associées à la ressource. Les clés de dictionnaire userAssignedIdentities seront des ID de ressource ARM sous la forme : « /subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. Les valeurs de dictionnaire peuvent être des objets vides ({}) dans les requêtes. | UserAssignedIdentities |
UserAssignedIdentities
Nom | Description | Valeur |
---|---|---|
{propriété personnalisée} | UserAssignedIdentity |
UserAssignedIdentity
Cet objet ne contient aucune propriété à définir pendant le déploiement. Toutes les propriétés sont ReadOnly.
InferencePoolProperties
Nom | Description | Valeur |
---|---|---|
codeConfiguration | Configuration du code pour le pool d’inférence. | codeConfiguration |
description | Description de la ressource. | corde |
environmentConfiguration | EnvironmentConfiguration pour le pool d’inférences. | PoolEnvironmentConfiguration |
modelConfiguration | ModelConfiguration pour le pool d’inférences. | PoolModelConfiguration |
nodeSkuType | [Obligatoire] Type d’instance de calcul. | chaîne (obligatoire) Contraintes: Longueur minimale = 1 Modèle = [a-zA-Z0-9_] |
Propriétés | Dictionnaire de propriétés. Les propriétés peuvent être ajoutées, mais pas supprimées ou modifiées. | PropertiesBaseProperties |
requestConfiguration | Demander la configuration du pool d’inférences. | RequestConfiguration |
CodeConfiguration
Nom | Description | Valeur |
---|---|---|
codeId | ID de ressource ARM de la ressource de code. | corde |
scoringScript | [Obligatoire] Script à exécuter au démarrage. Eg. « score.py » | chaîne (obligatoire) Contraintes: Longueur minimale = 1 Modèle = [a-zA-Z0-9_] |
PoolEnvironmentConfiguration
Nom | Description | Valeur |
---|---|---|
environmentId | ID de ressource ARM de la spécification d’environnement pour le pool d’inférence. | corde |
environmentVariables | Configuration des variables d’environnement pour le pool d’inférence. | PoolEnvironmentConfigurationEnvironmentVariables |
livenessProbe | La sonde Liveness surveille régulièrement l’intégrité du conteneur. | probeSettings |
readinessProbe | La sonde Readiness valide si le conteneur est prêt à servir le trafic. Les propriétés et les valeurs par défaut sont identiques à celles de la sonde liveness. | probeSettings |
startupProbe | Cela vérifie si l’application dans un conteneur est démarrée. Les sondes de démarrage s’exécutent avant toute autre sonde et, à moins qu’elles ne se terminent correctement, désactive d’autres sondes. | probeSettings |
PoolEnvironmentConfigurationEnvironmentVariables
Nom | Description | Valeur |
---|---|---|
{propriété personnalisée} | corde |
ProbeSettings
Nom | Description | Valeur |
---|---|---|
failureThreshold | Nombre d’échecs à autoriser avant de retourner un état défectueux. | Int |
initialDelay | Délai avant la première sonde au format ISO 8601. | corde |
période | Durée entre les sondes au format ISO 8601. | corde |
successThreshold | Nombre de sondes réussies avant de retourner un état sain. | Int |
Timeout | Délai d’expiration de la sonde au format ISO 8601. | corde |
PoolModelConfiguration
Nom | Description | Valeur |
---|---|---|
modelId | Chemin d’ACCÈS DE l’URI au modèle. | corde |
PropertiesBaseProperties
Nom | Description | Valeur |
---|---|---|
{propriété personnalisée} | corde |
RequestConfiguration
Nom | Description | Valeur |
---|---|---|
maxConcurrentRequestsPerInstance | Nombre maximal de requêtes simultanées par nœud autorisé par déploiement. La valeur par défaut est 1. | Int |
requestTimeout | Délai d’expiration du score au format ISO 8601. La valeur par défaut est 5 000 ms. |
corde |
Sku
Nom | Description | Valeur |
---|---|---|
capacité | Si la référence SKU prend en charge le scale-out/in, l’entier de capacité doit être inclus. Si le scale-out/in n’est pas possible pour la ressource, cela peut être omis. | Int |
Famille | Si le service a différentes générations de matériel, pour la même référence SKU, vous pouvez le capturer ici. | corde |
nom | Nom de la référence SKU. Ex - P3. Il s’agit généralement d’une lettre+code numérique | chaîne (obligatoire) |
taille | Taille de la référence SKU. Lorsque le champ de nom est la combinaison de niveau et d’une autre valeur, il s’agit du code autonome. | corde |
niveau | Ce champ doit être implémenté par le fournisseur de ressources si le service a plusieurs niveaux, mais n’est pas obligatoire sur un PUT. | 'De base' 'Free' 'Premium' 'Standard' |
Définition de ressource Terraform (fournisseur AzAPI)
Le type de ressource workspaces/inferencePools peut être déployé avec des opérations qui ciblent :
- groupes de ressources
Pour obtenir la liste des propriétés modifiées dans chaque version de l’API, consultez journal des modifications.
Format de ressource
Pour créer une ressource Microsoft.MachineLearningServices/workspaces/inferencePools, ajoutez la terraform suivante à votre modèle.
resource "azapi_resource" "symbolicname" {
type = "Microsoft.MachineLearningServices/workspaces/inferencePools@2023-08-01-preview"
name = "string"
location = "string"
parent_id = "string"
tags = {
tagName1 = "tagValue1"
tagName2 = "tagValue2"
}
identity {
type = "string"
identity_ids = []
}
body = jsonencode({
properties = {
codeConfiguration = {
codeId = "string"
scoringScript = "string"
}
description = "string"
environmentConfiguration = {
environmentId = "string"
environmentVariables = {
{customized property} = "string"
}
livenessProbe = {
failureThreshold = int
initialDelay = "string"
period = "string"
successThreshold = int
timeout = "string"
}
readinessProbe = {
failureThreshold = int
initialDelay = "string"
period = "string"
successThreshold = int
timeout = "string"
}
startupProbe = {
failureThreshold = int
initialDelay = "string"
period = "string"
successThreshold = int
timeout = "string"
}
}
modelConfiguration = {
modelId = "string"
}
nodeSkuType = "string"
properties = {
{customized property} = "string"
}
requestConfiguration = {
maxConcurrentRequestsPerInstance = int
requestTimeout = "string"
}
}
sku = {
capacity = int
family = "string"
name = "string"
size = "string"
tier = "string"
}
kind = "string"
})
}
Valeurs de propriété
espaces de travail/inférencePools
Nom | Description | Valeur |
---|---|---|
type | Type de ressource | « Microsoft.MachineLearningServices/workspaces/inferencePools@2023-08-01-preview » |
nom | Nom de la ressource | chaîne (obligatoire) |
emplacement | Emplacement géographique où réside la ressource | chaîne (obligatoire) |
parent_id | ID de la ressource qui est le parent de cette ressource. | ID de ressource de type : espaces de travail |
étiquettes | Balises de ressource. | Dictionnaire de noms et de valeurs d’étiquettes. |
Sku | Détails de la référence SKU requis pour le contrat ARM pour la mise à l’échelle automatique. | référence SKU |
gentil | Métadonnées utilisées par le portail/l’outil/etc pour afficher différentes expériences d’expérience utilisateur pour les ressources du même type. | corde |
identité | Identité de service managée (identités affectées par le système et/ou identités affectées par l’utilisateur) | ManagedServiceIdentity |
Propriétés | [Obligatoire] Attributs supplémentaires de l’entité. | InferencePoolProperties (obligatoire) |
ManagedServiceIdentity
Nom | Description | Valeur |
---|---|---|
type | Type d’identité de service managé (où les types SystemAssigned et UserAssigned sont autorisés). | « SystemAssigned » « SystemAssigned,UserAssigned » « UserAssigned » (obligatoire) |
identity_ids | Ensemble d’identités affectées par l’utilisateur associées à la ressource. Les clés de dictionnaire userAssignedIdentities seront des ID de ressource ARM sous la forme : « /subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. Les valeurs de dictionnaire peuvent être des objets vides ({}) dans les requêtes. | Tableau d’ID d’identité utilisateur. |
UserAssignedIdentities
Nom | Description | Valeur |
---|---|---|
{propriété personnalisée} | UserAssignedIdentity |
UserAssignedIdentity
Cet objet ne contient aucune propriété à définir pendant le déploiement. Toutes les propriétés sont ReadOnly.
InferencePoolProperties
Nom | Description | Valeur |
---|---|---|
codeConfiguration | Configuration du code pour le pool d’inférence. | codeConfiguration |
description | Description de la ressource. | corde |
environmentConfiguration | EnvironmentConfiguration pour le pool d’inférences. | PoolEnvironmentConfiguration |
modelConfiguration | ModelConfiguration pour le pool d’inférences. | PoolModelConfiguration |
nodeSkuType | [Obligatoire] Type d’instance de calcul. | chaîne (obligatoire) Contraintes: Longueur minimale = 1 Modèle = [a-zA-Z0-9_] |
Propriétés | Dictionnaire de propriétés. Les propriétés peuvent être ajoutées, mais pas supprimées ou modifiées. | PropertiesBaseProperties |
requestConfiguration | Demander la configuration du pool d’inférences. | RequestConfiguration |
CodeConfiguration
Nom | Description | Valeur |
---|---|---|
codeId | ID de ressource ARM de la ressource de code. | corde |
scoringScript | [Obligatoire] Script à exécuter au démarrage. Eg. « score.py » | chaîne (obligatoire) Contraintes: Longueur minimale = 1 Modèle = [a-zA-Z0-9_] |
PoolEnvironmentConfiguration
Nom | Description | Valeur |
---|---|---|
environmentId | ID de ressource ARM de la spécification d’environnement pour le pool d’inférence. | corde |
environmentVariables | Configuration des variables d’environnement pour le pool d’inférence. | PoolEnvironmentConfigurationEnvironmentVariables |
livenessProbe | La sonde Liveness surveille régulièrement l’intégrité du conteneur. | probeSettings |
readinessProbe | La sonde Readiness valide si le conteneur est prêt à servir le trafic. Les propriétés et les valeurs par défaut sont identiques à celles de la sonde liveness. | probeSettings |
startupProbe | Cela vérifie si l’application dans un conteneur est démarrée. Les sondes de démarrage s’exécutent avant toute autre sonde et, à moins qu’elles ne se terminent correctement, désactive d’autres sondes. | probeSettings |
PoolEnvironmentConfigurationEnvironmentVariables
Nom | Description | Valeur |
---|---|---|
{propriété personnalisée} | corde |
ProbeSettings
Nom | Description | Valeur |
---|---|---|
failureThreshold | Nombre d’échecs à autoriser avant de retourner un état défectueux. | Int |
initialDelay | Délai avant la première sonde au format ISO 8601. | corde |
période | Durée entre les sondes au format ISO 8601. | corde |
successThreshold | Nombre de sondes réussies avant de retourner un état sain. | Int |
Timeout | Délai d’expiration de la sonde au format ISO 8601. | corde |
PoolModelConfiguration
Nom | Description | Valeur |
---|---|---|
modelId | Chemin d’ACCÈS DE l’URI au modèle. | corde |
PropertiesBaseProperties
Nom | Description | Valeur |
---|---|---|
{propriété personnalisée} | corde |
RequestConfiguration
Nom | Description | Valeur |
---|---|---|
maxConcurrentRequestsPerInstance | Nombre maximal de requêtes simultanées par nœud autorisé par déploiement. La valeur par défaut est 1. | Int |
requestTimeout | Délai d’expiration du score au format ISO 8601. La valeur par défaut est 5 000 ms. |
corde |
Sku
Nom | Description | Valeur |
---|---|---|
capacité | Si la référence SKU prend en charge le scale-out/in, l’entier de capacité doit être inclus. Si le scale-out/in n’est pas possible pour la ressource, cela peut être omis. | Int |
Famille | Si le service a différentes générations de matériel, pour la même référence SKU, vous pouvez le capturer ici. | corde |
nom | Nom de la référence SKU. Ex - P3. Il s’agit généralement d’une lettre+code numérique | chaîne (obligatoire) |
taille | Taille de la référence SKU. Lorsque le champ de nom est la combinaison de niveau et d’une autre valeur, il s’agit du code autonome. | corde |
niveau | Ce champ doit être implémenté par le fournisseur de ressources si le service a plusieurs niveaux, mais n’est pas obligatoire sur un PUT. | « De base » « Gratuit » « Premium » « Standard » |