Partager via


ModelBatchDeploymentSettings Classe

Notes

Il s’agit d’une classe expérimentale qui peut changer à tout moment. Pour plus d’informations, consultez https://aka.ms/azuremlexperimental.

Entité Paramètres de déploiement de lot de modèles.

Héritage
builtins.object
ModelBatchDeploymentSettings

Constructeur

ModelBatchDeploymentSettings(*, mini_batch_size: int | None, instance_count: int | None = None, max_concurrency_per_instance: int | None = None, output_action: BatchDeploymentOutputAction | None = None, output_file_name: str | None = None, retry_settings: BatchRetrySettings | None = None, environment_variables: Dict[str, str] | None = None, error_threshold: int | None = None, logging_level: str | None = None, **kwargs: Any)

Paramètres

Nom Description
mini_batch_size
Obligatoire
int

Taille du mini-lot passé à chaque appel de lot, la valeur par défaut est 10

instance_count
Obligatoire
int

Nombre d’instances sur laquelle l’interférence s’exécutera. Équivalent à resources.instance_count.

output_action
Obligatoire

Indique comment la sortie sera organisée. Les valeurs possibles sont les suivantes : « summary_only », « append_row ». La valeur par défaut est « append_row »

output_file_name
Obligatoire
str

Nom de fichier de sortie personnalisé pour append_row action de sortie, la valeur par défaut est « predictions.csv »

max_concurrency_per_instance
Obligatoire
int

Indique le nombre maximal de parallélismes par instance, la valeur par défaut est 1

retry_settings
Obligatoire

Paramètres de nouvelle tentative pour une opération d’inférence de lot, la valeur par défaut est None

environment_variables
Obligatoire

Variables d’environnement qui seront définies dans le déploiement.

error_threshold
Obligatoire
int

Seuil d’erreur : si le nombre d’erreurs pour l’ensemble de l’entrée dépasse cette valeur, l’inférence par lot est abandonnée. La plage est [-1, int. MaxValue] -1 indique, ignorer tous les échecs lors de l’inférence par lots Pour FileDataset count of file failures For TabularDataset, this is the count of record failures, is the defaults to -1

logging_level
Obligatoire
str

Niveau de journalisation pour l’opération d’inférence par lots, la valeur par défaut est « info »

Exemples

Création d’un objet Model Batch Deployment Settings.


   from azure.ai.ml.entities._deployment.model_batch_deployment_settings import ModelBatchDeploymentSettings

   modelBatchDeploymentSetting = ModelBatchDeploymentSettings(
       mini_batch_size=256,
       instance_count=5,
       max_concurrency_per_instance=2,
       output_file_name="output-file-name",
       environment_variables={"env1": "value1", "env2": "value2"},
       error_threshold=2,
       logging_level=1,
   )