SKLearn Classe
Crée un estimateur pour l’apprentissage dans les expériences Scikit-learn.
DÉPRÉCIÉ. Utilisez l’objet ScriptRunConfig avec votre propre environnement défini ou l’environnement AzureML-Tutorial organisé. Pour une présentation de la configuration de l’expérience SKLearn avec ScriptRunConfig, consultez Effectuer l’apprentissage des modèles scikit-learn à grande échelle avec Azure Machine Learning.
Cet estimateur prend uniquement en charge l’apprentissage d’UC à nœud unique.
Versions prises en charge : 0.20.3
Initialiser un estimateur Scikit-learn.
- Héritage
-
azureml.train.estimator._framework_base_estimator._FrameworkBaseEstimatorSKLearn
Constructeur
SKLearn(source_directory, *, compute_target=None, vm_size=None, vm_priority=None, entry_script=None, script_params=None, use_docker=True, custom_docker_image=None, image_registry_details=None, user_managed=False, conda_packages=None, pip_packages=None, conda_dependencies_file_path=None, pip_requirements_file_path=None, conda_dependencies_file=None, pip_requirements_file=None, environment_variables=None, environment_definition=None, inputs=None, shm_size=None, resume_from=None, max_run_duration_seconds=None, framework_version=None, _enable_optimized_mode=False, _disable_validation=True, _show_lint_warnings=False, _show_package_warnings=False)
Paramètres
Nom | Description |
---|---|
source_directory
Obligatoire
|
Répertoire local contenant les fichiers de configuration de l’expérience. |
compute_target
Obligatoire
|
Cible de calcul où la formation aura lieu. Il peut s’agir d’un objet ou de la chaîne « local ». |
vm_size
Obligatoire
|
Taille de la machine virtuelle de la cible de calcul qui sera créée pour la formation. Valeurs prises en charge : toute taille de machine virtuelle Azure. |
vm_priority
Obligatoire
|
Priorité de la machine virtuelle de la cible de calcul qui sera créée pour la formation. Si elle n’est pas spécifiée, la valeur « dedicated » est utilisée. Valeurs prises en charge : « dedicated » et « lowpriority ». Prend effet uniquement quand le paramètre |
entry_script
Obligatoire
|
Chaîne représentant le chemin d’accès relatif au fichier utilisé pour commencer la formation. |
script_params
Obligatoire
|
Dictionnaire d’arguments de ligne de commande à passer à votre script de formation spécifié dans |
custom_docker_image
Obligatoire
|
Nom de l’image Docker à partir de laquelle l’image à utiliser pour la formation sera générée. Si la valeur n’est pas définie, une image par défaut basée sur l’UC sera utilisée comme image de base. |
image_registry_details
Obligatoire
|
Détails du registre de l’image Docker. |
user_managed
Obligatoire
|
Spécifie si Azure ML réutilise un environnement Python existant. La valeur false signifie qu’Azure ML créera un environnement Python en fonction de la spécification des dépendances Conda. |
conda_packages
Obligatoire
|
Liste des chaînes représentant les packages Conda à ajouter à l’environnement Python pour l’expérience. |
pip_packages
Obligatoire
|
Liste des chaînes représentant les packages pip à ajouter à l’environnement Python pour l’expérience. |
conda_dependencies_file_path
Obligatoire
|
Chaîne représentant le chemin relatif du fichier YAML des dépendances conda.
Si la valeur est spécifiée, Azure ML n’installe aucun package associé à une infrastructure.
Peut être fourni en association avec le paramètre |
pip_requirements_file_path
Obligatoire
|
Chaîne représentant le chemin relatif du fichier texte des exigences pip.
Peut être fourni en association avec le paramètre |
conda_dependencies_file
Obligatoire
|
Chaîne représentant le chemin relatif du fichier YAML des dépendances conda.
Si la valeur est spécifiée, Azure ML n’installe aucun package associé à une infrastructure.
Peut être fourni en association avec le paramètre |
pip_requirements_file
Obligatoire
|
Chaîne représentant le chemin relatif du fichier texte des exigences pip.
Peut être fourni en association avec le paramètre |
environment_variables
Obligatoire
|
Dictionnaire des noms et valeurs des variables d’environnement. Ces variables d’environnement sont définies sur le processus où le script utilisateur est en cours d’exécution. |
environment_definition
Obligatoire
|
La définition de l’environnement pour une expérience inclut PythonSection, DockerSection et les variables d’environnement. Toute option d’environnement qui n’est pas directement exposée par le biais d’autres paramètres à la construction de l’estimateur peut être définie à l’aide du paramètre |
inputs
Obligatoire
|
Liste d’objets DataReference ou DatasetConsumptionConfig à utiliser comme entrée. |
shm_size
Obligatoire
|
Taille du bloc de mémoire partagée du conteneur Docker. Si la valeur n’est pas définie, la valeur azureml.core.environment._DEFAULT_SHM_SIZE par défaut est utilisée. |
resume_from
Obligatoire
|
Chemin d’accès aux données contenant les fichiers de point de contrôle ou de modèle à partir desquels reprendre l’expérience. |
max_run_duration_seconds
Obligatoire
|
Durée maximale autorisée pour l’exécution. Azure ML tente d’annuler automatiquement l’exécution si elle prend plus de temps que cette valeur. |
framework_version
Obligatoire
|
Version Scikit-learn à utiliser pour exécuter le code de formation.
|
source_directory
Obligatoire
|
Répertoire local contenant les fichiers de configuration de l’expérience. |
compute_target
Obligatoire
|
Cible de calcul où la formation aura lieu. Il peut s’agir d’un objet ou de la chaîne « local ». |
vm_size
Obligatoire
|
Taille de la machine virtuelle de la cible de calcul qui sera créée pour la formation. Valeurs prises en charge : toute taille de machine virtuelle Azure. |
vm_priority
Obligatoire
|
Priorité de la machine virtuelle de la cible de calcul qui sera créée pour la formation. Si elle n’est pas spécifiée, la valeur « dedicated » est utilisée. Valeurs prises en charge : « dedicated » et « lowpriority ». Prend effet uniquement quand le paramètre |
entry_script
Obligatoire
|
Chaîne représentant le chemin d’accès relatif au fichier utilisé pour commencer la formation. |
script_params
Obligatoire
|
Dictionnaire d’arguments de ligne de commande à passer à votre script de formation spécifié dans |
use_docker
Obligatoire
|
Valeur bool indiquant si l’environnement pour exécuter l’expérience doit être basé sur Docker. |
custom_docker_image
Obligatoire
|
Nom de l’image Docker à partir de laquelle l’image à utiliser pour la formation sera générée. Si la valeur n’est pas définie, une image par défaut basée sur l’UC est utilisée comme image de base. |
image_registry_details
Obligatoire
|
Détails du registre d’images Docker. |
user_managed
Obligatoire
|
Spécifie si Azure ML réutilise un environnement Python existant. La valeur false signifie qu’Azure ML créera un environnement Python en fonction de la spécification des dépendances Conda. |
conda_packages
Obligatoire
|
Liste des chaînes représentant les packages Conda à ajouter à l’environnement Python pour l’expérience. |
pip_packages
Obligatoire
|
Liste des chaînes représentant les packages pip à ajouter à l’environnement Python pour l’expérience. |
conda_dependencies_file_path
Obligatoire
|
Chaîne représentant le chemin relatif du fichier YAML des dépendances conda. Si la valeur est spécifiée, Azure ML n’installe aucun package associé à une infrastructure.
Peut être fourni en association avec le paramètre |
pip_requirements_file_path
Obligatoire
|
Chaîne représentant le chemin relatif du fichier texte des exigences pip.
Peut être fourni en association avec le paramètre |
conda_dependencies_file
Obligatoire
|
Chaîne représentant le chemin relatif du fichier YAML des dépendances conda. Si la valeur est spécifiée, Azure ML n’installe aucun package associé à une infrastructure.
Peut être fourni en association avec le paramètre |
pip_requirements_file
Obligatoire
|
Chaîne représentant le chemin relatif du fichier texte des exigences pip.
Peut être fourni en association avec le paramètre |
environment_variables
Obligatoire
|
Dictionnaire des noms et valeurs des variables d’environnement. Ces variables d’environnement sont définies sur le processus où le script utilisateur est en cours d’exécution. |
environment_definition
Obligatoire
|
La définition de l’environnement pour une expérience inclut PythonSection, DockerSection et les variables d’environnement. Toute option d’environnement qui n’est pas directement exposée par le biais d’autres paramètres à la construction de l’estimateur peut être définie à l’aide du paramètre |
inputs
Obligatoire
|
Liste des azureml.data.data_reference. Objets DataReference à utiliser comme entrée. |
shm_size
Obligatoire
|
Taille du bloc de mémoire partagée du conteneur Docker. Si la valeur n’est pas définie, la valeur azureml.core.environment._DEFAULT_SHM_SIZE par défaut est utilisée. |
resume_from
Obligatoire
|
Chemin d’accès aux données contenant les fichiers de point de contrôle ou de modèle à partir desquels reprendre l’expérience. |
max_run_duration_seconds
Obligatoire
|
Durée maximale autorisée pour l’exécution. Azure ML tente d’annuler automatiquement l’exécution si elle prend plus de temps que cette valeur. |
framework_version
Obligatoire
|
Version Scikit-learn à utiliser pour exécuter le code de formation.
|
_enable_optimized_mode
Obligatoire
|
Activez la génération d’environnement incrémentielle avec des images d’infrastructure prédéfinies pour accélérer la préparation de l’environnement. Une image d’infrastructure prédéfinie s’appuie sur des images de base processeur/GPU Par défaut Azure ML avec des dépendances de framework préinstallées. |
_disable_validation
Obligatoire
|
Désactivez la validation du script avant l’exécution de la soumission. La valeur par défaut est True. |
_show_lint_warnings
Obligatoire
|
Afficher les avertissements de linting de script. La valeur par défaut est False. |
_show_package_warnings
Obligatoire
|
Afficher les avertissements de validation de package. La valeur par défaut est False. |
Remarques
Pendant l’envoi d’un travail de formation, Azure ML exécute votre script dans un environnement Conda au sein d’un conteneur Docker. Les conteneurs SKLearn ont les dépendances suivantes installées.
Dependencies | Scikit-learn 0.20.3 | ———————- | —————– | Python | 3.6.2 | azureml-defaults | Latest | IntelMpi | 2018.3.222 | scikit-learn | 0.20.3 | numpy | 1.16.2 | miniconda | 4.5.11 | scipy | 1.2.1 | joblib | 0.13.2 | git | 2.7.4 |
Les images Docker étendent Ubuntu 16.04.
Si vous devez installer des dépendances supplémentaires, vous pouvez utiliser les paramètres pip_packages
ou conda_packages
, ou vous pouvez fournir votre fichier pip_requirements_file
ou conda_dependencies_file
. Vous pouvez également créer votre propre image et transmettre le paramètre custom_docker_image
au constructeur de l’estimateur.
Attributs
DEFAULT_VERSION
DEFAULT_VERSION = '0.20.3'
FRAMEWORK_NAME
FRAMEWORK_NAME = 'SKLearn'