SKLearn Klasse
Erstellt einen Schätzer für das Training in Scikit-learn-Experimenten.
VERALTET. Verwenden Sie das ScriptRunConfig-Objekt mit Ihrer eigenen definierten Umgebung oder die zusammengestellte Umgebung AzureML-Tutorial. Eine Einführung in die Konfiguration von SKLearn-Experimentausführungen mit ScriptRunConfig finden Sie unter Trainieren von Scikit-learn-Modellen im großen Stil mit Azure Machine Learning.
Dieser Schätzer unterstützt nur das CPU-Training mit einem Knoten.
Unterstützte Versionen: 0.20.3
Initialisieren Sie einen Scikit-learn-Schätzer.
- Vererbung
-
azureml.train.estimator._framework_base_estimator._FrameworkBaseEstimatorSKLearn
Konstruktor
SKLearn(source_directory, *, compute_target=None, vm_size=None, vm_priority=None, entry_script=None, script_params=None, use_docker=True, custom_docker_image=None, image_registry_details=None, user_managed=False, conda_packages=None, pip_packages=None, conda_dependencies_file_path=None, pip_requirements_file_path=None, conda_dependencies_file=None, pip_requirements_file=None, environment_variables=None, environment_definition=None, inputs=None, shm_size=None, resume_from=None, max_run_duration_seconds=None, framework_version=None, _enable_optimized_mode=False, _disable_validation=True, _show_lint_warnings=False, _show_package_warnings=False)
Parameter
Name | Beschreibung |
---|---|
source_directory
Erforderlich
|
Ein lokales Verzeichnis mit Konfigurationsdateien für Experimente. |
compute_target
Erforderlich
|
AbstractComputeTarget oder
str
Das Computeziel für das Training. Dies kann entweder ein Objekt oder die Zeichenfolge „local“ sein. |
vm_size
Erforderlich
|
Die VM-Größe des Computeziels, das für das Training erstellt wird. Unterstützte Werte: beliebige Azure-VM-Größen. |
vm_priority
Erforderlich
|
Die VM-Priorität des Computeziels, das für das Training erstellt wird. Wenn keine Angabe erfolgt, wird „dedicated“ verwendet. Unterstützte Werte: „dedicated“ und „lowpriority“. Wird nur angewandt, wenn |
entry_script
Erforderlich
|
Eine Zeichenfolge, die den relativen Pfad zu der Datei repräsentiert, die zum Starten des Trainings verwendet wird. |
script_params
Erforderlich
|
Ein Wörterbuch mit Befehlszeilenargumenten, die an das in |
custom_docker_image
Erforderlich
|
Der Name des Docker-Images, mit dem das für das Training zu verwendende Image erstellt wird. Wenn diese Einstellung nicht festgelegt ist, wird als Basisimage ein CPU-basiertes Standardimage verwendet. |
image_registry_details
Erforderlich
|
Die Details der Docker-Imageregistrierung |
user_managed
Erforderlich
|
Gibt an, ob Azure Machine Learning eine vorhandene Python-Umgebung wiederverwendet Bei einer Festlegung auf FALSE erstellt Azure Machine Learning eine Python-Umgebung basierend auf der Spezifikation der Conda-Abhängigkeiten. |
conda_packages
Erforderlich
|
Eine Liste von Zeichenfolgen, die Conda-Pakete darstellen, die der Python-Umgebung für das Experiment hinzugefügt werden sollen |
pip_packages
Erforderlich
|
Eine Liste von Zeichenfolgen, die pip-Pakete darstellen, die der Python-Umgebung für das Experiment hinzugefügt werden sollen |
conda_dependencies_file_path
Erforderlich
|
Eine Zeichenfolge, die den relativen Pfad zur YAML-Datei der Conda-Abhängigkeiten darstellt.
Falls angegeben, installiert Azure Machine Learning keine frameworkbezogenen Pakete.
Dieser kann in Kombination mit dem Parameter |
pip_requirements_file_path
Erforderlich
|
Eine Zeichenfolge, die den relativen Pfad zur Pip-Anforderungstextdatei darstellt.
Dieser kann in Kombination mit dem Parameter |
conda_dependencies_file
Erforderlich
|
Eine Zeichenfolge, die den relativen Pfad zur YAML-Datei der Conda-Abhängigkeiten darstellt.
Falls angegeben, installiert Azure Machine Learning keine frameworkbezogenen Pakete.
Dieser kann in Kombination mit dem Parameter |
pip_requirements_file
Erforderlich
|
Eine Zeichenfolge, die den relativen Pfad zur Pip-Anforderungstextdatei darstellt.
Dieser kann in Kombination mit dem Parameter |
environment_variables
Erforderlich
|
Ein Wörterbuch mit Umgebungsvariablennamen und Werten. Diese Umgebungsvariablen werden für den Prozess festgelegt, in dem das Benutzerskript ausgeführt wird. |
environment_definition
Erforderlich
|
Die Umgebungsdefinition für ein Experiment umfasst „PythonSection“, „DockerSection“ und Umgebungsvariablen. Jede Umgebungsoption, die nicht direkt über andere Parameter für die Erstellung des Schätzers verfügbar gemacht wird, kann mit dem Parameter |
inputs
Erforderlich
|
Eine Liste von DataReference- oder DatasetConsumptionConfig-Objekten, die als Eingabe verwendet werden sollen |
shm_size
Erforderlich
|
Größe des freigegebenen Speicherblocks des Docker-Containers. Wenn diese Einstellung nicht festgelegt ist, wird die Standardgröße „azureml.core.environment._DEFAULT_SHM_SIZE“ verwendet. |
resume_from
Erforderlich
|
Der Datenpfad, der die Prüfpunkt- oder Modelldateien enthält, aus denen das Experiment fortgesetzt werden soll |
max_run_duration_seconds
Erforderlich
|
Die maximal zulässige Zeit für die Ausführung Azure Machine Learning versucht, die Ausführung automatisch abzubrechen, wenn sie länger dauert als dieser Wert angibt. |
framework_version
Erforderlich
|
Die Scikit-learn-Version, die zum Ausführen von Trainingscode verwendet werden soll.
|
source_directory
Erforderlich
|
Ein lokales Verzeichnis mit Konfigurationsdateien für Experimente. |
compute_target
Erforderlich
|
AbstractComputeTarget oder
str
Das Computeziel für das Training. Dies kann entweder ein Objekt oder die Zeichenfolge „local“ sein. |
vm_size
Erforderlich
|
Die VM-Größe des Computeziels, das für das Training erstellt wird. Unterstützte Werte: beliebige Azure-VM-Größen. |
vm_priority
Erforderlich
|
Die VM-Priorität des Computeziels, das für das Training erstellt wird. Wenn keine Angabe erfolgt, wird „dedicated“ verwendet. Unterstützte Werte: „dedicated“ und „lowpriority“. Wird nur angewandt, wenn |
entry_script
Erforderlich
|
Eine Zeichenfolge, die den relativen Pfad zu der Datei repräsentiert, die zum Starten des Trainings verwendet wird. |
script_params
Erforderlich
|
Ein Wörterbuch mit Befehlszeilenargumenten, die an das in |
use_docker
Erforderlich
|
Ein Bool-Wert, der angibt, ob die Umgebung, in der das Experiment ausgeführt werden soll, Docker-basiert sein soll. |
custom_docker_image
Erforderlich
|
Der Name des Docker-Images, mit dem das für das Training zu verwendende Image erstellt wird. Wenn diese Einstellung nicht festgelegt ist, wird als Basisimage ein CPU-basiertes Standardimage verwendet. |
image_registry_details
Erforderlich
|
Die Details der Docker-Imageregistrierung |
user_managed
Erforderlich
|
Gibt an, ob Azure Machine Learning eine vorhandene Python-Umgebung wiederverwendet Bei einer Festlegung auf FALSE erstellt Azure Machine Learning eine Python-Umgebung basierend auf der Spezifikation der Conda-Abhängigkeiten. |
conda_packages
Erforderlich
|
Eine Liste von Zeichenfolgen, die Conda-Pakete darstellen, die der Python-Umgebung für das Experiment hinzugefügt werden sollen |
pip_packages
Erforderlich
|
Eine Liste von Zeichenfolgen, die pip-Pakete darstellen, die der Python-Umgebung für das Experiment hinzugefügt werden sollen |
conda_dependencies_file_path
Erforderlich
|
Eine Zeichenfolge, die den relativen Pfad zur YAML-Datei der Conda-Abhängigkeiten darstellt. Falls angegeben, installiert Azure Machine Learning keine frameworkbezogenen Pakete.
Dieser kann in Kombination mit dem Parameter |
pip_requirements_file_path
Erforderlich
|
Eine Zeichenfolge, die den relativen Pfad zur Pip-Anforderungstextdatei darstellt.
Dieser kann in Kombination mit dem Parameter |
conda_dependencies_file
Erforderlich
|
Eine Zeichenfolge, die den relativen Pfad zur YAML-Datei der Conda-Abhängigkeiten darstellt. Falls angegeben, installiert Azure Machine Learning keine frameworkbezogenen Pakete.
Dieser kann in Kombination mit dem Parameter |
pip_requirements_file
Erforderlich
|
Eine Zeichenfolge, die den relativen Pfad zur Pip-Anforderungstextdatei darstellt.
Dieser kann in Kombination mit dem Parameter |
environment_variables
Erforderlich
|
Ein Wörterbuch mit Umgebungsvariablennamen und Werten. Diese Umgebungsvariablen werden für den Prozess festgelegt, in dem das Benutzerskript ausgeführt wird. |
environment_definition
Erforderlich
|
Die Umgebungsdefinition für ein Experiment umfasst „PythonSection“, „DockerSection“ und Umgebungsvariablen. Jede Umgebungsoption, die nicht direkt über andere Parameter für die Erstellung des Schätzers verfügbar gemacht wird, kann mit dem Parameter |
inputs
Erforderlich
|
Eine Liste der azureml.data.data_reference. DataReference-Objekte, die als Eingabe verwendet werden sollen. |
shm_size
Erforderlich
|
Größe des freigegebenen Speicherblocks des Docker-Containers. Wenn diese Einstellung nicht festgelegt ist, wird die Standardgröße „azureml.core.environment._DEFAULT_SHM_SIZE“ verwendet. |
resume_from
Erforderlich
|
Der Datenpfad, der die Prüfpunkt- oder Modelldateien enthält, aus denen das Experiment fortgesetzt werden soll |
max_run_duration_seconds
Erforderlich
|
Die maximal zulässige Zeit für die Ausführung Azure Machine Learning versucht, die Ausführung automatisch abzubrechen, wenn sie länger dauert als dieser Wert angibt. |
framework_version
Erforderlich
|
Die Scikit-learn-Version, die zum Ausführen von Trainingscode verwendet werden soll.
|
_enable_optimized_mode
Erforderlich
|
Aktivieren Sie den inkrementellen Umgebungsbuild mit vordefinierten Frameworkimages für eine schnellere Umgebungsvorbereitung. Ein vordefiniertes Frameworkimage basiert auf azure ML-Standard-CPU-/GPU-Basisimages mit vorinstallierten Frameworkabhängigkeiten. |
_disable_validation
Erforderlich
|
Deaktivieren Sie die Skriptüberprüfung vor der Übermittlung. Der Standardwert ist True. |
_show_lint_warnings
Erforderlich
|
Anzeigen von Skript-Lintingwarnungen. Die Standardeinstellung lautet „false“. |
_show_package_warnings
Erforderlich
|
Paketvalidierungswarnungen anzeigen. Die Standardeinstellung lautet „false“. |
Hinweise
Beim Übermitteln eines Trainingsauftrags führt Azure Machine Learning Ihr Skript in einer Conda-Umgebung innerhalb eines Docker-Containers aus. Für SKLearn-Container werden die folgenden Abhängigkeiten installiert.
Abhängigkeiten | Scikit-learn 0.20.3 | ———————- | —————– | Python | 3.6.2 | azureml-defaults | Neueste | IntelMpi | 2018.3.222 | scikit-learn | 0.20.3 | numpy | 1.16.2 | miniconda | 4.5.11 | scipy | 1.2.1 | joblib | 0.13.2 | git | 2.7.4 |
Die Docker-Images erweitern Ubuntu 16.04.
Wenn Sie zusätzliche Abhängigkeiten installieren müssen, können Sie entweder die Parameter pip_packages
oder conda_packages
verwenden oder Ihre pip_requirements_file
- oder conda_dependencies_file
-Datei angeben. Alternativ können Sie ein eigenes Image erstellen und den Parameter custom_docker_image
an den Schätzerkonstruktor übergeben.
Attribute
DEFAULT_VERSION
DEFAULT_VERSION = '0.20.3'
FRAMEWORK_NAME
FRAMEWORK_NAME = 'SKLearn'