automl Paket
Enthält automatisierte Machine Learning-Klassen für Azure Machine Learning SDKv2.
Zu den Hauptbereichen gehört die Verwaltung von AutoML-Aufgaben.
Klassen
ClassificationJob |
Konfiguration für AutoML-Klassifizierungsauftrag. Initialisieren Sie einen neuen AutoML-Klassifizierungstask. |
ColumnTransformer |
Spaltentransformatoreinstellungen. |
ForecastingJob |
Konfiguration für AutoML-Vorhersagetask. Initialisieren Sie einen neuen AutoML-Prognosetask. |
ForecastingSettings |
Vorhersageeinstellungen für einen AutoML-Auftrag. |
ImageClassificationJob |
Konfiguration für Den AutoML-Auftrag für die Imageklassifizierung mit mehreren Klassen. Initialisieren Sie einen neuen AutoML-Imageklassifizierungsauftrag mit mehreren Klassen. |
ImageClassificationMultilabelJob |
Konfiguration für Den AutoML-Auftrag für die Imageklassifizierung mit mehreren Bezeichnungen. Initialisieren Sie einen neuen AutoML-Imageklassifizierungsauftrag mit mehreren Bezeichnungen. |
ImageClassificationSearchSpace |
Suchen Sie den Speicherplatz nach Aufgaben der AutoML-Bildklassifizierung und der Bildklassifizierung mit mehreren Bezeichnungen. |
ImageInstanceSegmentationJob |
Konfiguration für AutoML-Imageinstanzsegmentierungsauftrag. Initialisieren Sie einen neuen AutoML Image Instance Segmentation-Auftrag. |
ImageLimitSettings |
Einschränken von Einstellungen für AutoML Image Verticals. ImageLimitSettings ist eine Klasse, die die folgenden Parameter enthält: max_concurrent_trials, max_trials und timeout_minutes. Dies ist eine optionale Konfigurationsmethode zum Konfigurieren von Grenzwerten für Parameter wie Timeouts usw. Hinweis Die Anzahl der gleichzeitigen Läufe wird durch die im angegebenen Computeziel verfügbaren Ressourcen beschränkt. Stellen Sie sicher, dass das Computeziel die verfügbaren Ressourcen für die gewünschte Parallelität aufweist. Tipp Es empfiehlt sich, max_concurrent_trials Anzahl mit der Anzahl der Knoten im Cluster abzugleichen. Wenn Sie beispielsweise über einen Cluster mit vier Knoten verfügen, legen Sie max_concurrent_trials auf 4 fest. Beispielsyntax Konfiguration von ImageLimitSettings
Initialisieren Sie ein ImageLimitSettings-Objekt. Konstruktor für ImageLimitSettings für AutoML Image Verticals. |
ImageModelSettingsClassification |
Modelleinstellungen für AutoML-Bildklassifizierungsaufgaben. |
ImageModelSettingsObjectDetection |
Modelleinstellungen für autoML Image Object Detection Task. |
ImageObjectDetectionJob |
Konfiguration für den AutoML-Imageobjekterkennungsauftrag. Initialisieren Sie einen neuen AutoML Image Object Detection-Auftrag. |
ImageObjectDetectionSearchSpace |
Suchen Sie den Speicherplatz für Die AutoML-Bildobjekterkennung und die Segmentierung von Bildinstanzen. |
ImageSweepSettings |
Sweepeinstellungen für alle AutoML Image Verticals. |
NlpFeaturizationSettings |
Featurisierungseinstellungen für alle AutoML-NLP-Vertikalen. |
NlpFixedParameters |
Objekt, um feste Parameter für NLP-Aufträge zu beherbergen. |
NlpLimitSettings |
Einschränken der Einstellungen für alle AutoML-NLP-Vertikalen. |
NlpSearchSpace |
Suchen Sie nach AutoML NLP-Aufgaben. |
NlpSweepSettings |
Sweepeinstellungen für alle AutoML-NLP-Aufgaben. |
RegressionJob |
Konfiguration für AutoML-Regressionsauftrag. Initialisieren Sie einen neuen AutoML-Regressionstask. |
SearchSpace |
SearchSpace-Klasse für AutoML-Vertikals. |
StackEnsembleSettings |
Erweiterte Einstellung zum Anpassen der StackEnsemble-Ausführung. |
TabularFeaturizationSettings |
Featurisierungseinstellungen für einen AutoML-Auftrag. |
TabularLimitSettings |
Einschränken der Einstellungen für eine AutoML-Tabellen verticals. |
TextClassificationJob |
Konfiguration für AutoML-Textklassifizierungsauftrag. Initialisiert einen neuen AutoML-Textklassifizierungstask. |
TextClassificationMultilabelJob |
Konfiguration für AutoML-Textklassifizierungsauftrag mit mehreren Bezeichnungen. Initialisiert einen neuen AutoML-Textklassifizierungs-Multilabel-Task. |
TextNerJob |
Konfiguration für AutoML-Text-NER-Auftrag. Initialisiert einen neuen AutoML-Text-NER-Task. |
TrainingSettings |
TrainingSettings-Klasse für Azure Machine Learning. TrainingSettings-Klasse für Azure Machine Learning. |
Enumerationen
BlockedTransformers |
Enumeration für alle klassifizierungsmodelle, die von AutoML unterstützt werden. |
ClassificationModels |
Enumeration für alle klassifizierungsmodelle, die von AutoML unterstützt werden. |
ClassificationMultilabelPrimaryMetrics |
Primäre Metriken für Klassifizierungsaufgaben mit mehreren Bezeichnungen. |
ClassificationPrimaryMetrics |
Primäre Metriken für Klassifizierungsaufgaben. |
FeaturizationMode |
Featurisierungsmodus: Bestimmt den Datenfeaturisierungsmodus. |
ForecastHorizonMode |
Aufzählung, um den Auswahlmodus für den Vorhersagehorizont zu bestimmen. |
ForecastingModels |
Enumeration für alle Vorhersagemodelle, die von AutoML unterstützt werden. |
ForecastingPrimaryMetrics |
Primäre Metriken für den Vorhersagetask. |
InstanceSegmentationPrimaryMetrics |
Primäre Metriken für InstanceSegmentation-Aufgaben. |
LearningRateScheduler |
Aufzählung der Lernratenplanung. |
LogTrainingMetrics |
Enthält automatisierte Machine Learning-Klassen für Azure Machine Learning SDKv2. Zu den Hauptbereichen gehört die Verwaltung von AutoML-Aufgaben. |
LogValidationLoss |
Enthält automatisierte Machine Learning-Klassen für Azure Machine Learning SDKv2. Zu den Hauptbereichen gehört die Verwaltung von AutoML-Aufgaben. |
NCrossValidationsMode |
Bestimmt, wie der Wert der N-Kreuzüberprüfungen bestimmt wird. |
ObjectDetectionPrimaryMetrics |
Primäre Metriken für den Task Image ObjectDetection. |
RegressionModels |
Enumeration für alle Regressionsmodelle, die von AutoML unterstützt werden. |
RegressionPrimaryMetrics |
Primäre Metriken für regressionstask. |
SamplingAlgorithmType |
Enthält automatisierte Machine Learning-Klassen für Azure Machine Learning SDKv2. Zu den Hauptbereichen gehört die Verwaltung von AutoML-Aufgaben. |
ShortSeriesHandlingConfiguration |
Der Parameter definiert, wie kurze Zeitreihen beim automatisierten maschinellen Lernen verarbeitet werden. |
StochasticOptimizer |
Stochastischer Optimierer für Bildmodelle. |
TargetAggregationFunction |
Zielaggregatfunktion. |
TargetLagsMode |
Zielverzögerungsmodi. |
TargetRollingWindowSizeMode |
Größenmodus für rollende Fenster als Ziel. |
UseStl |
Konfigurieren Sie die STL-Aufschlüsselung der Zeitreihen-Zielspalte. |
ValidationMetricType |
Metrikberechnungsmethode, die für Validierungsmetriken in Bildaufgaben verwendet werden soll. |
Functions
classification
Funktion zum Erstellen eines Klassifizierungsauftrags.
Ein Klassifizierungsauftrag wird verwendet, um ein Modell zu trainieren, das die Klasse eines Datenbeispiels am besten vorhersagt. Mit den Trainingsdaten werden verschiedene Modelle trainiert. Das Modell mit der besten Leistung für die Validierungsdaten basierend auf der primären Metrik wird als endgültiges Modell ausgewählt.
classification(*, training_data: Input, target_column_name: str, primary_metric: str | None = None, enable_model_explainability: bool | None = None, weight_column_name: str | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, n_cross_validations: str | int | None = None, cv_split_column_names: List[str] | None = None, test_data: Input | None = None, test_data_size: float | None = None, **kwargs) -> ClassificationJob
Parameter
- training_data
- Input
Die Trainingsdaten, die im Experiment verwendet werden sollen. Sie sollte sowohl Trainingsfeatures als auch eine Bezeichnungsspalte (optional eine Spalte mit Stichprobengewichtungen) enthalten.
- target_column_name
- str
Der Name der Bezeichnungsspalte.
Dieser Parameter gilt für training_data
Parameter und validation_data
test_data
- primary_metric
Die Metrik, die vom automatisierten maschinellen Lernen für die Modellauswahl optimiert wird. Beim automatisierten maschinellen Lernen werden mehr Metriken erfasst als optimiert werden können. Weitere Informationen zur Berechnung von Metriken finden Sie unter https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.
Zulässige Werte: Genauigkeit, AUC_weighted, norm_macro_recall, average_precision_score_weighted und precision_score_weighted Standardwerte auf Genauigkeit
- enable_model_explainability
- bool
Gibt an, ob die Erläuterung des besten AutoML-Modells am Ende aller AutoML-Trainingsiterationen aktiviert werden soll. Der Standardwert ist „None“. Weitere Informationen finden Sie unter Interpretierbarkeit: Modellerklärungen beim automatisierten maschinellen Lernen.
- weight_column_name
- str
Der Name der Spalte mit Stichprobengewichtungen. Das automatisierte maschinelle Lernen unterstützt eine gewichtete Spalte als Eingabe, wodurch Zeilen in den Daten eine höhere oder niedrigere Gewichtung erhalten. Wenn die Eingabedaten aus einem pandas.DataFrame stammen, der über keine Spaltennamen verfügt, können stattdessen als ganze Zahlen ausgedrückte Spaltenindizes verwendet werden.
Dieser Parameter gilt für training_data
Parameter und validation_data
- validation_data
- Input
Die Validierungsdaten, die im Experiment verwendet werden sollen. Sie sollte sowohl Trainingsfeatures als auch eine Bezeichnungsspalte (optional eine Spalte mit Stichprobengewichtungen) enthalten.
Standardwert auf "Keine"
- validation_data_size
- float
Der Teil der Daten, der für die Validierung zurückbehalten werden soll, wenn keine Benutzervalidierungsdaten angegeben werden. Dieser Wert sollte zwischen 0,0 und 1,0 (nicht inklusiv) liegen.
Geben Sie validation_data
an, um Validierungsdaten anzugeben, andernfalls legen Sie n_cross_validations
oder validation_data_size
fest, um Validierungsdaten aus den angegebenen Trainingsdaten zu extrahieren.
Verwenden Sie für einen benutzerdefinierten Kreuzvalidierungsfold cv_split_column_names
.
Weitere Informationen finden Sie unter Konfigurieren von Datenaufteilung und Kreuzvalidierung im automatisierten maschinellen Lernen.
Standardwert auf "Keine"
Gibt an, wie viele Kreuzvalidierungen durchzuführen sind, wenn keine Benutzervalidierungsdaten angegeben sind.
Geben Sie validation_data
an, um Validierungsdaten anzugeben, andernfalls legen Sie n_cross_validations
oder validation_data_size
fest, um Validierungsdaten aus den angegebenen Trainingsdaten zu extrahieren.
Verwenden Sie für einen benutzerdefinierten Kreuzvalidierungsfold cv_split_column_names
.
Weitere Informationen finden Sie unter Konfigurieren von Datenaufteilung und Kreuzvalidierung im automatisierten maschinellen Lernen.
Standardwert auf "Keine"
Liste der Namen der Spalten mit benutzerdefinierter Kreuzvalidierungsaufteilung. Jede der CV-Aufteilungsspalten stellt eine CV-Aufteilung dar, wobei jede Zeile mit 1 für Training oder 0 für Validierung markiert ist.
Standardwert auf "Keine"
- test_data
- Input
Das Modelltestfeature, das Testdatasets oder Testdatenaufteilungen verwendet, befindet sich in der Vorschau und kann sich jederzeit ändern. Die Testdaten, die für einen Testlauf verwendet werden sollen, der nach Abschluss des Modelltrainings automatisch gestartet wird. Der Testlauf erhält Vorhersagen mithilfe des besten Modells und berechnet anhand dieser Vorhersagen entsprechende Metriken.
Wenn dieser Parameter oder der Parameter test_data_size
nicht angegeben ist, wird nach Abschluss des Modelltrainings kein Testlauf automatisch ausgeführt.
Testdaten sollten sowohl Features als auch Bezeichnungsspalten enthalten.
Wenn test_data
angegeben wird, muss der Parameter target_column_name
angegeben werden.
Standardwert auf "Keine"
- test_data_size
- float
Das Modelltestfeature, das Testdatasets oder Testdatenaufteilungen verwendet, befindet sich in der Vorschau und kann sich jederzeit ändern. Der Teil der Trainingsdaten, der für Testdaten für einen Testlauf zurückbehalten werden soll, der nach Abschluss des Modelltrainings automatisch gestartet wird. Der Testlauf erhält Vorhersagen mithilfe des besten Modelle und berechnet anhand dieser Vorhersagen entsprechende Metriken.
Dieser Wert sollte zwischen 0,0 und 1,0 (nicht inklusiv) liegen.
Wenn test_data_size
zur gleichen Zeit wie validation_data_size
angegeben wird, werden die Testdaten von training_data
getrennt, bevor die Validierungsdaten getrennt werden.
Wenn beispielsweise validation_data_size=0.1
und test_data_size=0.1
angegeben werden und die ursprünglichen Trainingsdaten 1000 Zeilen enthalten, enthalten die Testdaten 100 Zeilen, die Validierungsdaten 90 Zeilen und die Trainingsdaten 810 Zeilen.
Für regressionsbasierte Aufgaben werden zufällige Stichproben genommen. Für Klassifizierungsaufgaben werden geschichtete Stichproben genommen. Die Vorhersage unterstützt derzeit nicht die Angabe eines Testdatensatzes mit einer Aufteilung in Training und Test.
Wenn dieser Parameter oder der Parameter test_data
nicht angegeben ist, wird nach Abschluss des Modelltrainings kein Testlauf automatisch ausgeführt.
Standardwert auf "Keine"
Gibt zurück
Ein Auftragsobjekt, das zur Ausführung an eine Azure ML-Compute-Instanz übermittelt werden kann.
Rückgabetyp
forecasting
Funktion zum Erstellen eines Vorhersageauftrags.
Ein Vorhersagetask wird verwendet, um Zielwerte für einen zukünftigen Zeitraum basierend auf den Verlaufsdaten vorherzusagen. Mit den Trainingsdaten werden verschiedene Modelle trainiert. Das Modell mit der besten Leistung für die Validierungsdaten basierend auf der primären Metrik wird als endgültiges Modell ausgewählt.
forecasting(*, training_data: Input, target_column_name: str, primary_metric: str | None = None, enable_model_explainability: bool | None = None, weight_column_name: str | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, n_cross_validations: str | int | None = None, cv_split_column_names: List[str] | None = None, test_data: Input | None = None, test_data_size: float | None = None, forecasting_settings: ForecastingSettings | None = None, **kwargs) -> ForecastingJob
Parameter
- training_data
- Input
Die Trainingsdaten, die im Experiment verwendet werden sollen. Sie sollte sowohl Trainingsfeatures als auch eine Bezeichnungsspalte (optional eine Spalte mit Stichprobengewichtungen) enthalten.
- target_column_name
- str
Der Name der Bezeichnungsspalte.
Dieser Parameter gilt für training_data
Parameter und validation_data
test_data
- primary_metric
Die Metrik, die vom automatisierten maschinellen Lernen für die Modellauswahl optimiert wird. Beim automatisierten maschinellen Lernen werden mehr Metriken erfasst als optimiert werden können. Weitere Informationen zur Berechnung von Metriken finden Sie unter https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.
Zulässige Werte: r2_score, normalized_mean_absolute_error, normalized_root_mean_squared_error Standardwerte auf normalized_root_mean_squared_error
- enable_model_explainability
- bool
Gibt an, ob die Erläuterung des besten AutoML-Modells am Ende aller AutoML-Trainingsiterationen aktiviert werden soll. Der Standardwert ist „None“. Weitere Informationen finden Sie unter Interpretierbarkeit: Modellerklärungen beim automatisierten maschinellen Lernen.
- weight_column_name
- str
Der Name der Spalte mit Stichprobengewichtungen. Das automatisierte maschinelle Lernen unterstützt eine gewichtete Spalte als Eingabe, wodurch Zeilen in den Daten eine höhere oder niedrigere Gewichtung erhalten. Wenn die Eingabedaten aus einem pandas.DataFrame stammen, der über keine Spaltennamen verfügt, können stattdessen als ganze Zahlen ausgedrückte Spaltenindizes verwendet werden.
Dieser Parameter gilt für training_data
Parameter und validation_data
- validation_data
- Input
Die Validierungsdaten, die im Experiment verwendet werden sollen. Sie sollte sowohl Trainingsfeatures als auch eine Bezeichnungsspalte (optional eine Spalte mit Stichprobengewichtungen) enthalten.
Standardwert auf "Keine"
- validation_data_size
- float
Der Teil der Daten, der für die Validierung zurückbehalten werden soll, wenn keine Benutzervalidierungsdaten angegeben werden. Dieser Wert sollte zwischen 0,0 und 1,0 (nicht inklusiv) liegen.
Geben Sie validation_data
an, um Validierungsdaten anzugeben, andernfalls legen Sie n_cross_validations
oder validation_data_size
fest, um Validierungsdaten aus den angegebenen Trainingsdaten zu extrahieren.
Verwenden Sie für einen benutzerdefinierten Kreuzvalidierungsfold cv_split_column_names
.
Weitere Informationen finden Sie unter Konfigurieren von Datenaufteilung und Kreuzvalidierung im automatisierten maschinellen Lernen.
Standardwert auf "Keine"
Gibt an, wie viele Kreuzvalidierungen durchzuführen sind, wenn keine Benutzervalidierungsdaten angegeben sind.
Geben Sie validation_data
an, um Validierungsdaten anzugeben, andernfalls legen Sie n_cross_validations
oder validation_data_size
fest, um Validierungsdaten aus den angegebenen Trainingsdaten zu extrahieren.
Verwenden Sie für einen benutzerdefinierten Kreuzvalidierungsfold cv_split_column_names
.
Weitere Informationen finden Sie unter Konfigurieren von Datenaufteilung und Kreuzvalidierung im automatisierten maschinellen Lernen.
Standardwert auf "Keine"
Liste der Namen der Spalten mit benutzerdefinierter Kreuzvalidierungsaufteilung. Jede der CV-Aufteilungsspalten stellt eine CV-Aufteilung dar, wobei jede Zeile mit 1 für Training oder 0 für Validierung markiert ist.
Standardwert auf "Keine"
- test_data
- Input
Das Modelltestfeature, das Testdatasets oder Testdatenaufteilungen verwendet, befindet sich in der Vorschau und kann sich jederzeit ändern. Die Testdaten, die für einen Testlauf verwendet werden sollen, der nach Abschluss des Modelltrainings automatisch gestartet wird. Der Testlauf erhält Vorhersagen mithilfe des besten Modells und berechnet anhand dieser Vorhersagen entsprechende Metriken.
Wenn dieser Parameter oder der Parameter test_data_size
nicht angegeben ist, wird nach Abschluss des Modelltrainings kein Testlauf automatisch ausgeführt.
Testdaten sollten sowohl Features als auch Bezeichnungsspalten enthalten.
Wenn test_data
angegeben wird, muss der Parameter target_column_name
angegeben werden.
Standardwert auf "Keine"
- test_data_size
- float
Die Modelltestfunktion, die Testdatasets oder Testdatenaufteilungen verwendet, befindet sich in der Vorschau und kann sich jederzeit ändern. Der Teil der Trainingsdaten, der für Testdaten für einen Testlauf zurückbehalten werden soll, der nach Abschluss des Modelltrainings automatisch gestartet wird. Der Testlauf erhält Vorhersagen mithilfe des besten Modells und berechnet anhand dieser Vorhersagen entsprechende Metriken.
Dieser Wert sollte zwischen 0,0 und 1,0 (nicht inklusiv) liegen.
Wenn test_data_size
zur gleichen Zeit wie validation_data_size
angegeben wird, werden die Testdaten von training_data
getrennt, bevor die Validierungsdaten getrennt werden.
Wenn beispielsweise validation_data_size=0.1
und test_data_size=0.1
angegeben werden und die ursprünglichen Trainingsdaten 1000 Zeilen enthalten, enthalten die Testdaten 100 Zeilen, die Validierungsdaten 90 Zeilen und die Trainingsdaten 810 Zeilen.
Für regressionsbasierte Aufgaben werden zufällige Stichproben genommen. Für Klassifizierungsaufgaben werden geschichtete Stichproben genommen. Die Vorhersage unterstützt derzeit nicht die Angabe eines Testdatensatzes mit einer Aufteilung in Training und Test.
Wenn dieser Parameter oder der Parameter test_data
nicht angegeben ist, wird nach Abschluss des Modelltrainings kein Testlauf automatisch ausgeführt.
Standardwert auf "Keine"
- forecasting_settings
- ForecastingSettings
Die Einstellungen für den Vorhersagetask
Gibt zurück
Ein Auftragsobjekt, das zur Ausführung an eine Azure ML-Compute-Instanz übermittelt werden kann.
Rückgabetyp
image_classification
Erstellt ein -Objekt für den AutoML-Image-Multiklassenklassifizierungsauftrag.
image_classification(*, training_data: Input, target_column_name: str, primary_metric: str | ClassificationPrimaryMetrics | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, **kwargs) -> ImageClassificationJob
Parameter
- training_data
- Input
Die Trainingsdaten, die im Experiment verwendet werden sollen.
- target_column_name
- str
Der Name der Bezeichnungsspalte.
Dieser Parameter gilt für die Parameter training_data
und validation_data
.
- primary_metric
Die Metrik, die vom automatisierten maschinellen Lernen für die Modellauswahl optimiert wird. Beim automatisierten maschinellen Lernen werden mehr Metriken erfasst als optimiert werden können. Weitere Informationen zur Berechnung von Metriken finden Sie unter https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.
Zulässige Werte: Genauigkeit, AUC_weighted, norm_macro_recall, average_precision_score_weighted und precision_score_weighted Standardwerte auf Genauigkeit.
- validation_data
- Input
Die Validierungsdaten, die im Experiment verwendet werden sollen.
- validation_data_size
- float
Der Teil der Daten, der für die Validierung zurückbehalten werden soll, wenn keine Benutzervalidierungsdaten angegeben werden. Dieser Wert sollte zwischen 0,0 und 1,0 (nicht inklusiv) liegen.
Geben Sie an validation_data
, um Validierungsdaten bereitzustellen, andernfalls festgelegt validation_data_size
, um Validierungsdaten aus den angegebenen Trainingsdaten zu extrahieren.
Standardwert auf .2
- kwargs
- dict
Ein Wörterbuch mit zusätzlichen Konfigurationsparametern.
Gibt zurück
Bildklassifizierungsauftragsobjekt, das zur Ausführung an eine Azure ML-Compute-Instanz übermittelt werden kann.
Rückgabetyp
image_classification_multilabel
Erstellt ein -Objekt für den AutoML-Image-Klassifizierungsauftrag mit mehreren Bezeichnungen.
image_classification_multilabel(*, training_data: Input, target_column_name: str, primary_metric: str | ClassificationMultilabelPrimaryMetrics | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, **kwargs) -> ImageClassificationMultilabelJob
Parameter
- training_data
- Input
Die Trainingsdaten, die im Experiment verwendet werden sollen.
- target_column_name
- str
Der Name der Bezeichnungsspalte.
Dieser Parameter gilt für die Parameter training_data
und validation_data
.
- primary_metric
Die Metrik, die vom automatisierten maschinellen Lernen für die Modellauswahl optimiert wird. Beim automatisierten maschinellen Lernen werden mehr Metriken erfasst als optimiert werden können. Weitere Informationen zur Berechnung von Metriken finden Sie unter https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.
Zulässige Werte: Genauigkeit, AUC_weighted, norm_macro_recall, average_precision_score_weighted, precision_score_weighted und Iou Defaults to Iou.
- validation_data
- Input
Die Validierungsdaten, die im Experiment verwendet werden sollen.
- validation_data_size
- float
Der Teil der Daten, der für die Validierung zurückbehalten werden soll, wenn keine Benutzervalidierungsdaten angegeben werden. Dieser Wert sollte zwischen 0,0 und 1,0 (nicht inklusiv) liegen.
Geben Sie an validation_data
, um Validierungsdaten bereitzustellen, andernfalls festgelegt validation_data_size
, um Validierungsdaten aus den angegebenen Trainingsdaten zu extrahieren.
Standardwert: .2
- kwargs
- dict
Ein Wörterbuch mit zusätzlichen Konfigurationsparametern.
Gibt zurück
Image eines Auftragsobjekts mit mehreren Bezeichnungen, das zur Ausführung an eine Azure ML-Compute-Instanz übermittelt werden kann.
Rückgabetyp
image_instance_segmentation
Erstellt ein -Objekt für den AutoML Image Instance Segmentation-Auftrag.
image_instance_segmentation(*, training_data: Input, target_column_name: str, primary_metric: str | InstanceSegmentationPrimaryMetrics | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, **kwargs) -> ImageInstanceSegmentationJob
Parameter
- training_data
- Input
Die Trainingsdaten, die im Experiment verwendet werden sollen.
- target_column_name
- str
Der Name der Bezeichnungsspalte.
Dieser Parameter gilt für die Parameter training_data
und validation_data
.
- primary_metric
Die Metrik, die vom automatisierten maschinellen Lernen für die Modellauswahl optimiert wird. Beim automatisierten maschinellen Lernen werden mehr Metriken erfasst als optimiert werden können. Weitere Informationen zur Berechnung von Metriken finden Sie unter https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.
Zulässige Werte: MeanAveragePrecision Defaults to MeanAveragePrecision.
- validation_data
- Input
Die Validierungsdaten, die im Experiment verwendet werden sollen.
- validation_data_size
- float
Der Teil der Daten, der für die Validierung zurückbehalten werden soll, wenn keine Benutzervalidierungsdaten angegeben werden. Dieser Wert sollte zwischen 0,0 und 1,0 (nicht inklusiv) liegen.
Geben Sie an validation_data
, um Validierungsdaten bereitzustellen, andernfalls festgelegt validation_data_size
, um Validierungsdaten aus den angegebenen Trainingsdaten zu extrahieren.
Standardwert: .2
- kwargs
- dict
Ein Wörterbuch mit zusätzlichen Konfigurationsparametern.
Gibt zurück
Image instance Segmentierungsauftrag
Rückgabetyp
image_object_detection
Erstellt ein -Objekt für den AutoML-Auftrag zur Bildobjekterkennung.
image_object_detection(*, training_data: Input, target_column_name: str, primary_metric: str | ObjectDetectionPrimaryMetrics | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, **kwargs) -> ImageObjectDetectionJob
Parameter
- training_data
- Input
Die Trainingsdaten, die im Experiment verwendet werden sollen.
- target_column_name
- str
Der Name der Bezeichnungsspalte.
Dieser Parameter gilt für die Parameter training_data
und validation_data
.
- primary_metric
Die Metrik, die vom automatisierten maschinellen Lernen für die Modellauswahl optimiert wird. Beim automatisierten maschinellen Lernen werden mehr Metriken erfasst als optimiert werden können. Weitere Informationen zur Berechnung von Metriken finden Sie unter https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.
Zulässige Werte: MeanAveragePrecision Defaults to MeanAveragePrecision.
- validation_data
- Input
Die Validierungsdaten, die im Experiment verwendet werden sollen.
- validation_data_size
- float
Der Teil der Daten, der für die Validierung zurückbehalten werden soll, wenn keine Benutzervalidierungsdaten angegeben werden. Dieser Wert sollte zwischen 0,0 und 1,0 (nicht inklusiv) liegen.
Geben Sie an validation_data
, um Validierungsdaten bereitzustellen, andernfalls festgelegt validation_data_size
, um Validierungsdaten aus den angegebenen Trainingsdaten zu extrahieren.
Standardwert: .2
- kwargs
- dict
Ein Wörterbuch mit zusätzlichen Konfigurationsparametern.
Gibt zurück
Auftragsobjekt der Bildobjekterkennung, das zur Ausführung an eine Azure ML-Compute-Instanz übermittelt werden kann.
Rückgabetyp
regression
Funktion zum Erstellen eines Regressionsauftrags.
Ein Regressionsauftrag wird verwendet, um ein Modell zu trainieren, um fortlaufende Werte einer Zielvariable aus einem Dataset vorherzusagen. Mit den Trainingsdaten werden verschiedene Modelle trainiert. Das Modell mit der besten Leistung für die Validierungsdaten basierend auf der primären Metrik wird als endgültiges Modell ausgewählt.
regression(*, training_data: Input, target_column_name: str, primary_metric: str | None = None, enable_model_explainability: bool | None = None, weight_column_name: str | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, n_cross_validations: str | int | None = None, cv_split_column_names: List[str] | None = None, test_data: Input | None = None, test_data_size: float | None = None, **kwargs) -> RegressionJob
Parameter
- training_data
- Input
Die Trainingsdaten, die im Experiment verwendet werden sollen. Sie sollte sowohl Trainingsfeatures als auch eine Bezeichnungsspalte (optional eine Spalte mit Stichprobengewichtungen) enthalten.
- target_column_name
- str
Der Name der Bezeichnungsspalte.
Dieser Parameter gilt für die training_data
Parameter , validation_data
und test_data
- primary_metric
Die Metrik, die vom automatisierten maschinellen Lernen für die Modellauswahl optimiert wird. Beim automatisierten maschinellen Lernen werden mehr Metriken erfasst als optimiert werden können. Weitere Informationen zur Berechnung von Metriken finden Sie unter https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.
Zulässige Werte: spearman_correlation, r2_score, normalized_mean_absolute_error, normalized_root_mean_squared_error. Standardmäßig normalized_root_mean_squared_error
- enable_model_explainability
- bool
Gibt an, ob die Erläuterung des besten AutoML-Modells am Ende aller AutoML-Trainingsiterationen aktiviert werden soll. Der Standardwert ist „None“. Weitere Informationen finden Sie unter Interpretierbarkeit: Modellerklärungen beim automatisierten maschinellen Lernen.
- weight_column_name
- str
Der Name der Spalte mit Stichprobengewichtungen. Das automatisierte maschinelle Lernen unterstützt eine gewichtete Spalte als Eingabe, wodurch Zeilen in den Daten eine höhere oder niedrigere Gewichtung erhalten. Wenn die Eingabedaten aus einem pandas.DataFrame stammen, der über keine Spaltennamen verfügt, können stattdessen als ganze Zahlen ausgedrückte Spaltenindizes verwendet werden.
Dieser Parameter gilt für training_data
parameter und validation_data
- validation_data
- Input
Die Validierungsdaten, die im Experiment verwendet werden sollen. Sie sollte sowohl Trainingsfeatures als auch eine Bezeichnungsspalte (optional eine Spalte mit Stichprobengewichtungen) enthalten.
Der Standardwert ist "None".
- validation_data_size
- float
Der Teil der Daten, der für die Validierung zurückbehalten werden soll, wenn keine Benutzervalidierungsdaten angegeben werden. Dieser Wert sollte zwischen 0,0 und 1,0 (nicht inklusiv) liegen.
Geben Sie validation_data
an, um Validierungsdaten anzugeben, andernfalls legen Sie n_cross_validations
oder validation_data_size
fest, um Validierungsdaten aus den angegebenen Trainingsdaten zu extrahieren.
Verwenden Sie für einen benutzerdefinierten Kreuzvalidierungsfold cv_split_column_names
.
Weitere Informationen finden Sie unter Konfigurieren von Datenaufteilung und Kreuzvalidierung im automatisierten maschinellen Lernen.
Der Standardwert ist "None".
Gibt an, wie viele Kreuzvalidierungen durchzuführen sind, wenn keine Benutzervalidierungsdaten angegeben sind.
Geben Sie validation_data
an, um Validierungsdaten anzugeben, andernfalls legen Sie n_cross_validations
oder validation_data_size
fest, um Validierungsdaten aus den angegebenen Trainingsdaten zu extrahieren.
Verwenden Sie für einen benutzerdefinierten Kreuzvalidierungsfold cv_split_column_names
.
Weitere Informationen finden Sie unter Konfigurieren von Datenaufteilung und Kreuzvalidierung im automatisierten maschinellen Lernen.
Der Standardwert ist "None".
Liste der Namen der Spalten mit benutzerdefinierter Kreuzvalidierungsaufteilung. Jede der CV-Aufteilungsspalten stellt eine CV-Aufteilung dar, wobei jede Zeile mit 1 für Training oder 0 für Validierung markiert ist.
Der Standardwert ist "None".
- test_data
- Input
Die Modelltestfunktion, die Testdatasets oder Testdatenaufteilungen verwendet, befindet sich in der Vorschau und kann sich jederzeit ändern. Die Testdaten, die für einen Testlauf verwendet werden sollen, der nach Abschluss des Modelltrainings automatisch gestartet wird. Der Testlauf erhält Vorhersagen mithilfe des besten Modells und berechnet anhand dieser Vorhersagen entsprechende Metriken.
Wenn dieser Parameter oder der Parameter test_data_size
nicht angegeben ist, wird nach Abschluss des Modelltrainings kein Testlauf automatisch ausgeführt.
Testdaten sollten sowohl Features als auch Bezeichnungsspalten enthalten.
Wenn test_data
angegeben wird, muss der Parameter target_column_name
angegeben werden.
Der Standardwert ist "None".
- test_data_size
- float
Die Modelltestfunktion, die Testdatasets oder Testdatenaufteilungen verwendet, befindet sich in der Vorschau und kann sich jederzeit ändern. Der Teil der Trainingsdaten, der für Testdaten für einen Testlauf zurückbehalten werden soll, der nach Abschluss des Modelltrainings automatisch gestartet wird. Der Testlauf erhält Vorhersagen mithilfe des besten Modells und berechnet anhand dieser Vorhersagen entsprechende Metriken.
Dieser Wert sollte zwischen 0,0 und 1,0 (nicht inklusiv) liegen.
Wenn test_data_size
zur gleichen Zeit wie validation_data_size
angegeben wird, werden die Testdaten von training_data
getrennt, bevor die Validierungsdaten getrennt werden.
Wenn beispielsweise validation_data_size=0.1
und test_data_size=0.1
angegeben werden und die ursprünglichen Trainingsdaten 1000 Zeilen enthalten, enthalten die Testdaten 100 Zeilen, die Validierungsdaten 90 Zeilen und die Trainingsdaten 810 Zeilen.
Für regressionsbasierte Aufgaben werden zufällige Stichproben genommen. Für Klassifizierungsaufgaben werden geschichtete Stichproben genommen. Die Vorhersage unterstützt derzeit nicht die Angabe eines Testdatensatzes mit einer Aufteilung in Training und Test.
Wenn dieser Parameter oder der Parameter test_data
nicht angegeben ist, wird nach Abschluss des Modelltrainings kein Testlauf automatisch ausgeführt.
Der Standardwert ist "None".
Gibt zurück
Ein Auftragsobjekt, das zur Ausführung an eine Azure ML-Compute-Instanz übermittelt werden kann.
Rückgabetyp
text_classification
Funktion zum Erstellen eines TextClassificationJobs.
Ein Textklassifizierungsauftrag wird verwendet, um ein Modell zu trainieren, das die Klasse/Kategorie einer Textdaten vorhersagen kann. Eingabetrainingsdaten sollten eine Zielspalte enthalten, die den Text in genau eine Klasse klassifiziert.
text_classification(*, training_data: Input, target_column_name: str, validation_data: Input, primary_metric: str | None = None, log_verbosity: str | None = None, **kwargs) -> TextClassificationJob
Parameter
- training_data
- Input
Die Trainingsdaten, die im Experiment verwendet werden sollen. Sie sollte sowohl Trainingsfeatures als auch eine Zielspalte enthalten.
- target_column_name
- str
Name der Zielspalte.
- validation_data
- Input
Die Validierungsdaten, die im Experiment verwendet werden sollen. Sie sollte sowohl Trainingsfeatures als auch eine Zielspalte enthalten.
- primary_metric
- Union[str, ClassificationPrimaryMetrics]
Primäre Metrik für die Aufgabe. Zulässige Werte: Genauigkeit, AUC_weighted, precision_score_weighted
- log_verbosity
- str
Protokoll-Ausführlichkeitsebene.
- kwargs
- dict
Ein Wörterbuch mit zusätzlichen Konfigurationsparametern.
Gibt zurück
Das TextClassificationJob-Objekt.
Rückgabetyp
text_classification_multilabel
Funktion zum Erstellen eines TextClassificationMultilabelJobs.
Ein Textklassifizierungsauftrag mit mehreren Bezeichnungen wird verwendet, um ein Modell zu trainieren, das die Klassen/Kategorien einer Textdaten vorhersagen kann. Eingabetrainingsdaten sollten eine Zielspalte enthalten, die den Text in Klassen klassifiziert. Weitere Informationen zum Format von Mehrzeichendaten finden Sie unter: https://docs.microsoft.com/en-us/azure/machine-learning/how-to-auto-train-nlp-models#multi-label
text_classification_multilabel(*, training_data: Input, target_column_name: str, validation_data: Input, primary_metric: str | None = None, log_verbosity: str | None = None, **kwargs) -> TextClassificationMultilabelJob
Parameter
- training_data
- Input
Die Trainingsdaten, die im Experiment verwendet werden sollen. Sie sollte sowohl Trainingsfeatures als auch eine Zielspalte enthalten.
- target_column_name
- str
Name der Zielspalte.
- validation_data
- Input
Die Validierungsdaten, die im Experiment verwendet werden sollen. Sie sollte sowohl Trainingsfeatures als auch eine Zielspalte enthalten.
- primary_metric
- str
Primäre Metrik für die Aufgabe. Akzeptable Werte: Genauigkeit
- log_verbosity
- str
Protokoll-Ausführlichkeitsebene.
- kwargs
- dict
Ein Wörterbuch mit zusätzlichen Konfigurationsparametern.
Gibt zurück
Das TextClassificationMultilabelJob-Objekt.
Rückgabetyp
text_ner
Funktion zum Erstellen eines TextNerJobs.
Ein Textauftrag für die Erkennung von Entitäten wird verwendet, um ein Modell zu trainieren, das die benannten Entitäten im Text vorhersagen kann. Eingabetrainingsdaten sollten eine Textdatei im CoNLL-Format sein. Weitere Informationen zum Format von Text-NER-Daten finden Sie unter: https://docs.microsoft.com/en-us/azure/machine-learning/how-to-auto-train-nlp-models#named-entity-recognition-ner
text_ner(*, training_data: Input, validation_data: Input, primary_metric: str | None = None, log_verbosity: str | None = None, **kwargs) -> TextNerJob
Parameter
- training_data
- Input
Die Trainingsdaten, die im Experiment verwendet werden sollen. Sie sollte sowohl Trainingsfeatures als auch eine Zielspalte enthalten.
- validation_data
- Input
Die Validierungsdaten, die im Experiment verwendet werden sollen. Sie sollte sowohl Trainingsfeatures als auch eine Zielspalte enthalten.
- primary_metric
- str
Primäre Metrik für die Aufgabe. Akzeptable Werte: Genauigkeit
- log_verbosity
- str
Protokoll-Ausführlichkeitsebene.
- kwargs
- dict
Ein Wörterbuch mit zusätzlichen Konfigurationsparametern.
Gibt zurück
Das TextNerJob-Objekt.
Rückgabetyp
Azure SDK for Python