Trainieren eines Modells
Wichtig
Der Support für Machine Learning Studio (klassisch) endet am 31. August 2024. Es wird empfohlen, bis zu diesem Datum auf Azure Machine Learning umzustellen.
Ab dem 1. Dezember 2021 können Sie keine neuen Ressourcen in Machine Learning Studio (klassisch) mehr erstellen. Bis zum 31. August 2024 können Sie die vorhandenen Ressourcen in Machine Learning Studio (klassisch) weiterhin verwenden.
- Siehe Migrieren zu Azure Machine Learning
- Weitere Informationen zu Azure Machine Learning.
Die Dokumentation zu ML Studio (klassisch) wird nicht mehr fortgeführt und kann künftig nicht mehr aktualisiert werden.
Trainiert ein Klassifikations- oder Regressionsmodell unter Überwachung.
Kategorie: Machine Learning/Trainieren
Hinweis
Gilt für: Machine Learning Studio (klassisch)
Ähnliche Drag & Drop-Module sind im Azure Machine Learning-Designer verfügbar.
Modulübersicht
In diesem Artikel wird beschrieben, wie Sie das Modul Train Model in Machine Learning Studio (classic) verwenden, um ein Klassifizierungs- oder Regressionsmodell zu trainieren. Das Training findet statt, nachdem Sie ein Modell definiert und die zugehörigen Parameter festgelegt haben. Für das Training werden markierte Daten benötigt. Darüber hinaus können Sie Train Model auch verwenden, um ein bestehendes Modell erneut anhand neuer Daten zu trainieren.
So funktioniert der Trainingsprozess
In Machine Learning ist das Erstellen und Verwenden eines Machine Learning-Modells in der Regel ein dreistufiger Prozess.
Um ein Modell zu konfigurieren, wählen Sie einen bestimmten Algorithmustyp aus und definieren dann die zugehörigen Parameter oder Hyperparameter. Wählen Sie einen der folgenden Modelltypen:
- Klassifizierungsmodelle, die auf neuronalen Netzen, Entscheidungsstrukturen, Entscheidungsgestrukturen und anderen Algorithmen basieren.
- Regressionsmodelle, die standardmäßige lineare Regression umfassen können oder andere Algorithmen verwenden, einschließlich neuronaler Netze und baysischer Regression.
Geben Sie ein Dataset an, das mit einer Bezeichnung versehen wurde und über Daten verfügt, die mit dem Algorithmus kompatibel sind. Verbinden Sie sowohl die Daten als auch das Modell mit Train Model.
Das Training erzeugt ein bestimmtes Binärformat, das iLearner, das die statistischen Muster kapselt, die aus den Daten gelernt wurden. Sie können dieses Format nicht direkt ändern oder lesen. Allerdings können andere Module in Studio (klassisch) dieses trainierte Modell verwenden.
Darüber hinaus können Sie die Eigenschaften des Modells anzeigen. Weitere Informationen finden Sie im Abschnitt Ergebnisse .
Nach Abschluss des Trainings verwenden Sie das trainierte Modell mit einem der Bewertungsmodule, um Vorhersagen für neue Daten zu treffen.
Hinweis
Andere spezialisierte Machine Learning-Aufgaben erfordern unterschiedliche Trainingsmethoden, und Studio (klassisch) stellt separate Trainingsmodule für sie zur Verfügung. Beispielsweise verwenden Bilderkennung, Clustering und Anomalieaberkennung benutzerdefinierte Trainingsmethoden. Train Model ist nur für die Verwendung mit Regressions- und Klassifizierungsmodellen vorgesehen.
Überwachtes und nicht überwachtes Training
Möglicherweise haben Sie die Begriffe überwachtes odernicht überwachtes Lernen gehört . Das Trainieren eines Klassifizierungs- oder Regressionsmodells mit Train Model ist ein klassisches Beispiel für überwachtes maschinelles Lernen. Das bedeutet, dass Sie ein Dataset bereitstellen müssen, das Verlaufsdaten enthält, aus denen Muster gelernt werden können. Die Daten sollten sowohl das Ergebnis (Bezeichnung), das Sie vorhersagen möchten, als auch verwandte Faktoren (Variablen) enthalten. Das Machine Learning-Modell benötigt die Ergebnisse, um die Features zu bestimmen, die die Ergebnisse am besten vorhersagen.
Während des Trainingsprozesses werden die Daten nach Ergebnissen sortiert, und der Algorithmus extrahiert statistische Muster, um das Modell zu erstellen.
Das unbeaufsichtigte Lernen gibt entweder an, dass das Ergebnis unbekannt ist, oder Sie entscheiden sich dafür, keine bekannten Bezeichnungen zu verwenden. Clusteringalgorithmen verwenden z. B. in der Regel nicht überwachte Lernmethoden, können jedoch Bezeichnungen verwenden, falls verfügbar. Ein weiteres Beispiel ist die Themenmodellierung mit LDA. Sie können Train Model nicht mit diesen Algorithmen verwenden.
Tipp
Haben Sie noch keine Erfahrung mit maschinellem Lernen? In diesem Tutorial erfahren Sie Schritt für Schritt, wie Sie Daten abrufen, einen Algorithmus konfigurieren, trainieren und dann ein Modell verwenden: Erstellen Ihres ersten Machine Learning-Experiments
Verwenden von Train Model
Konfigurieren Machine Learning In Machine Learning Studio (klassisch) ein Klassifizierungsmodell oderRegressionsmodellmodelle.
Sie können auch ein benutzerdefiniertes Modell trainieren, das mithilfe von R-Modell erstellen erstellt wurde.
Fügen Sie dem Experiment das Modul Train Model hinzu. Sie finden dieses Modul unter der Kategorie Machine Learning. Erweitern Sie Train (Trainieren), und ziehen Sie das Modul Train Model dann in Ihr Experiment.
Fügen Sie den untrainierten Modus an die linke Eingabe an. Fügen Sie das Trainingsdataset an die rechte Eingabe von Train Model an.
Das Trainingsdataset muss eine Bezeichnungsspalte enthalten. Zeilen ohne Bezeichnung werden ignoriert.
Klicken Sie für Label column (Bezeichnungsspalte) auf Launch column selector (Spaltenauswahl starten), und wählen Sie eine einzelne Spalte mit Ergebnissen aus, die vom Modell zu Trainingszwecken verwendet werden können.
Bei Klassifizierungsproblemen muss die Bezeichnungsspalte entweder kategorische oder diskrete Werte enthalten. Einige Beispiele sind: Ja/keine Bewertung, ein Code oder ein Name zur Klassifizierung von Krankheiten oder eine Gehaltsgruppe. Wenn Sie eine Spalte mit nicht kategorischen Werten auswählen, gibt das Modul während des Trainings einen Fehler zurück.
Bei Regressionsproblemen muss die Bezeichnungsspalte numerische Daten enthalten, die die Antwortvariable darstellen. Im Idealfall stellen die numerischen Daten eine fortlaufende Skala dar.
Beispiele sind: eine Kreditrisikobewertung, die prognostizierte Zeit bis zum Ausfall einer Festplatte oder die vorausgesagte Anzahl von Call-Center-Anrufen an einem bestimmten Tag oder zu einer bestimmten Uhrzeit. Wenn Sie keine numerische Spalte auswählen, kann dies zu einem Fehler führen.
- Wenn Sie nicht angeben, welche Bezeichnungsspalte verwendet werden soll, versucht Machine Learning, die entsprechende Bezeichnungsspalte mithilfe der Metadaten des Datasets daraus zu schließen. Wenn die falsche Spalte ausgewählt wird, korrigieren Sie dies mithilfe der Spaltenauswahl.
Tipp
Tipps zur richtigen Verwendung der Spaltenauswahl finden Sie im Artikel zum Auswählen von Spalten im Dataset. Dort werden einige häufige Szenarien beschrieben, und Sie erhalten Tipps zur Verwendung der Optionen WITH RULES und BY NAME.
Führen Sie das Experiment aus. Wenn Sie über eine große Datenmenge verfügen, kann dies eine Weile dauern.
Ergebnisse
Nachdem das Modell trainiert wurde:
Um Modellparameter und Featuregewichtungen anzuzeigen, klicken Sie mit der rechten Maustaste auf die Ausgabe, und wählen Sie Visualize (Visualisieren) aus.
Um das Modell in weiteren Experimenten zu verwenden, klicken Sie mit der rechten Maustaste auf das Modell, und wählen Sie Save Model (Modell speichern) aus. Geben Sie einen Namen für das Modell ein.
Dadurch wird das Modell als Momentaufnahme gespeichert, die durch wiederholte Ausführungen des Experiments aber nicht aktualisiert wird.
Um das Modell zur Vorhersage neuer Werte zu verwenden, verbinden Sie es mit dem Modul Score Model (Modell bewerten) sowie mit neuen Eingabedaten.
Zugehörige Aufgaben
Wenn Sie einen Modelltyp trainieren müssen, der nicht von Train Model unterstützt wird, gibt es mehrere Optionen:
Erstellen Sie eine benutzerdefinierte Bewertungsmethode mithilfe eines R-Skripts, oder verwenden Sie eines der vielen verfügbaren R-Bewertungspakete.
Schreiben Sie Ihr eigenes Python-Skript, um ein Modell zu trainieren und zu bewertung, oder verwenden Sie eine vorhandene Python-Bibliothek:
Anomalieerkennungsmodelle
- Train Anomaly Detection Model unterstützt die Anomalieerkennungsmodule in Studio (klassisch).
Empfehlungsmodelle
Wenn Ihr Modell die in diesem Artikel bereitgestellte Matchbox-Empfehlung Machine Learning, verwenden Sie das Modul Train Matchbox Recommender.
Wenn Sie einen anderen Algorithmus für die Warenkorbanalyse oder -empfehlung verwenden, verwenden Sie dessen Trainingsmethoden in R-Skripts oder Python-Skripts.
Clustermodelle
Verwenden Sie Train Clustering Model für den enthaltenen K-Means-Algorithmus.
Verwenden Sie für andere Clusteringmodelle R-Skript- oder Python-Skriptmodule , um die Modelle zu konfigurieren und zu trainieren.
Beispiele
Beispiele für die Verwendung des Moduls Train Model in Machine Learning-Experimenten finden Sie in den folgenden Experimenten im Azure KI-Katalog:
- Einzelhandelsprognose: Veranschaulicht das Erstellen, Trainieren und Vergleichen mehrerer Modelle.
- Vorhersage von Flugverspätungen: Veranschaulicht, wie mehrere zugehörige Klassifizierungsmodelle trainiert werden.
Erwartete Eingaben
Name | Type | BESCHREIBUNG |
---|---|---|
Untrainiertes Modell | ILearner-Schnittstelle | Untrainierter Lerner |
Dataset | Datentabelle | Trainingsdaten |
Modulparameter
Name | Range | type | Standard | Beschreibung |
---|---|---|---|---|
Bezeichnungsspalte | any | ColumnSelection | Auswählen der Spalte, die die Bezeichnung enthält, oder der Ergebnisspalte |
Ausgaben
Name | Type | BESCHREIBUNG |
---|---|---|
Trainiertes Modell | ILearner-Schnittstelle | Trainiertes Lernmodul |
Ausnahmen
Eine Liste aller Modulfehler finden Sie unter Modulfehlercodes.
Ausnahme | Beschreibung |
---|---|
Fehler 0032 | Eine Ausnahme tritt auf, wenn das Argument keine Zahl ist. |
Fehler 0033 | Eine Ausnahme tritt auf, wenn das Argument „Infinity“ (Unendlich) ist. |
Fehler 0083 | Eine Ausnahme tritt auf, wenn das für das Training verwendete Dataset nicht für einen konkreten Learnertyp verwendet werden kann. |
Fehler 0035 | Eine Ausnahme tritt auf, wenn für einen bestimmten Benutzer oder ein bestimmtes Element keine Features bereitgestellt wurden. |
Fehler 0003 | Eine Ausnahme tritt auf, wenn mindestens eine Eingabe NULL oder leer ist. |
Fehler 0020 | Eine Ausnahme tritt auf, wenn die Anzahl der Spalten in einigen der an das Modul übergebenen Datasets zu klein ist. |
Fehler 0021 | Eine Ausnahme tritt auf, wenn die Anzahl der Zeilen in einigen der an das Modul übergebenen Datasets zu klein ist. |
Fehler 0013 | Die Ausnahme tritt auf, wenn das an das Modul übergebene Lernmodul einen ungültigen Typ hat. |