Machine Learning-Module in ML Studio-Modulen (klassisch)
Wichtig
Der Support für Machine Learning Studio (klassisch) endet am 31. August 2024. Es wird empfohlen, bis zu diesem Datum auf Azure Machine Learning umzustellen.
Ab dem 1. Dezember 2021 können Sie keine neuen Ressourcen in Machine Learning Studio (klassisch) mehr erstellen. Bis zum 31. August 2024 können Sie die vorhandenen Ressourcen in Machine Learning Studio (klassisch) weiterhin verwenden.
- Siehe Migrieren zu Azure Machine Learning
- Weitere Informationen zu Azure Machine Learning.
Die Dokumentation zu ML Studio (klassisch) wird nicht mehr fortgeführt und kann künftig nicht mehr aktualisiert werden.
Der typische Workflow für Machine Learning umfasst viele Phasen:
Identifizieren eines zu lösenden Problems und einer Metrik zum Messen von Ergebnissen.
Suchen, Bereinigen und Vorbereiten geeigneter Daten.
Identifizieren der besten Features und Entwicklung neuer Features.
Erstellen, Auswerten und Optimieren von Modellen.
Verwenden von Modellen zum Generieren von Vorhersagen, Empfehlungen und anderen Ergebnissen.
Die Module in diesem Abschnitt enthalten Tools für die letzten Phasen des maschinellen Lernens, in denen Sie einen Algorithmus auf Daten anwenden, um ein Modell zu trainieren. In diesen letzten Phasen generieren Sie auch Bewertungen und werten dann die Genauigkeit und Nützlichkeit des Modells aus.
Hinweis
Gilt für: Machine Learning Studio (klassisch)
Ähnliche Drag & Drop-Module sind im Azure Machine Learning-Designer verfügbar.
Liste der Machine Learning-Aufgaben nach Kategorie
-
Wählen Sie aus einer Vielzahl anpassbarer Machine Learning-Algorithmen, einschließlich Clustering- und Regressions-, Klassifizierungs- und Anomalieerkennungsmodellen.
-
Stellen Sie Ihre Daten für das konfigurierte Modell zur Verfügung, um aus Mustern zu lernen und Statistiken zu erstellen, die für Vorhersagen verwendet werden können.
-
Erstellen Sie Vorhersagen mithilfe der trainierten Modelle.
-
Messen Sie die Genauigkeit eines trainierten Modells, oder vergleichen Sie mehrere Modelle.
Eine ausführliche Beschreibung dieses experimentellen Workflows finden Sie in der exemplarischen Vorgehensweise zur Kreditrisikolösung.
Voraussetzungen
Bevor Sie mit der Erstellung eines Modells ins Spiel kommen, ist in der Regel eine große Vorbereitung erforderlich. Dieser Abschnitt enthält Links zu Tools in Machine Learning Studio (klassisch), mit denen Sie Ihre Daten bereinigt, die Qualität der Eingabe verbessern und Laufzeitfehler verhindern können.
Datenerkundung und Datenqualität
Stellen Sie sicher, dass Ihre Daten die richtige Art von Daten, die richtige Menge und die richtige Qualität für den gewählten Algorithmus sind. Erfahren Sie, wie viele Daten Sie haben und wie sie verteilt werden. Gibt es Ausreißer? Wie wurden diese generiert, und was bedeuten sie? Sind doppelte Datensätze vorhanden?
Behandeln fehlender Werte
Fehlende Werte können sich in vielerlei Hinsicht auf Ihre Ergebnisse auswirken. So verwerfen beispielsweise fast alle statistischen Methoden Fälle, bei denen Werte fehlen. Standardmäßig folgt Machine Learning folgenden Regeln, wenn Zeilen mit fehlenden Werten auftreten:
Werden zum Trainieren eines Modells Daten mit fehlenden Werten verwendet, werden alle Zeilen mit fehlenden Werten übersprungen.
Wenn daten, die bei der Bewertung für ein Modell als Eingabe verwendet werden, Werte fehlen, werden die fehlenden Werte als Eingaben verwendet, aber NULL-Werte werden propagiert. Dies bedeutet in der Regel, dass anstelle einer gültigen Vorhersage ein NULL-Wert in die Ergebnisse eingefügt wird.
Überprüfen Sie ihre Daten, bevor Sie Ihr Modell trainieren. Verwenden Sie dieses Modul, um die fehlenden Werte imputiert oder Ihre Daten zu korrigieren:
Auswählen von Features und Reduzieren der Dimensionalität
Machine Learning Studio (klassisch) kann Ihnen helfen, Ihre Daten zu durchsinden, um die nützlichsten Attribute zu finden.
Verwenden Sie Tools wie Fisher Linear Discriminant Analysis oder Filter Based Feature Selection , um zu bestimmen, welche Datenspalten die prädiktivste Leistung haben. Diese Tools können auch Spalten identifizieren, die aufgrund von Datenlecks entfernt werden sollten.
Erstellen oder entwickeln Sie Features anhand vorhandener Daten. Normalisieren Sie Daten oder gruppieren Sie Daten in Behälter, um neue Gruppierungen von Daten zu erstellen, oder standardisieren Sie den Bereich numerischer Werte vor der Analyse.
Reduzieren Sie die Dimensionalität durch Gruppieren kategorischer Werte, mithilfe der Prinzipalkomponentenanalyseoder durch Sampling.
Beispiele
Beispiele für machine learning in Aktion finden Sie im Azure KI-Katalog.
Tipps und eine exemplarische Vorgehensweise für einige typische Datenvorverarbeitungsaufgaben finden Sie unter Exemplarische Vorgehensweisen zum Ausführen des Team Data Science-Prozesses.