ML Studio -Modulbeschreibungen (klassisch)
Wichtig
Der Support für Machine Learning Studio (klassisch) endet am 31. August 2024. Es wird empfohlen, bis zu diesem Datum auf Azure Machine Learning umzustellen.
Ab dem 1. Dezember 2021 können Sie keine neuen Ressourcen in Machine Learning Studio (klassisch) mehr erstellen. Bis zum 31. August 2024 können Sie die vorhandenen Ressourcen in Machine Learning Studio (klassisch) weiterhin verwenden.
- Siehe Migrieren zu Azure Machine Learning
- Weitere Informationen zu Azure Machine Learning.
Die Dokumentation zu ML Studio (klassisch) wird nicht mehr fortgeführt und kann künftig nicht mehr aktualisiert werden.
Dieses Thema bietet eine Übersicht über alle Module in Machine Learning Studio (klassisch), einem interaktiven, visuellen Arbeitsbereich zum einfachen Erstellen und Testen von Vorhersagemodellen.
Hinweis
Gilt für: Machine Learning Studio (klassisch)
Ähnliche Drag & Drop-Module sind im Azure Machine Learning-Designer verfügbar.
Was ist ein Modul?
In Machine Learning Studio (klassisch) ist ein Modul ein Baustein zum Erstellen von Experimenten. Jedes Modul kapselt einen bestimmten Machine Learning-Algorithmus, eine funktion oder eine Codebibliothek, die auf Daten in Ihrem Arbeitsbereich agieren kann. Die Module sind so konzipiert, dass verbindungen von anderen Modulen akzeptiert werden, um Daten gemeinsam zu verwenden und zu ändern.
Der Code, der in jedem Modul ausgeführt wird, stammt aus vielen Quellen. Dazu gehören Open Source Bibliotheken und Sprachen, von Microsoft Research entwickelte Algorithmen und Tools für die Arbeit mit Azure und anderen Clouddiensten.
Tipp
Suchen Sie nach Algorithmen für maschinelles Lernen? Weitere Informationen finden Machine Learning Kategorie , die Module für Entscheidungsstrukturen, Clustering, neuronale Netze und andere enthält. Die Kategorien Trainierenund Auswerten enthalten Module zum Trainieren und Testen Ihrer Modelle.
Durch Verbinden und Konfigurieren von Modulen können Sie einen Workflow erstellen, der Daten aus externen Quellen liest, für die Analyse vorbereitet, Machine Learning-Algorithmen verwendet und Ergebnisse generiert.
Wenn ein Experiment in Machine Learning Studio (klassisch) geöffnet ist, wird links im Navigationsbereich die vollständige Liste der aktuellen Module angezeigt. Sie ziehen diese Bausteine in Ihr Experiment und verbinden sie dann, um einen vollständigen Machine Learning-Workflow zu erstellen, der als Experiment bezeichnet wird.
Manchmal werden Module aktualisiert, um neue Funktionen hinzuzufügen oder älteren Code zu entfernen. In diesem Fall werden alle von Ihnen erstellten Experimente, die das Modul verwenden, weiterhin ausgeführt. Aber wenn Sie das Experiment das nächste Mal öffnen, werden Sie aufgefordert, das Modul zu aktualisieren oder ein anderes Modul zu verwenden.
Beispiele
Ein Beispiel zum Erstellen eines vollständigen Machine Learning-Experiments finden Sie in den folgenden Tutorials:
Modulkategorien
Um die Suche nach verwandten Modulen zu vereinfachen, werden die Machine Learning-Tools in Machine Learning Studio (klassisch) nach diesen Kategorien unterteilt.
Datenformatkonvertierungen
Verwenden Sie diese Module zum Konvertieren von Daten in eins der Formate, die von anderen Machine Learning-Tools oder -Formaten verwendet werden.
-
Verwenden Sie diese Module, um Daten und Modelle aus Clouddatenquellen zu lesen, einschließlich Hadoop-Clustern, Azure Table Storage und Web-URLs. Sie können diese Module auch verwenden, um Ergebnisse in den Speicher oder in eine Datenbank zu schreiben.
-
Verwenden Sie diese Module zum Vorbereiten von Daten für die Analyse. Sie können Datentypen ändern, Spalten als Features oder Bezeichnungen kennzeichnen, Features generieren und Daten skalieren oder normalisieren.
-
Transformieren numerischer Daten, die aus der Digitalen Signalverarbeitung abgeleitet wurden.
-
Verwenden Sie gemeinsame Wahrscheinlichkeitsverteilungen, um Features zu erstellen, die große Datasets kompakt beschreiben.
-
Diese Gruppe bietet eine Vielzahl von Tools für Data Science. Beispielsweise können Sie fehlende Werte entfernen oder ersetzen, eine Teilmenge von Spalten auswählen, eine Spalte hinzufügen oder zwei Datasets verketten.
-
Dividieren Sie ein Dataset nach Kriterien oder Größe, um Trainings- und Testsätze zu erstellen oder bestimmte Zeilen zu isolieren.
-
Transformieren numerischer Daten.
Featureauswahl
Verwenden Sie diese Module, um die besten Merkmale in Ihren Daten mithilfe von gut erforschten statistischen Methoden zu identifizieren.
Machine Learning
Diese Gruppe enthält die meisten machine learning-Algorithmen, die von der Machine Learning.
Es enthält auch Module, die die Algorithmen unterstützen sollen, indem Modelle trainiert, Bewertungen generiert und die Modellleistung bewertet wird.
-
Nachdem Sie ein Modell trainiert haben, verwenden Sie diese Tools, um die Genauigkeit des Modells zu messen.
-
Diese Module stellen die Machine Learning-Algorithmen zur Verfügung, die Sie anpassen können, indem Sie Parameter festlegen. Die Algorithmen in diesem Abschnitt sind nach Typ gruppiert:
-
Verwenden Sie diese Module, um neue Daten über den Algorithmus zu übergeben und einen Satz von Ergebnissen für die Auswertung zu generieren. Sie können die Ergebnisse der Bewertung auch als Teil eines Vorhersagediensts verwenden.
-
Diese Module trainieren ein initialisiertes Machine Learning-Modell mit daten, die Sie bereitstellen.
OpenCV-Bibliotheksmodule
Diese Module bieten Ihnen einfachen Zugriff auf eine beliebte Open Source-Bibliothek für die Bildverarbeitung und Bildklassifikation.
R Language Modules
Verwenden Sie diese Modulen, um Ihrem Experiment benutzerdefinierten R-Code hinzuzufügen oder um ein Machine Learning-Modell auf Grundlage eines R-Pakets zu implementieren.
Python-Sprachmodule
Verwenden Sie diese Module, um Ihrem Experiment benutzerdefinierten Python-Code hinzuzufügen.
Statistische Funktionen
Verwenden Sie diese Module zum Berechnen von Wahrscheinlichkeitsverteilungen, zum Erstellen benutzerdefinierter Berechnungen sowie zum Ausführen einer Vielzahl unterschiedlicher sonstiger Aufgaben im Zusammenhang mit numerischen Variablen.
Textanalyse
Verwenden Sie diese Module, um Featurehashing und Erkennung benannter Entitäten durchzuführen oder Text mithilfe von Tools zur Verarbeitung natürlicher Sprache vorverarbeitet zu haben.
Zeitreihe
Verwenden Sie diese Module, um Anomalien in Trends zu bewerten, indem Sie Algorithmen verwenden, die speziell für Zeitreihendaten entwickelt wurden.
Zugehörige Aufgaben
Machine Learning Studio-Module (klassisch) versuchen nicht, Datenintegrationstools zu duplizieren, die in anderen Tools unterstützt werden, z. B. Azure Data Factory. Stattdessen bieten die Module Funktionen, die für maschinelles Lernen spezifisch sind:
- Normalisierung, Gruppierung und Skalierung von Daten
- Berechnen der statistischen Verteilung von Daten
- Konvertierung in andere Machine Learning-Formate
- Importieren von Daten, die für Machine Learning-Experimente und den Export von Ergebnissen verwendet werden
- Textanalyse, Featureauswahl und Verringerung der Dimensionalität
Wenn Sie komplexere Einrichtungen für die Datenbearbeitung und -speicherung benötigen, lesen Sie Folgendes:
- Azure Data Factory: Enterprise bereite Clouddatenverarbeitungspipelines.
- Azure SQL-Datenbank: Skalierbarer Speicher mit integriertem Zugriff auf Machine Learning.
- CosmosDB: NoSQL-Datenspeicher; Daten in Machine Learning Studio (klassisch) importieren.
- Azure Data Lake Analytics: Verteilte Analysen für Big Data.
- Stream Analytics: Ereignisverarbeitung für Internet der Dinge.
- Azure Textanalyse: Mehrere Optionen für die Textverarbeitung und verwandte Cognitive Services sprach-, bild- und gesichtserkennung.
- Azure Databricks: Spark-basierte Analyseplattform.