Datentransformation – Skalieren und Reduzieren
Wichtig
Der Support für Machine Learning Studio (klassisch) endet am 31. August 2024. Es wird empfohlen, bis zu diesem Datum auf Azure Machine Learning umzustellen.
Ab dem 1. Dezember 2021 können Sie keine neuen Ressourcen in Machine Learning Studio (klassisch) mehr erstellen. Bis zum 31. August 2024 können Sie die vorhandenen Ressourcen in Machine Learning Studio (klassisch) weiterhin verwenden.
- Siehe Migrieren zu Azure Machine Learning
- Weitere Informationen zu Azure Machine Learning.
Die Dokumentation zu ML Studio (klassisch) wird nicht mehr fortgeführt und kann künftig nicht mehr aktualisiert werden.
In diesem Artikel werden die Module in Machine Learning Studio (klassisch) beschrieben, mit denen Sie mit numerischen Daten arbeiten können. Für maschinelles Lernen umfassen allgemeine Datenaufgaben Clipping, Binning und Normalisierung numerischer Werte. Andere Module unterstützen die Verringerung der Dimensionalität.
Hinweis
Gilt nur für: Machine Learning Studio (klassisch)
Ähnliche Drag & Drop-Module sind im Azure Machine Learning-Designer verfügbar.
Modellieren numerischer Daten
Aufgaben wie das Normalisieren, Binnieren oder Neuverteilen numerischer Variablen sind ein wichtiger Bestandteil der Datenvorbereitung für maschinelles Lernen. Die Module in dieser Gruppe unterstützen die folgenden Datenvorbereitungsaufgaben:
- Gruppieren von Daten in Containern mit unterschiedlichen Größen oder Verteilungen.
- Entfernen von Ausreißern oder Ändern ihrer Werte.
- Normalisieren eines Satzes numerischer Werte in einen bestimmten Bereich.
- Erstellen eines kompakten Satzes von Featurespalten aus einem Dataset mit hoher Dimension.
Zugehörige Aufgaben
- Auswählen relevanter und nützlicher Features für die Modellerstellung: Verwenden Sie die Module Funktionsauswahl oder Fisher Linear Discriminant Analysis .
- Features basierend auf der Anzahl der Werte auswählen: Verwenden Sie das Modul Learning with Counts.
- Fehlende Werte entfernen oder ersetzen: Verwenden Sie das Modul Clean Missing Data ( Fehlende Daten bereinigen ).
- Ersetzen sie kategorische Werte durch numerische Werte, die von Berechnungen abgeleitet werden: Verwenden Sie das Modul Replace Discrete Values (Diskrete Werte ersetzen ).
- Berechnen einer Wahrscheinlichkeitsverteilung für diskrete oder numerische Spalten: Verwenden Sie das Modul Evaluate Probability Function .
- Filtern und Transformieren digitaler Signale und Wellenformen: Verwenden Sie das Filter-Modul .
Liste der Module
Diese Kategorie "Datentransformation – Skalierung und Reduzierung" umfasst die folgenden Module:
- Ausschneidewerte: Erkennt Ausreißer und clipt oder ersetzt dann deren Werte.
- Gruppieren von Daten in Containern: Fügt numerische Daten in Container ein.
- Normalize Data (Daten normalisieren): Skaliert numerische Daten neu, um Datasetwerte auf einen Standardbereich zu beschränken.
- Prinzipalkomponentenanalyse: Berechnet eine Reihe von Features mit reduzierter Dimensionalität für effizienteres Lernen.