Freigeben über


Select Columns Transform

Wichtig

Der Support für Machine Learning Studio (klassisch) endet am 31. August 2024. Es wird empfohlen, bis zu diesem Datum auf Azure Machine Learning umzustellen.

Ab dem 1. Dezember 2021 können Sie keine neuen Ressourcen in Machine Learning Studio (klassisch) mehr erstellen. Bis zum 31. August 2024 können Sie die vorhandenen Ressourcen in Machine Learning Studio (klassisch) weiterhin verwenden.

Die Dokumentation zu ML Studio (klassisch) wird nicht mehr fortgeführt und kann künftig nicht mehr aktualisiert werden.

Erstellt eine Transformation, die die gleiche Teilmenge von Spalten wie im angegebenen Dataset auswählt.

Kategorie: Datentransformation/-bearbeitung

Hinweis

Gilt nur für: Machine Learning Studio (klassisch)

Ähnliche Drag & Drop-Module sind im Azure Machine Learning-Designer verfügbar.

In diesem Artikel wird beschrieben, wie Sie das Modul Select Columns Transform in Machine Learning Studio (klassisch) verwenden. Der Zweck des Moduls Select Columns Transform besteht darin sicherzustellen, dass in allen weiteren Machine Learning-Vorgängen immer ein vorhersagbarer, konsistenter Satz von Spalten verwendet wird.

Dieses Modul ist besonders hilfreich für Aufgaben wie die Bewertung, die bestimmte Spalten erfordern. Änderungen in den verfügbaren Spalten können das Experiment unterbrechen oder die Ergebnisse ändern.

Sie verwenden das Modul Select Columns Transform, um einen Satz von Spalten zu erstellen und zu speichern. Danach verwenden Sie das Modul Apply Transformation (Anwenden einer Transformation), um diese Auswahl auf neue Daten anzuwenden.

Verwenden von „Select Columns Transform“

In diesem Szenario wird davon ausgegangen, dass Sie die Funktionsauswahl verwenden möchten, um einen dynamischen Satz von Spalten zu generieren, die zum Trainieren eines Modells verwendet werden sollen. Um sicherzustellen, dass die Spaltenauswahl für den Bewertungsprozess identisch ist, verwenden Sie das Modul Spaltentransformation auswählen , um die Spaltenauswahl zu erfassen und an anderer Stelle im Experiment anzuwenden.

  1. Fügen Sie Ihrem Experiment in Studio (klassisch) ein Eingabedataset hinzu.

  2. Fügen Sie eine Instanz von Filter Based Feature Selection (Filterbasierte Featureauswahl) hinzu.

  3. Verbinden Sie die Module, und konfigurieren Sie das Featureauswahlmodul, damit im Eingabedataset automatisch eine Reihe von optimalen Features gefunden wird.

  4. Fügen Sie eine Instanz von Train Model (Trainieren eines Modells) hinzu, und verwenden Sie die Ausgabe von Filter Based Feature Selection als Eingabe für das Training.

    Wichtig

    Weil die Featurerelevanz basierend auf den Werten in der Spalte bestimmt wird, können Sie nicht im Voraus wissen, welche Spalten möglicherweise als Eingabe für Train Model verfügbar sind.

  5. Fügen Sie nun eine Instanz des Moduls Select Columns Transform hinzu.

    Dadurch wird eine Spaltenauswahl als Transformation generiert, die gespeichert oder auf andere Datasets angewendet werden kann. Mit diesem Schritt wird sichergestellt, dass die Spalten, die durch die Funktionsauswahl gekennzeichnet sind, gespeichert werden, damit sie von anderen Modulen wiederverwendet werden können.

  6. Fügen Sie das Modul Score Model (Bewerten eines Modells) hinzu.

    Stellen Sie keine Verbindung mit dem Eingabedataset her.

    Fügen Sie stattdessen das Modul Apply Transformation hinzu, und verbinden Sie mit der Ausgabe der Featureauswahltransformation.

    Wichtig

    Wenn Sie Filter Based Feature Selection auf das Bewertungsdataset anwenden, können Sie nicht erwarten, dass dieselben Ergebnisse erzielt werden. Da die Featureauswahl auf Werten basiert, könnte in ihr ein anderer Satz von Spalten ausgewählt werden, was dazu führen würde, dass der Bewertungsvorgang fehlschlägt.

  7. Führen Sie das Experiment aus.

Durch diese Vorgehensweise mit Speichern und anschließendem Anwenden einer Spaltenauswahl wird sichergestellt, dass für das Training und die Bewertung dasselbe Datenschema verfügbar ist.

Beispiele

Beispiele für die Verwendung dieses Moduls finden Sie im Azure KI-Katalog:

Erwartete Eingaben

Name Type Beschreibung
Dataset mit gewünschten Spalten Datentabelle Dataset, das den gewünschten Satz von Spalten enthält

Ausgaben

Name Type Beschreibung
Transformation für Spaltenauswahl ITransform-Schnittstelle Transformation, die die gleiche Teilmenge von Spalten wie im angegebenen Dataset auswählt.

Ausnahmen

Ausnahme Beschreibung
Fehler 0003 Eine Ausnahme tritt auf, wenn mindestens eine Eingabe NULL oder leer ist.

Siehe auch

Manipulation
Auswählen von Spalten im Dataset