Freigeben über


Zusammenführen einer Zähltransformation

Wichtig

Der Support für Machine Learning Studio (klassisch) endet am 31. August 2024. Es wird empfohlen, bis zu diesem Datum auf Azure Machine Learning umzustellen.

Ab dem 1. Dezember 2021 können Sie keine neuen Ressourcen in Machine Learning Studio (klassisch) mehr erstellen. Bis zum 31. August 2024 können Sie die vorhandenen Ressourcen in Machine Learning Studio (klassisch) weiterhin verwenden.

Die Dokumentation zu ML Studio (klassisch) wird nicht mehr fortgeführt und kann künftig nicht mehr aktualisiert werden.

Erstellt einen Satz an Merkmalen auf Grundlage einer Anzahltabelle

Kategorie: Learning mit Anzahlen

Hinweis

Gilt für: Machine Learning Studio (klassisch)

Ähnliche Drag & Drop-Module sind im Azure Machine Learning-Designer verfügbar.

Modulübersicht

In diesem Artikel wird beschrieben, wie Sie das Merge Count Transform-Modul in Machine Learning Studio (klassisch) verwenden, um zwei Sätze von count-basierten Features zu kombinieren. Durch das Zusammenführen von zwei Sätzen verwandter Anzahlen und Features können Sie die Abdeckung und Verteilung der Features potenziell verbessern.

Learning von Zählungen ist besonders nützlich in großen Datensätzen mit Features mit hoher Kardinalität. Die Möglichkeit, mehrere Datasets in zählbasierten Featuresätzen zu kombinieren, ohne die Datasets erneut zu verarbeiten, erleichtert das Erfassen von Statistiken für sehr große Datasets und das Anwenden auf neue Datasets. Beispielsweise können Zähltabellen verwendet werden, um Informationen über Terabytes von Daten zu sammeln. Sie können diese Statistiken erneut verwenden, um die Genauigkeit von Vorhersagemodellen für kleine Datensätze zu verbessern.

Um zwei Sätze von count-basierten Features zusammenführungen zu können, müssen die Features mithilfe von Tabellen mit demselben Schema erstellt worden sein. Das heißt, beide Gruppen müssen dieselben Spalten verwenden und dieselben Namen und Datentypen haben.

Konfigurieren der Transformation für die Zusammenführungsanzahl

  1. Um die Transformation für die Zusammenführungsanzahl verwenden zu können, müssen Sie mindestens eine zählbasierte Transformation erstellt haben, und diese Transformation muss in Ihrem Arbeitsbereich vorhanden sein. Wenn Sie eine zählbasierte Transformation aus einem anderen Experiment gespeichert haben, sehen Sie sich die Gruppe Transformationen an. Wenn Sie die Transformation im aktuellen Experiment erstellt haben, verbinden Sie die Ausgaben der folgenden Module:

    • Transformation zur Buildzählung. Erstellt eine neue count-basierte Transformation aus Quelldaten.

    • Ändern von Count Table-Parametern. Verwendet eine vorhandene Zählungstransformation als Eingabe und gibt eine aktualisierte Transformation aus.

    • Tabelle "Anzahl importieren". Dieses Modul unterstützt Abwärtskompatibilität mit älteren Experimenten, die count-basiertes Lernen verwendet haben. Wenn Sie die Verteilung der Werte in einem Dataset mithilfe von Import Count Table analysiert und dann die Werte mithilfe des veralteten Count Featurizer-Moduls in Features konvertiert haben, verwenden Sie Die Anzahl importieren-Tabelle, um die Ergebnisse in eine Transformation zu konvertieren.

  2. Fügen Sie dem Experiment das Modul Merge Count Transform hinzu, und verbinden Sie eine Transformation mit jeder Eingabe.

    Tipp

    Die zweite Transformation ist eine optionale Eingabe– Sie können dieselbe Transformation zweimal verbinden oder nichts am zweiten Eingabeport verbinden.

  3. Wenn das zweite Dataset nicht gleichmäßig mit dem ersten Gewichtungsfaktor gewichtet werden soll, geben Sie einen Wert für den Decay-Faktor an. Der wert, den Sie eingeben, gibt an, wie der Satz von Features aus der zweiten Transformation gewichtet werden soll.

    Beispielsweise gewichtet der Standardwert 1 beide Sätze von Features gleichmäßig. Ein Wert von 0,5 bedeutet, dass die Features in der zweiten Gruppe die Hälfte der Gewichtung von denen in der ersten Gruppe haben würden.

  4. Fügen Sie optional eine Instanz des Moduls Apply Transformation hinzu, und wenden Sie die Transformation auf ein Dataset an.

Beispiele

Beispiele für die Verwendung dieses Moduls finden Sie im Azure KI-Katalog:

  • Learning mit Zählungen: Binäre Klassifizierung: Veranschaulicht, wie sie das Lernen mit Zählungsmodulen verwenden, um Features aus Spalten von kategorischen Werten für ein binäres Klassifizierungsmodell zu generieren.

  • Learning mit Zählungen: Multiklassenklassifizierung mit NYC-Taxidaten: Veranschaulicht, wie sie das Lernen mit Zählungsmodulen zum Durchführen der Multiklassenklassifizierung für das öffentlich verfügbare NYC-Taxi-Dataset verwenden. Im Beispiel wird ein Multiklassen-Lernmodell für die logistische Regression verwendet, um dieses Problem zu modellieren.

  • Learning mit Zählungen: Binäre Klassifizierung mit NYC-Taxidaten: Veranschaulicht, wie sie das Lernen mit Zählungsmodulen für die Durchführung binärer Klassifizierungen für das öffentlich verfügbare NYC-Taxi-Dataset verwenden. Im Beispiel wird ein zweiklassiger logistischer Regressions-Lerner verwendet, um das Problem zu modellieren.

Erwartete Eingaben

Name Type Beschreibung
Vorherige Zählungstransformation ITransform-Schnittstelle Die zu bearbeitende Zählungstransformation
Neue Zählungstransformation ITransform-Schnittstelle Die hinzuzufügende Zählungstransformation (optional)

Modulparameter

Name Typ Range Optional BESCHREIBUNG Standard
Verklingungsfaktor Float Erforderlich 1.0f Der Verfallsfaktor, der mit der Zähltransformation am rechten Eingabeport multipliziert werden soll.

Ausgaben

Name Type Beschreibung
Zusammengeführte Zählungstransformation ITransform-Schnittstelle Die zusammengeführte Transformation

Ausnahmen

Ausnahme Beschreibung
Fehler 0003 Eine Ausnahme tritt auf, wenn mindestens eine Eingabe NULL oder leer ist.
Fehler 0086 Eine Ausnahme tritt auf, wenn eine Zähltransformation ungültig ist.

Siehe auch

Lernen mit Zählungen