Ändern von Anzahltabellenparametern
Wichtig
Der Support für Machine Learning Studio (klassisch) endet am 31. August 2024. Es wird empfohlen, bis zu diesem Datum auf Azure Machine Learning umzustellen.
Ab dem 1. Dezember 2021 können Sie keine neuen Ressourcen in Machine Learning Studio (klassisch) mehr erstellen. Bis zum 31. August 2024 können Sie die vorhandenen Ressourcen in Machine Learning Studio (klassisch) weiterhin verwenden.
- Siehe Migrieren zu Azure Machine Learning
- Weitere Informationen zu Azure Machine Learning.
Die Dokumentation zu ML Studio (klassisch) wird nicht mehr fortgeführt und kann künftig nicht mehr aktualisiert werden.
Ändert die Parameter, die zum Erstellen von Features aus Zählungen verwendet werden.
Kategorie: Learning mit Anzahlen
Hinweis
Gilt nur für: Machine Learning Studio (klassisch)
Ähnliche Drag & Drop-Module sind im Azure Machine Learning-Designer verfügbar.
Modulübersicht
In diesem Artikel wird beschrieben, wie Sie das Modul Modify Count Table Parameters in Machine Learning Studio (klassisch) verwenden, um die Art und Weise zu ändern, wie Features aus einer Zähltabelle generiert werden.
Um count-basierte Features zu erstellen, verwenden Sie im Allgemeinen Build Counting Transform , um ein Dataset zu verarbeiten und eine Zähltabelle zu erstellen, und aus dieser Zähltabelle wird ein neuer Satz von Features generiert.
Wenn Sie jedoch bereits eine Zähltabelle erstellt haben, können Sie das Modul Modify Count Table Parameters verwenden, um die Definition der Verarbeitung der Zähldaten zu bearbeiten. Auf diese Weise können Sie basierend auf den vorhandenen Daten einen anderen Satz von zahlenbasierten Statistiken erstellen, ohne das Dataset erneut analysieren zu müssen.
Konfigurieren von Parametern zum Ändern der Anzahl
Suchen Sie die Transformation, die Sie ändern möchten, in der Gruppe Transformationen , und fügen Sie sie Ihrem Experiment hinzu.
Sie sollten zuvor ein Experiment ausgeführt haben, das eine Transformation für die Anzahl erstellt hat.
So ändern Sie eine gespeicherte Transformation: Suchen Sie die Transformation in der Gruppe Transformationen , und fügen Sie sie Ihrem Experiment hinzu.
So ändern Sie eine Im selben Experiment erstellte Anzahltransformation: Wenn die Transformation nicht gespeichert wurde, aber als Ausgabe im aktuellen Experiment verfügbar ist (überprüfen Sie z. B. die Ausgabe des Moduls Build Counting Transform ), können Sie sie direkt verwenden, indem Sie die Module verbinden.
Fügen Sie das Modul Modify Count Table Parameters hinzu, und verbinden Sie die Transformation als Eingabe.
Geben Sie im Bereich Eigenschaften des Moduls Modify Count Table Parameters (Tabellenparameter ändern) einen Wert ein, der alsGarbage-Bin-Schwellenwert verwendet werden soll.
Dieser Wert gibt die Mindestanzahl von Vorkommen an, die für jeden Featurewert gefunden werden müssen, damit die Anzahl verwendet werden kann. Wenn die Häufigkeit des Werts kleiner als der Garbage Bin-Schwellenwert ist, wird das Wertbezeichnungspaar nicht als diskretes Element gezählt. Stattdessen werden alle Elemente, deren Anzahl unter dem Schwellenwert liegt, in einem einzelnen "Garbage Bin" platziert.
Wenn Sie ein kleines Dataset verwenden und die gleichen Daten zählen und trainieren, ist ein guter Anfangswert 1.
Geben Sie für Zusätzliche vorherige Pseudobeispiele eine Zahl ein, die die Anzahl zusätzlicher Pseudobeispiele angibt, die eingeschlossen werden sollen. Sie müssen diese Beispiele nicht angeben. Die Pseudobeispiele werden basierend auf der vorherigen Verteilung generiert.
Geben Sie für laplacsche Rauschskala einen positiven Gleitkommawert ein, der die Skala darstellt, die für die Einführung von Rauschen verwendet wird, das aus einer Laplacian-Verteilung entnommen wird. Wenn Sie einen Skalierungswert festlegen, wird ein akzeptabler Rauschpegel in das Modell integriert, sodass das Modell weniger wahrscheinlich von unbekannten Werten in Den Daten betroffen ist.
Wählen Sie unter Ausgabefeatures einschließen die Methode aus, die beim Erstellen von count-basierten Features für die Einbeziehung in die Transformation verwendet werden soll.
CountsOnly: Erstellen Sie Features mithilfe von Zählungen.
LogOddsOnly: Erstellen Sie Features mithilfe des Protokolls des Wahrscheinlichkeitsverhältnisses.
BothCountsAndLogOdds: Erstellen Sie Features mit sowohl Zähler- als auch Protokollwahrscheinlichkeiten.
Wählen Sie die Option Rückblendspalte ignorieren aus , wenn Sie das
IsBackOff
Flag in der Ausgabe beim Erstellen von Features überschreiben möchten. Wenn Sie diese Option auswählen, werden count-basierte Features auch dann erstellt, wenn die Spalte keine signifikanten Anzahlwerte aufwies.Führen Sie das Experiment aus. Anschließend können Sie die Ausgabe von Parameter für Die Anzahl der Tabellen ändern bei Bedarf als neue Transformation speichern.
Beispiele
Beispiele für dieses Modul finden Sie im Azure KI-Katalog:
Learning mit Anzahl: Binäre Klassifizierung: Veranschaulicht, wie das Lernen mit Zählungsmodulen verwendet wird, um Features aus Spalten kategorischer Werte für ein binäres Klassifizierungsmodell zu generieren.
Learning mit Anzahl: Multiklassenklassifizierung mit NYC-Taxidaten: Beispiel veranschaulicht, wie das Lernen mit Zählmodulen zum Durchführen der Multiklassenklassifizierung für das öffentlich verfügbare NYC-Taxidataset verwendet wird. Im Beispiel wird ein logistisches Regressionslernmodell mit mehreren Klassen verwendet, um dieses Problem zu modellieren.
Learning mit Anzahlen: Binäre Klassifizierung mit NYC-Taxidaten: Veranschaulicht, wie das Lernen mit Zählmodulen zum Durchführen der binären Klassifizierung für das öffentlich verfügbare NYC-Taxidataset verwendet wird. Im Beispiel wird ein logistisches Regressionslernmodell mit zwei Klassen verwendet, um dieses Problem zu modellieren.
Technische Hinweise
Dieser Abschnitt enthält Implementierungsdetails, Tipps und Antworten auf häufig gestellte Fragen.
Es ist statistisch gesehen sicher, die Zählung und das Training für dasselbe Dataset durchzuführen, wenn Sie den Laplace-Rauschskalaparameter festlegen.
Erwartete Eingaben
Name | Type | Beschreibung |
---|---|---|
Zählen der Transformation | ITransform-Schnittstelle | Die zu übernehmende Zähltransformation |
Modulparameter
Name | Typ | Range | Optional | Standard | Beschreibung |
---|---|---|---|---|---|
Garbage bin threshold | Float | >=0,0f | Erforderlich | 10.0f | Der Schwellenwert, unter dem ein Spaltenwert für den Garbage Bin angegeben wird |
Additional prior pseudo examples | Float | >=0,0f | Erforderlich | 42.0f | Die zusätzlichen Pseudobeispiele nach vorherigen Distributionen, die eingeschlossen werden sollen |
Laplacian noise scale | Float | >=0,0f | Erforderlich | 0.0f | Die Skalierung der Laplacian-Verteilung, aus der Rauschen entnommen wird |
Output features include | OutputFeatureType | Erforderlich | BothCountsAndLogOdds | Die funktionen, die ausgegeben werden sollen | |
Ignore back off column | Boolean | Erforderlich | false | Gibt an, ob die IsBackOff-Spalte in der Ausgabe ignoriert werden soll. |
Ausgaben
Name | Type | Beschreibung |
---|---|---|
Geänderte Transformation | ITransform-Schnittstelle | Die geänderte Transformation |
Ausnahmen
Ausnahme | Beschreibung |
---|---|
Fehler 0003 | Eine Ausnahme tritt auf, wenn mindestens eine Eingabe NULL oder leer ist. |
Fehler 0086 | Eine Ausnahme tritt auf, wenn eine Zähltransformation ungültig ist. |
Eine Liste der Fehler, die für Studio-Module (klassisch) spezifisch sind, finden Sie unter Machine Learning Fehlercodes.
Eine Liste der API-Ausnahmen finden Sie unter Machine Learning REST-API-Fehlercodes.