Freigeben über


FastTreeRankingFeaturizationEstimator Klasse

Definition

Ein IEstimator<TTransformer> , um eingabefunktionsvektor in strukturbasierte Features zu transformieren.

public sealed class FastTreeRankingFeaturizationEstimator : Microsoft.ML.Trainers.FastTree.TreeEnsembleFeaturizationEstimatorBase
type FastTreeRankingFeaturizationEstimator = class
    inherit TreeEnsembleFeaturizationEstimatorBase
Public NotInheritable Class FastTreeRankingFeaturizationEstimator
Inherits TreeEnsembleFeaturizationEstimatorBase
Vererbung
FastTreeRankingFeaturizationEstimator

Hinweise

Eingabe- und Ausgabespalten

Der Datentyp für die Eingabebezeichnung muss ein Typ key oder Single sein. Der Wert der Bezeichnung bestimmt die Relevanz, wobei höhere Werte eine höhere Relevanz anzeigen. Wenn die Bezeichnung vom Typ key ist, dann ist der Schlüsselindex der Relevanzwert, wobei der kleinste Index der am wenigsten relevante ist. Wenn die Bezeichnung ein Single ist, zeigen höhere Werte eine höhere Relevanz an. Die Featurespalte muss ein Vektor von bekannter Größe sein, und die Single Eingabezeilengruppenspalte muss schlüsseltyp sein.

Dieser Schätzer gibt die folgenden Spalten aus:

Name der Ausgabespalte Spaltentyp BESCHREIBUNG
Trees Vektor bekannter Größe von Single Die Ausgabewerte aller Strukturen. Seine Größe ist identisch mit der Gesamtanzahl von Bäumen im Strukturensemblemodell.
Leaves Vektor bekannter Größe von Single 0-1 Vektordarstellung für die IDs aller Blätter, in die der Eingabefunktionsvektor fällt. Seine Größe ist die Anzahl der Gesamtblätter im Strukturensemblemodell.
Paths Vektor bekannter Größe von Single 0-1 Vektordarstellung für die Pfade, durch die der Eingabefunktionsvektor übergeben wurde, um die Blätter zu erreichen. Seine Größe ist die Anzahl der Nichtblattknoten im Strukturensemblemodell.

Diese Ausgabespalten sind alle optional, und benutzer können ihre Namen ändern. Legen Sie die Namen übersprungener Spalten auf NULL fest, damit sie nicht erzeugt werden.

Details zur Vorhersage

Dieser Schätzer erzeugt mehrere Ausgabespalten aus einem Strukturensemblemodell. Angenommen, das Modell enthält nur eine Entscheidungsstruktur:

               Node 0
               /    \
             /        \
           /            \
         /                \
       Node 1            Node 2
       /    \            /    \
     /        \        /        \
   /            \     Leaf -3  Node 3
  Leaf -1      Leaf -2         /    \
                             /        \
                            Leaf -4  Leaf -5

Angenommen, der Eingabefunktionsvektor fällt in Leaf -1. Die Ausgabe Trees kann ein Vektor mit 1 Element sein, wobei der einzige Wert der von getragene Leaf -1Entscheidungswert ist. Die Ausgabe Leaves ist ein 0-1-Vektor. Wenn das erreichte Blatt das $i$-th (indiziert durch $-(i+1)$ ist, sodass das erste Blatt ) in der Struktur ist Leaf -1, wäre der $i$-th-Wert in Leaves 1 und alle anderen Werte wären 0. Die Ausgabe Paths ist eine 0-1-Darstellung der Knoten, die vor dem Erreichen des Blatts durchlaufen werden. Das $i$-th-Element in Paths gibt an, ob der $i$-ten Knoten (indiziert durch $i$) berührt wird. Beispiel: Erreichen von Leaf -1 lead auf $[1, 1, 0, 0]$ als Paths. Wenn mehrere Strukturen vorhanden sind, verkettet Treesdieser Schätzer einfach "s", Leaves"s", Paths"s" aus allen Bäumen (die Informationen der ersten Struktur kommen in den verketteten Vektoren an erster Stelle).

Im Abschnitt Siehe auch finden Sie Links zu Verwendungsbeispielen.

Methoden

Fit(IDataView)

Erstellen Sie eine TreeEnsembleModelParameters , die die in aufgerufene InputColumnNameinput Spalte drei Ausgabespalten zuordnet.

(Geerbt von TreeEnsembleFeaturizationEstimatorBase)
GetOutputSchema(SchemaShape)

PretrainedTreeFeaturizationEstimator fügt drei Floatvektorspalten hinzu inputSchema. Bei einer Featurevektorspalte sind die hinzugefügten Spalten die Vorhersagewerte aller Strukturen, die Blatt-IDs, in die der Featurevektor fällt, und die Pfade zu diesen Blättern.

(Geerbt von TreeEnsembleFeaturizationEstimatorBase)

Erweiterungsmethoden

AppendCacheCheckpoint<TTrans>(IEstimator<TTrans>, IHostEnvironment)

Fügen Sie der Schätzungskette einen Zwischenspeicherungsprüfpunkt an. Dadurch wird sichergestellt, dass die nachgelagerten Schätzer für zwischengespeicherte Daten trainiert werden. Es ist hilfreich, vor Trainern, die mehrere Datendurchläufe durchführen, einen Zwischenspeicherungsprüfpunkt zu haben.

WithOnFitDelegate<TTransformer>(IEstimator<TTransformer>, Action<TTransformer>)

Geben Sie bei einem Schätzer ein umschließendes Objekt zurück, das nach Fit(IDataView) dem Aufruf einen Delegaten aufruft. Es ist oft wichtig, dass ein Schätzer Informationen darüber zurückgibt, was geeignet war. Daher gibt die Fit(IDataView) Methode ein speziell typisiertes Objekt zurück, anstatt nur ein allgemeines ITransformer. Zur gleichen Zeit IEstimator<TTransformer> werden jedoch häufig Pipelines mit vielen Objekten gebildet, sodass wir möglicherweise eine Kette von Schätzern erstellen müssen, über EstimatorChain<TLastTransformer> die der Schätzer, für den wir den Transformator erhalten möchten, irgendwo in dieser Kette vergraben ist. Für dieses Szenario können wir über diese Methode einen Delegaten anfügen, der aufgerufen wird, sobald fit aufgerufen wird.

Gilt für:

Weitere Informationen