Condividi tramite


FastForestBinaryFeaturizationEstimator Classe

Definizione

Oggetto IEstimator<TTransformer> per trasformare il vettore di funzionalità di input in funzionalità basate su albero.

public sealed class FastForestBinaryFeaturizationEstimator : Microsoft.ML.Trainers.FastTree.TreeEnsembleFeaturizationEstimatorBase
type FastForestBinaryFeaturizationEstimator = class
    inherit TreeEnsembleFeaturizationEstimatorBase
Public NotInheritable Class FastForestBinaryFeaturizationEstimator
Inherits TreeEnsembleFeaturizationEstimatorBase
Ereditarietà
FastForestBinaryFeaturizationEstimator

Commenti

Colonne di input e output

I dati della colonna dell'etichetta di input devono essere Boolean. I dati delle colonne delle funzionalità di input devono essere un vettore di dimensioni note di Single.

Questo strumento di stima restituisce le colonne seguenti:

Nome colonna di output Tipo di colonna Descrizione
Trees Vettore di dimensioni note di Single Valori di output di tutti gli alberi. Le dimensioni sono identiche al numero totale di alberi nel modello di insieme di alberi.
Leaves Vettore di dimensioni note di Single Rappresentazione vettoriale da 0 a 1 agli ID di tutte le foglie in cui rientra il vettore di funzionalità di input. La sua dimensione è il numero di foglie totali nel modello di insieme di alberi.
Paths Vettore di dimensioni note di Single Rappresentazione vettoriale 0-1 nei percorsi il vettore di funzionalità di input passato per raggiungere le foglie. La dimensione è il numero di nodi non foglia nel modello di insieme di alberi.

Queste colonne di output sono tutte facoltative e gli utenti possono modificare i nomi. Impostare i nomi delle colonne ignorate su Null in modo che non vengano prodotti.

Dettagli stima

Questo strumento di stima produce diverse colonne di output da un modello di insieme di alberi. Si supponga che il modello contenga un solo albero delle decisioni:

               Node 0
               /    \
             /        \
           /            \
         /                \
       Node 1            Node 2
       /    \            /    \
     /        \        /        \
   /            \     Leaf -3  Node 3
  Leaf -1      Leaf -2         /    \
                             /        \
                            Leaf -4  Leaf -5

Si supponga che il vettore di funzionalità di input cada in Leaf -1. L'output Trees può essere un vettore a 1 elemento in cui l'unico valore è il valore decisionale trasportato da Leaf -1. L'output Leaves è un vettore 0-1. Se la foglia raggiunta è la $i$-th (indicizzata da $-(i+1)$, quindi la prima foglia è Leaf -1) nell'albero, il valore $i$-th in Leaves sarà 1 e tutti gli altri valori saranno 0. L'output Paths è una rappresentazione 0-1 dei nodi passati prima di raggiungere la foglia. L'elemento $i$-th in Paths indica se il nodo $i$-th (indicizzato da $i$) viene toccato. Ad esempio, raggiungere Leaf -1 porta a $[1, 1, 0, 0]$ come Paths. Se sono presenti più alberi, questo strumento di stima concatena Treessolo 's, Leaves's, Paths's da tutti gli alberi (le informazioni del primo albero vengono prima nei vettori concatenati).

Vedere la sezione Vedere anche i collegamenti agli esempi di utilizzo.

Metodi

Fit(IDataView)

Generare un TreeEnsembleModelParameters oggetto che esegue il mapping della colonna chiamata InputColumnName in input a tre colonne di output.

(Ereditato da TreeEnsembleFeaturizationEstimatorBase)
GetOutputSchema(SchemaShape)

PretrainedTreeFeaturizationEstimator aggiunge tre colonne float-vector in inputSchema. Dato una colonna vettore di funzionalità, le colonne aggiunte sono i valori di stima di tutti gli alberi, gli ID foglia in cui rientra il vettore di funzionalità e i percorsi di tali foglie.

(Ereditato da TreeEnsembleFeaturizationEstimatorBase)

Metodi di estensione

AppendCacheCheckpoint<TTrans>(IEstimator<TTrans>, IHostEnvironment)

Aggiungere un "checkpoint di memorizzazione nella cache" alla catena di stima. Ciò garantisce che gli estimatori downstream vengano sottoposti a training in base ai dati memorizzati nella cache. È utile avere un checkpoint di memorizzazione nella cache prima che i formatori eseseguono più passaggi di dati.

WithOnFitDelegate<TTransformer>(IEstimator<TTransformer>, Action<TTransformer>)

Dato un estimator, restituire un oggetto wrapping che chiamerà un delegato una volta Fit(IDataView) chiamato. È spesso importante che uno strumento di stima restituisca informazioni sull'adattamento, motivo per cui il Fit(IDataView) metodo restituisce un oggetto tipizzato in modo specifico, anziché solo un oggetto generale ITransformer. Tuttavia, allo stesso tempo, IEstimator<TTransformer> vengono spesso formati in pipeline con molti oggetti, quindi potrebbe essere necessario creare una catena di estimatori tramite EstimatorChain<TLastTransformer> dove lo strumento di stima per il quale si vuole ottenere il trasformatore è sepolto in una posizione in questa catena. Per questo scenario, è possibile collegare un delegato che verrà chiamato una volta chiamato fit.

Si applica a

Vedi anche