Partilhar via


FastForestBinaryFeaturizationEstimator Classe

Definição

Um IEstimator<TTransformer> para transformar o vetor de recursos de entrada em recursos baseados em árvore.

public sealed class FastForestBinaryFeaturizationEstimator : Microsoft.ML.Trainers.FastTree.TreeEnsembleFeaturizationEstimatorBase
type FastForestBinaryFeaturizationEstimator = class
    inherit TreeEnsembleFeaturizationEstimatorBase
Public NotInheritable Class FastForestBinaryFeaturizationEstimator
Inherits TreeEnsembleFeaturizationEstimatorBase
Herança
FastForestBinaryFeaturizationEstimator

Comentários

Colunas de entrada e saída

Os dados da coluna de rótulo de entrada devem ser Boolean. Os dados da coluna de recursos de entrada devem ser um vetor de tamanho conhecido de Single.

Esse avaliador gera as seguintes colunas:

Nome da Coluna de Saída Tipo de coluna Descrição
Trees Vetor de tamanho conhecido de Single Os valores de saída de todas as árvores. Seu tamanho é idêntico ao número total de árvores no modelo de conjunto de árvores.
Leaves Vetor de tamanho conhecido de Single Representação de vetor de 0 a 1 para as IDs de todas as folhas em que o vetor de recurso de entrada se enquadra. Seu tamanho é o número total de folhas no modelo de conjunto de árvores.
Paths Vetor de tamanho conhecido de Single 0-1 representação de vetor para os caminhos que o vetor de recurso de entrada passou para alcançar as folhas. Seu tamanho é o número de nós que não são folhas no modelo de conjunto de árvores.

Essas colunas de saída são opcionais e o usuário pode alterar seus nomes. Defina os nomes das colunas ignoradas como nulos para que elas não sejam produzidas.

Detalhes da previsão

Esse avaliador produz várias colunas de saída de um modelo de conjunto de árvores. Suponha que o modelo contenha apenas uma árvore de decisão:

               Node 0
               /    \
             /        \
           /            \
         /                \
       Node 1            Node 2
       /    \            /    \
     /        \        /        \
   /            \     Leaf -3  Node 3
  Leaf -1      Leaf -2         /    \
                             /        \
                            Leaf -4  Leaf -5

Suponha que o vetor do recurso de entrada se enquadra em Leaf -1. A saída Trees pode ser um vetor de 1 elemento em que o único valor é o valor de decisão transportado por Leaf -1. A saída Leaves é um vetor 0-1. Se a folha atingida for a folha $i$-th (indexada por $-(i+1)$ para que a primeira folha seja Leaf -1) folha na árvore, o valor $i$-th em Leaves seria 1 e todos os outros valores seriam 0. A saída Paths é uma representação 0-1 dos nós passados antes de atingir a folha. O elemento $i$-th em Paths indica se o nó $i$-th (indexado por $i$) é tocado. Por exemplo, atingir Leaf -1 o valor de $[1, 1, 0, 0]$ como o Paths. Se houver várias árvores, esse avaliador concatena TreesLeavesPathsapenas as de todas as árvores (as informações da primeira árvore vêm primeiro nos vetores concatenados).

Verifique a seção Consulte Também para obter links para exemplos de uso.

Métodos

Fit(IDataView)

Produza um TreeEnsembleModelParameters que mapeia a coluna chamada InputColumnName em input para três colunas de saída.

(Herdado de TreeEnsembleFeaturizationEstimatorBase)
GetOutputSchema(SchemaShape)

PretrainedTreeFeaturizationEstimator adiciona três colunas de vetor float em inputSchema. Dada uma coluna de vetor de recurso, as colunas adicionadas são os valores de previsão de todas as árvores, as IDs folha nas quais o vetor de recurso se enquadra e os caminhos para essas folhas.

(Herdado de TreeEnsembleFeaturizationEstimatorBase)

Métodos de Extensão

AppendCacheCheckpoint<TTrans>(IEstimator<TTrans>, IHostEnvironment)

Acrescente um 'ponto de verificação de cache' à cadeia de avaliadores. Isso garantirá que os avaliadores downstream sejam treinados em relação aos dados armazenados em cache. É útil ter um ponto de verificação de cache antes dos treinadores que fazem várias passagens de dados.

WithOnFitDelegate<TTransformer>(IEstimator<TTransformer>, Action<TTransformer>)

Dado um avaliador, retorne um objeto de encapsulamento que chamará um delegado uma vez Fit(IDataView) chamado. Geralmente, é importante que um avaliador retorne informações sobre o que era adequado, e é por isso que o Fit(IDataView) método retorna um objeto especificamente tipado, em vez de apenas um geral ITransformer. No entanto, ao mesmo tempo, IEstimator<TTransformer> muitas vezes são formados em pipelines com muitos objetos, portanto, talvez seja necessário criar uma cadeia de avaliadores por meio EstimatorChain<TLastTransformer> de onde o avaliador para o qual queremos obter o transformador está enterrado em algum lugar nesta cadeia. Para esse cenário, podemos por meio desse método anexar um delegado que será chamado assim que fit for chamado.

Aplica-se a

Confira também