FastTreeBinaryFeaturizationEstimator Classe
Définition
Important
Certaines informations portent sur la préversion du produit qui est susceptible d’être en grande partie modifiée avant sa publication. Microsoft exclut toute garantie, expresse ou implicite, concernant les informations fournies ici.
IEstimator<TTransformer> pour transformer le vecteur de fonctionnalité d’entrée en fonctionnalités basées sur une arborescence.
public sealed class FastTreeBinaryFeaturizationEstimator : Microsoft.ML.Trainers.FastTree.TreeEnsembleFeaturizationEstimatorBase
type FastTreeBinaryFeaturizationEstimator = class
inherit TreeEnsembleFeaturizationEstimatorBase
Public NotInheritable Class FastTreeBinaryFeaturizationEstimator
Inherits TreeEnsembleFeaturizationEstimatorBase
- Héritage
Remarques
Colonnes d’entrée et de sortie
Les données de la colonne d’étiquettes d’entrée doivent être Boolean. Les données de colonne des caractéristiques d’entrée doivent être un vecteur de taille connue de Single.
Cet estimateur génère les colonnes suivantes :
Nom de colonne de sortie | Type de colonne | Description |
---|---|---|
Trees |
Vecteur de taille connue de Single | Valeurs de sortie de toutes les arborescences. Sa taille est identique au nombre total d’arbres dans le modèle d’ensemble d’arborescences. |
Leaves |
Vecteur de taille connue de Single | Représentation vectorielle 0-1 aux ID de toutes les feuilles dans lesquelles le vecteur de caractéristique d’entrée se trouve. Sa taille est le nombre total de feuilles dans le modèle d’ensemble d’arborescences. |
Paths |
Vecteur de taille connue de Single | Représentation vectorielle 0-1 aux chemins d’accès que le vecteur de fonctionnalité d’entrée a traversés pour atteindre les feuilles. Sa taille est le nombre de nœuds non feuilles dans le modèle d’ensemble d’arborescences. |
Ces colonnes de sortie sont toutes facultatives et l’utilisateur peut modifier leurs noms. Définissez les noms des colonnes ignorées sur Null afin qu’elles ne soient pas produites.
Détails de la prédiction
Cet estimateur produit plusieurs colonnes de sortie à partir d’un modèle d’ensemble d’arborescences. Supposons que le modèle ne contienne qu’un seul arbre de décision :
Node 0
/ \
/ \
/ \
/ \
Node 1 Node 2
/ \ / \
/ \ / \
/ \ Leaf -3 Node 3
Leaf -1 Leaf -2 / \
/ \
Leaf -4 Leaf -5
Supposons que le vecteur de fonctionnalité d’entrée tombe dans Leaf -1
. La sortie Trees
peut être un vecteur à 1 élément où la seule valeur est la valeur de décision portée par Leaf -1
. La sortie Leaves
est un vecteur 0-1. Si la feuille atteinte est la $i$-th (indexée par $-(i+1)$ de sorte que la première feuille est Leaf -1
) dans l’arborescence, la valeur $i$-th dans Leaves
est 1 et toutes les autres valeurs sont 0. La sortie Paths
est une représentation 0-1 des nœuds passés avant d’atteindre la feuille. L’élément $i$-th dans Paths
indique si le nœud $i$-th (indexé par $i$) est touché.
Par exemple, atteindre Leaf -1
le prospect à $[1, 1, 0, 0]$ comme Paths
. S’il y a plusieurs arbres, cet estimateur concatène Trees
Leaves
Paths
simplement de tous les arbres (la première information de l’arbre vient d’abord dans les vecteurs concaténés).
Consultez la section Voir aussi pour obtenir des liens vers des exemples d’utilisation.
Méthodes
Fit(IDataView) |
Produisez un TreeEnsembleModelParameters qui mappe la colonne appelée InputColumnName dans |
GetOutputSchema(SchemaShape) |
PretrainedTreeFeaturizationEstimator ajoute trois colonnes à vecteur flottant dans |
Méthodes d’extension
AppendCacheCheckpoint<TTrans>(IEstimator<TTrans>, IHostEnvironment) |
Ajoutez un « point de contrôle de mise en cache » à la chaîne de l’estimateur. Cela garantit que les estimateurs en aval seront entraînés sur les données mises en cache. Il est utile d’avoir un point de contrôle de mise en cache avant les formateurs qui effectuent plusieurs passes de données. |
WithOnFitDelegate<TTransformer>(IEstimator<TTransformer>, Action<TTransformer>) |
Avec un estimateur, retournez un objet d’habillage qui appellera un délégué une fois Fit(IDataView) appelé. Il est souvent important pour un estimateur de retourner des informations sur ce qui était adapté, c’est pourquoi la Fit(IDataView) méthode retourne un objet spécifiquement typé, plutôt qu’un simple général ITransformer. Toutefois, dans le même temps, IEstimator<TTransformer> sont souvent formés dans des pipelines avec de nombreux objets, nous devrons donc créer une chaîne d’estimateurs par le biais EstimatorChain<TLastTransformer> de l’emplacement où l’estimateur pour lequel nous voulons obtenir le transformateur est enterré quelque part dans cette chaîne. Pour ce scénario, nous pouvons, par le biais de cette méthode, attacher un délégué qui sera appelé une fois que fit est appelé. |