OneHotHashEncodingEstimator Classe
Définition
Important
Certaines informations portent sur la préversion du produit qui est susceptible d’être en grande partie modifiée avant sa publication. Microsoft exclut toute garantie, expresse ou implicite, concernant les informations fournies ici.
Convertit une ou plusieurs colonnes d’entrée de valeurs catégorielles en autant de colonnes de sortie de vecteurs codés à chaud basés sur un hachage.
public sealed class OneHotHashEncodingEstimator : Microsoft.ML.IEstimator<Microsoft.ML.Transforms.OneHotHashEncodingTransformer>
type OneHotHashEncodingEstimator = class
interface IEstimator<OneHotHashEncodingTransformer>
Public NotInheritable Class OneHotHashEncodingEstimator
Implements IEstimator(Of OneHotHashEncodingTransformer)
- Héritage
-
OneHotHashEncodingEstimator
- Implémente
Remarques
Caractéristiques de l’estimateur
Cet estimateur doit-il examiner les données pour entraîner ses paramètres ? | Oui |
Type de données de colonne d’entrée | Scalaire ou vecteur de type numérique, booléen, texte ou clé . |
Type de données de colonne de sortie | Scalaire ou vecteur de clé ou vecteur de Single type. |
Exportable vers ONNX | Non |
Le résultat OneHotEncodingTransformer convertit une ou plusieurs colonnes d’entrée en autant de colonnes de sortie de vecteurs codés à chaud, où l’indexation est effectuée en hachage de la valeur et en utilisant le hachage comme index.
Il OneHotEncodingEstimator est souvent utilisé pour convertir des données catégorielles en une forme qui peut être fournie à un algorithme De Machine Learning.
La sortie de cette transformation est spécifiée par OneHotEncodingEstimator.OutputKind:
Indicator produit un vecteur d’indicateur. Chaque emplacement de ce vecteur correspond à une catégorie du dictionnaire. Sa longueur représente donc la taille du dictionnaire généré. Si une valeur est introuvable dans le dictionnaire, la sortie est le vecteur zéro.
Bag produit un vecteur de sorte que chaque emplacement stocke le nombre d’occurrences de la valeur correspondante dans le vecteur d’entrée. Chaque emplacement de ce vecteur correspond à une valeur dans le dictionnaire. Sa longueur est donc la taille du dictionnaire généré. Indicator et Bag diffèrent simplement dans la façon dont les vecteurs binaires générés à partir d’emplacements individuels dans la colonne d’entrée sont agrégés : pour l’indicateur, ils sont concaténés et pour bag, ils sont ajoutés. Lorsque la colonne source est scalaire, les options Indicateur et Conteneur sont identiques.
Key produit des clés dans une KeyDataViewType colonne. Si la colonne d’entrée est un vecteur, la sortie contient un type de clé vectorielle, où chaque emplacement du vecteur correspond à l’emplacement respectif du vecteur d’entrée. Si une catégorie est introuvable dans le dictionnaire généré, elle reçoit la valeur zéro.
Binary produit un vecteur encodé binaire pour représenter les valeurs trouvées dans le dictionnaire présents dans la colonne d’entrée. Si une valeur dans la colonne d’entrée est introuvable dans le dictionnaire, la sortie est le vecteur zéro.
OneHotEncodingTransformer peut être appliqué à une ou plusieurs colonnes, auquel cas il génère et utilise un dictionnaire distinct pour chaque colonne à laquelle il est appliqué.
Consultez la section Voir aussi pour obtenir des liens vers des exemples d’utilisation.
Méthodes
Fit(IDataView) |
Effectue l’apprentissage et retourne un OneHotHashEncodingTransformer. |
GetOutputSchema(SchemaShape) |
Retourne le SchemaShape schéma qui sera produit par le transformateur. Utilisé pour la propagation et la vérification du schéma dans un pipeline. |
Méthodes d’extension
AppendCacheCheckpoint<TTrans>(IEstimator<TTrans>, IHostEnvironment) |
Ajoutez un « point de contrôle de mise en cache » à la chaîne d’estimateur. Cela garantit que les estimateurs en aval seront entraînés par rapport aux données mises en cache. Il est utile d’avoir un point de contrôle de mise en cache avant les formateurs qui prennent plusieurs passes de données. |
WithOnFitDelegate<TTransformer>(IEstimator<TTransformer>, Action<TTransformer>) |
Étant donné un estimateur, retournez un objet de création de package de restrictions qui appellera un délégué une fois Fit(IDataView) appelé. Il est souvent important qu’un estimateur retourne des informations sur ce qui était adapté, c’est pourquoi la Fit(IDataView) méthode retourne un objet spécifiquement typé, plutôt que simplement un général ITransformer. Toutefois, en même temps, IEstimator<TTransformer> sont souvent formés en pipelines avec de nombreux objets. Nous pouvons donc avoir besoin de créer une chaîne d’estimateurs par EstimatorChain<TLastTransformer> le biais de laquelle l’estimateur pour lequel nous voulons obtenir le transformateur est enterré quelque part dans cette chaîne. Pour ce scénario, nous pouvons par le biais de cette méthode attacher un délégué qui sera appelé une fois l’ajustement appelé. |