TokenizingByCharactersEstimator Classe
Définition
Important
Certaines informations portent sur la préversion du produit qui est susceptible d’être en grande partie modifiée avant sa publication. Microsoft exclut toute garantie, expresse ou implicite, concernant les informations fournies ici.
public sealed class TokenizingByCharactersEstimator : Microsoft.ML.Data.TrivialEstimator<Microsoft.ML.Transforms.Text.TokenizingByCharactersTransformer>
type TokenizingByCharactersEstimator = class
inherit TrivialEstimator<TokenizingByCharactersTransformer>
Public NotInheritable Class TokenizingByCharactersEstimator
Inherits TrivialEstimator(Of TokenizingByCharactersTransformer)
- Héritage
Remarques
Caractéristiques de l’estimateur
Cet estimateur doit-il examiner les données pour entraîner ses paramètres ? | Oui |
Type de données de colonne d’entrée | Scalaire ou vecteur de texte |
Type de données de colonne de sortie | Vecteur de taille variable du type de clé . |
Exportable vers ONNX | Oui |
L’estimateur tokenise les caractères en fractionnant le texte en séquences de caractères à l’aide d’une fenêtre glissante. Pendant l’entraînement, l’estimateur génère un dictionnaire de paires clé-valeur avec les séquences de caractères rencontrées.
Le TokenizingByCharactersTransformer résultat de l’ajustement de l’estimateur crée une colonne, nommée comme spécifié dans les paramètres de nom de colonne de sortie, qui contient les clés des séquences de caractères qui ont été rencontrées dans l’entrée.
Consultez la section Voir aussi pour obtenir des liens vers des exemples d’utilisation.
Méthodes
Fit(IDataView) |
IEstimator<TTransformer> pour le TokenizingByCharactersTransformer. (Hérité de TrivialEstimator<TTransformer>) |
GetOutputSchema(SchemaShape) |
Retourne le SchemaShape schéma qui sera produit par le transformateur. Utilisé pour la propagation et la vérification du schéma dans un pipeline. |
Méthodes d’extension
AppendCacheCheckpoint<TTrans>(IEstimator<TTrans>, IHostEnvironment) |
Ajoutez un « point de contrôle de mise en cache » à la chaîne d’estimateur. Cela garantit que les estimateurs en aval seront entraînés par rapport aux données mises en cache. Il est utile d’avoir un point de contrôle de mise en cache avant les formateurs qui prennent plusieurs passes de données. |
WithOnFitDelegate<TTransformer>(IEstimator<TTransformer>, Action<TTransformer>) |
Étant donné un estimateur, retournez un objet de création de package de restrictions qui appellera un délégué une fois Fit(IDataView) appelé. Il est souvent important qu’un estimateur retourne des informations sur ce qui était adapté, c’est pourquoi la Fit(IDataView) méthode retourne un objet spécifiquement typé, plutôt que simplement un général ITransformer. Toutefois, en même temps, IEstimator<TTransformer> sont souvent formés en pipelines avec de nombreux objets. Nous pouvons donc avoir besoin de créer une chaîne d’estimateurs par EstimatorChain<TLastTransformer> le biais de laquelle l’estimateur pour lequel nous voulons obtenir le transformateur est enterré quelque part dans cette chaîne. Pour ce scénario, nous pouvons par le biais de cette méthode attacher un délégué qui sera appelé une fois l’ajustement appelé. |