Tokenizer Classe
Définition
Important
Certaines informations portent sur la préversion du produit qui est susceptible d’être en grande partie modifiée avant sa publication. Microsoft exclut toute garantie, expresse ou implicite, concernant les informations fournies ici.
Un générateur de jetons fonctionne comme un pipeline. Il traite du texte brut en tant qu’entrée et génère un objet TokenizerResult.
public class Tokenizer
type Tokenizer = class
Public Class Tokenizer
- Héritage
-
Tokenizer
Constructeurs
Tokenizer(Model, PreTokenizer, Normalizer) |
Créez un objet Tokenizer. |
Propriétés
Decoder |
Obtient ou définit le décodeur utilisé par tokenizer. |
Model |
Obtient le modèle utilisé par le générateur de jetons. |
Normalizer |
Obtient ou définit le normaliseur utilisé par le générateur de jetons. |
PreTokenizer |
Obtient ou définit le preTokenizer utilisé par tokenizer. |
Méthodes
Decode(IEnumerable<Int32>, Boolean) |
Décodez les ID donnés, en revenir à une chaîne. |
Decode(Int32, Boolean) |
Décode l’ID en jeton mappé. |
Encode(String) |
Encode le texte d’entrée en objet a la liste de jetons, les ID de jetons, le mappage de décalage de jetons. |
IsValidChar(Char) |
Un générateur de jetons fonctionne comme un pipeline. Il traite du texte brut en tant qu’entrée et génère un objet TokenizerResult. |
TrainFromFiles(Trainer, ReportProgress, String[]) |
Entraînez le modèle de générateur de jetons à l’aide de fichiers d’entrée. |