Bpe Classe
Définition
Important
Certaines informations portent sur la préversion du produit qui est susceptible d’être en grande partie modifiée avant sa publication. Microsoft exclut toute garantie, expresse ou implicite, concernant les informations fournies ici.
Représente le modèle d’encodage de paire d’octets.
public sealed class Bpe : Microsoft.ML.Tokenizers.Model
type Bpe = class
inherit Model
Public NotInheritable Class Bpe
Inherits Model
- Héritage
Constructeurs
Bpe() |
Construisez un nouvel objet de modèle Bpe sans vocabulaire de jeton. Ce constructeur n’est utile que dans le scénario d’entraînement. |
Bpe(String, String, String, String, String) |
Construisez un nouvel objet de modèle Bpe à utiliser pour la tokenisation de phrase et l’entraînement du générateur de jetons. |
Propriétés
ContinuingSubwordPrefix |
Préfixe facultatif à utiliser sur n’importe quel sous-mot qui n’existe que derrière un autre |
Decoder |
Obtient l’objet décodeur Bpe. |
EndOfWordSuffix |
Suffixe facultatif pour caractériser et le sous-mot de fin de mot |
FuseUnknownTokens |
Obtient ou définit si l’autorisation de fusion de plusieurs jetons inconnus |
UnknownToken |
Obtient ou Définit un jeton inconnu. Jeton inconnu à utiliser lorsque nous rencontrons un caractère inconnu |
Méthodes
GetTrainer() |
Obtient un objet formateur à utiliser pour entraîner le modèle et générer le vocabulaire et fusionner les données. |
GetVocab() |
Obtient les jetons de mappage de dictionnaire aux ID. |
GetVocabSize() |
Obtient la taille du dictionnaire qui mappe les jetons aux ID. |
IdToString(Int32, Boolean) |
Mapper l’ID jeton au jeton. |
IdToToken(Int32, Boolean) |
Mapper l’ID jeton au jeton. |
IsValidChar(Char) |
Représente le modèle d’encodage de paire d’octets. |
Save(String, String) |
Enregistrez les données du modèle dans les fichiers de vocabulaire et fusionnez. |
Tokenize(String) |
Jetonsez une chaîne de séquence en une liste de jetons. |
TokenToId(String) |
Mapper le jeton à l’ID jeton. |