Tokenizer Klasse
Definition
Wichtig
Einige Informationen beziehen sich auf Vorabversionen, die vor dem Release ggf. grundlegend überarbeitet werden. Microsoft übernimmt hinsichtlich der hier bereitgestellten Informationen keine Gewährleistungen, seien sie ausdrücklich oder konkludent.
Ein Tokenizer funktioniert als Pipeline. Es verarbeitet unformatierten Text als Eingabe und gibt ein TokenizerResult-Objekt aus.
public class Tokenizer
type Tokenizer = class
Public Class Tokenizer
- Vererbung
-
Tokenizer
Konstruktoren
Tokenizer(Model, PreTokenizer, Normalizer) |
Erstellen Sie ein neues Tokenizer-Objekt. |
Eigenschaften
Decoder |
Ruft den decoder ab, der vom Tokenizer verwendet wird, oder legt diesen fest. |
Model |
Ruft das modell ab, das vom Tokenizer verwendet wird. |
Normalizer |
Ruft den normalisierer ab, der vom Tokenizer verwendet wird, oder legt diesen fest. |
PreTokenizer |
Ruft den vom Tokenizer verwendeten PreTokenizer ab oder legt diese fest. |
Methoden
Decode(IEnumerable<Int32>, Boolean) |
Decodieren Sie die angegebenen IDs zurück zu einer Zeichenfolge. |
Decode(Int32, Boolean) |
Decodiert die ID mit dem zugeordneten Token. |
Encode(String) |
Codiert Eingabetext in ein Objekt mit der Tokenliste, Token-IDs und Tokenoffsetzuordnung. |
IsValidChar(Char) |
Ein Tokenizer funktioniert als Pipeline. Es verarbeitet unformatierten Text als Eingabe und gibt ein TokenizerResult-Objekt aus. |
TrainFromFiles(Trainer, ReportProgress, String[]) |
Trainieren Sie das Tokenizermodell mithilfe von Eingabedateien. |