Tokenizer.Encode(String) 方法

定义

将输入文本编码为具有标记列表、标记 ID、令牌偏移映射的对象。

public Microsoft.ML.Tokenizers.TokenizerResult Encode (string sequence);
member this.Encode : string -> Microsoft.ML.Tokenizers.TokenizerResult
Public Function Encode (sequence As String) As TokenizerResult

参数

sequence
String

要标记的文本。

返回

标记化结果包括令牌列表、令牌 ID、令牌偏移映射。

适用于