Partager via


PreTokenizer.PreTokenize(String) Méthode

Définition

Fractionne la chaîne donnée dans plusieurs sous-chaînes au niveau de la limite du mot, en gardant le suivi des décalages de ces sous-chaînes par rapport à la chaîne d’origine.

public abstract System.Collections.Generic.IReadOnlyList<Microsoft.ML.Tokenizers.Split> PreTokenize (string sentence);
abstract member PreTokenize : string -> System.Collections.Generic.IReadOnlyList<Microsoft.ML.Tokenizers.Split>
Public MustOverride Function PreTokenize (sentence As String) As IReadOnlyList(Of Split)

Paramètres

sentence
String

Chaîne à diviser en jetons.

Retours

Liste des fractionnements contenant les jetons et les décalages du jeton sur la chaîne d’origine.

S’applique à