다음을 통해 공유


PreTokenizer.PreTokenize(String) 메서드

정의

지정된 문자열을 단어 경계의 여러 부분 문자열로 분할하여 원래 문자열에서 해당 부분 문자열의 오프셋을 추적합니다.

public abstract System.Collections.Generic.IReadOnlyList<Microsoft.ML.Tokenizers.Split> PreTokenize (string sentence);
abstract member PreTokenize : string -> System.Collections.Generic.IReadOnlyList<Microsoft.ML.Tokenizers.Split>
Public MustOverride Function PreTokenize (sentence As String) As IReadOnlyList(Of Split)

매개 변수

sentence
String

토큰으로 분할할 문자열입니다.

반환

토큰을 포함하는 분할 목록과 토큰의 원래 문자열 오프셋 목록입니다.

적용 대상