다음을 통해 공유


WhiteSpace.PreTokenize(String) 메서드

정의

지정된 문자열을 단어 경계의 여러 부분 문자열로 분할하여 원래 문자열에서 해당 부분 문자열의 오프셋을 추적합니다.

public override System.Collections.Generic.IReadOnlyList<Microsoft.ML.Tokenizers.Split> PreTokenize (string? sentence);
override this.PreTokenize : string -> System.Collections.Generic.IReadOnlyList<Microsoft.ML.Tokenizers.Split>
Public Overrides Function PreTokenize (sentence As String) As IReadOnlyList(Of Split)

매개 변수

sentence
String

토큰으로 분할할 문자열입니다.

반환

원래 문자열에 대한 토큰 및 토큰의 오프셋을 포함하는 분할 목록입니다.

적용 대상