PreTokenizer.PreTokenize(String) 메서드
정의
중요
일부 정보는 릴리스되기 전에 상당 부분 수정될 수 있는 시험판 제품과 관련이 있습니다. Microsoft는 여기에 제공된 정보에 대해 어떠한 명시적이거나 묵시적인 보증도 하지 않습니다.
지정된 문자열을 단어 경계의 여러 부분 문자열로 분할하여 원래 문자열에서 해당 부분 문자열의 오프셋을 추적합니다.
public abstract System.Collections.Generic.IReadOnlyList<Microsoft.ML.Tokenizers.Split> PreTokenize (string sentence);
abstract member PreTokenize : string -> System.Collections.Generic.IReadOnlyList<Microsoft.ML.Tokenizers.Split>
Public MustOverride Function PreTokenize (sentence As String) As IReadOnlyList(Of Split)
매개 변수
- sentence
- String
토큰으로 분할할 문자열입니다.
반환
토큰을 포함하는 분할 목록과 토큰의 원래 문자열 오프셋 목록입니다.