다음을 통해 공유


WhiteSpace 클래스

정의

단어 경계에서 텍스트를 분할하는 사전 토큰화기입니다. 단어는 알파벳, 숫자 및 밑줄 문자 집합입니다.

public sealed class WhiteSpace : Microsoft.ML.Tokenizers.PreTokenizer
type WhiteSpace = class
    inherit PreTokenizer
Public NotInheritable Class WhiteSpace
Inherits PreTokenizer
상속
WhiteSpace

생성자

WhiteSpace()

단어 경계에서 텍스트를 분할하는 사전 토큰화기입니다. 단어는 알파벳, 숫자 및 밑줄 문자 집합입니다.

필드

Instance

WhiteSpace 사전 토큰라이저의 싱글톤 인스턴스를 가져옵니다.

메서드

PreTokenize(String)

지정된 문자열을 단어 경계의 여러 부분 문자열로 분할하여 원래 문자열에서 해당 부분 문자열의 오프셋을 추적합니다.

적용 대상