Bpe 생성자
정의
중요
일부 정보는 릴리스되기 전에 상당 부분 수정될 수 있는 시험판 제품과 관련이 있습니다. Microsoft는 여기에 제공된 정보에 대해 어떠한 명시적이거나 묵시적인 보증도 하지 않습니다.
오버로드
Bpe() |
토큰화 어휘 없이 새 Bpe 모델 개체를 생성합니다. 이 생성자는 학습 시나리오에서만 유용합니다. |
Bpe(String, String, String, String, String) |
문장 토큰화 및 토큰화 학습에 사용할 새 Bpe 모델 개체를 생성합니다. |
Bpe()
토큰화 어휘 없이 새 Bpe 모델 개체를 생성합니다. 이 생성자는 학습 시나리오에서만 유용합니다.
public Bpe ();
Public Sub New ()
적용 대상
Bpe(String, String, String, String, String)
문장 토큰화 및 토큰화 학습에 사용할 새 Bpe 모델 개체를 생성합니다.
public Bpe (string vocabFile, string? mergesFile, string? unknownToken = default, string? continuingSubwordPrefix = default, string? endOfWordSuffix = default);
new Microsoft.ML.Tokenizers.Bpe : string * string * string * string * string -> Microsoft.ML.Tokenizers.Bpe
Public Sub New (vocabFile As String, mergesFile As String, Optional unknownToken As String = Nothing, Optional continuingSubwordPrefix As String = Nothing, Optional endOfWordSuffix As String = Nothing)
매개 변수
- vocabFile
- String
문자열 키 및 해당 ID의 사전을 포함하는 JSON 파일 경로입니다.
- mergesFile
- String
토큰의 쌍 목록을 포함하는 파일 경로입니다.
- unknownToken
- String
모델에서 사용할 알 수 없는 토큰입니다.
- continuingSubwordPrefix
- String
단어의 시작을 나타내지 않는 하위 단어 단위에 연결할 접두사입니다.
- endOfWordSuffix
- String
단어 끝을 나타내는 하위 단어 단위에 연결할 접미사입니다.