다음을 통해 공유


BpeTrainer 클래스

정의

Bpe 모델을 학습시킬 책임이 있는 Bpe 트레이너.

public sealed class BpeTrainer : Microsoft.ML.Tokenizers.Trainer
type BpeTrainer = class
    inherit Trainer
Public NotInheritable Class BpeTrainer
Inherits Trainer
상속
BpeTrainer

생성자

BpeTrainer()

기본값을 사용하여 새 BpeTrainer 개체를 생성합니다.

BpeTrainer(IEnumerable<AddedToken>, Int32, Int32, ReportProgress, Nullable<Int32>, HashSet<Char>, String, String)

새 BpeTrainer 개체를 생성합니다.

속성

ContinuingSubwordPrefix

단어의 시작이 아닌 모든 하위 단어에 사용할 접두사를 가져옵니다.

EndOfWordSuffix

단어 끝인 모든 하위 단어에 사용할 접미사를 가져옵니다.

InitialAlphabet

학습 데이터 세트에 표시되지 않더라도 초기 알파벳에 포함할 문자 목록을 가져옵니다. 문자열에 둘 이상의 문자가 포함된 경우 첫 번째 문자만 유지됩니다.

LimitAlphabet

알파벳에 유지할 최대 다른 문자를 가져옵니다.

MinFrequency

병합하기 위해 쌍에 있어야 하는 최소 빈도를 가져옵니다.

Progress

학습 중에 진행률을 보고해야 하는 경우를 설정합니다.

(다음에서 상속됨 Trainer)
SpecialTokens

모델에서 알아야 할 특수 토큰 목록을 가져옵니다.

VocabSize

모든 토큰과 알파벳을 포함하여 최종 어휘의 크기를 가져옵니다.

메서드

Feed(IEnumerable<String>, Func<String,IEnumerable<String>>)

입력 시퀀스를 처리하고 결과를 모델에 공급합니다.

Train(Model)

실제 학습을 수행하고 입력 모델을 새 어휘로 업데이트하고 데이터를 병합합니다.

적용 대상