BpeTrainer Konstruktory
Definice
Důležité
Některé informace platí pro předběžně vydaný produkt, který se může zásadně změnit, než ho výrobce nebo autor vydá. Microsoft neposkytuje žádné záruky, výslovné ani předpokládané, týkající se zde uváděných informací.
Přetížení
BpeTrainer() |
Vytvořte nový BpeTrainer objekt pomocí výchozích hodnot. |
BpeTrainer(IEnumerable<AddedToken>, Int32, Int32, ReportProgress, Nullable<Int32>, HashSet<Char>, String, String) |
Vytvořte nový BpeTrainer objektu. |
BpeTrainer()
Vytvořte nový BpeTrainer objekt pomocí výchozích hodnot.
public BpeTrainer();
Public Sub New ()
Platí pro
BpeTrainer(IEnumerable<AddedToken>, Int32, Int32, ReportProgress, Nullable<Int32>, HashSet<Char>, String, String)
Vytvořte nový BpeTrainer objektu.
public BpeTrainer(System.Collections.Generic.IEnumerable<Microsoft.ML.Tokenizers.AddedToken>? specialTokens, int minFrequency = 0, int vocabSize = 30000, Microsoft.ML.Tokenizers.ReportProgress? progress = default, int? limitAlphabet = default, System.Collections.Generic.HashSet<char>? initialAlphabet = default, string? continuingSubwordPrefix = default, string? endOfWordSuffix = default);
new Microsoft.ML.Tokenizers.BpeTrainer : seq<Microsoft.ML.Tokenizers.AddedToken> * int * int * Microsoft.ML.Tokenizers.ReportProgress * Nullable<int> * System.Collections.Generic.HashSet<char> * string * string -> Microsoft.ML.Tokenizers.BpeTrainer
Public Sub New (specialTokens As IEnumerable(Of AddedToken), Optional minFrequency As Integer = 0, Optional vocabSize As Integer = 30000, Optional progress As ReportProgress = Nothing, Optional limitAlphabet As Nullable(Of Integer) = Nothing, Optional initialAlphabet As HashSet(Of Char) = Nothing, Optional continuingSubwordPrefix As String = Nothing, Optional endOfWordSuffix As String = Nothing)
Parametry
- specialTokens
- IEnumerable<AddedToken>
Seznam speciálních tokenů, o kterých by model měl znát.
- minFrequency
- Int32
Minimální frekvence, která by pár měla mít, aby se sloučila.
- vocabSize
- Int32
velikost konečného slovníku, včetně všech tokenů a abecedy.
- progress
- ReportProgress
Zpětné volání pro aktualizace průběhu trénování
- continuingSubwordPrefix
- String
předpona, která se má použít pro každé dílčí slovo, které není začátek slova.
- endOfWordSuffix
- String
přípona, která se má použít pro každé dílčí slovo, které je na konci slova.