TokenizerResult Třída
Definice
Důležité
Některé informace platí pro předběžně vydaný produkt, který se může zásadně změnit, než ho výrobce nebo autor vydá. Microsoft neposkytuje žádné záruky, výslovné ani předpokládané, týkající se zde uváděných informací.
Kódování představuje výstup tokenizátoru.
public sealed class TokenizerResult
type TokenizerResult = class
Public NotInheritable Class TokenizerResult
- Dědičnost
-
TokenizerResult
Konstruktory
TokenizerResult(String, String, IReadOnlyList<Split>, Boolean) |
Vytvořte nový objekt TokenizerResult objektu. |
Vlastnosti
Ids |
Získá seznam ID tokenů. ID jsou hlavním vstupem pro jazykový model. Jsou to indexy tokenů, číselné reprezentace, kterým LM rozumí. |
NormalizedString |
Získá normalizovanou formu původního řetězce. |
Offsets |
Získá seznam posunů. Tyto posuny umožňují rozdělit vstupní řetězec a načíst tak původní část, která vedla k vytvoření odpovídajícího tokenu. |
OffsetsMappedToOriginalString |
Získá normalizovanou formu původního řetězce. |
OriginalString |
Získá původní tokenizovaný řetězec. |
Tokens |
Získá vygenerované tokeny. Jedná se o řetězcovou reprezentaci ID. |