EnglishRoberta Clase
Definición
Importante
Parte de la información hace referencia a la versión preliminar del producto, que puede haberse modificado sustancialmente antes de lanzar la versión definitiva. Microsoft no otorga ninguna garantía, explícita o implícita, con respecto a la información proporcionada aquí.
Representa el modelo de codificación de par de bytes.
public sealed class EnglishRoberta : Microsoft.ML.Tokenizers.Model
type EnglishRoberta = class
inherit Model
Public NotInheritable Class EnglishRoberta
Inherits Model
- Herencia
Constructores
EnglishRoberta(Stream, Stream, Stream) |
Construya el objeto tokenizer para usarlo con el modelo robert inglés. |
EnglishRoberta(String, String, String) |
Construya el objeto tokenizer para usarlo con el modelo robert inglés. |
Propiedades
PadIndex |
Obtiene el índice del símbolo del panel dentro de la lista de símbolos. |
SymbolsCount |
Obtiene la longitud de la lista de símbolos. |
Métodos
AddMaskSymbol(String) |
Agregue el símbolo de máscara a la lista de símbolos. |
GetTrainer() |
Obtiene un objeto instructor que se va a usar en el entrenamiento del modelo y genera el vocabulario y combina los datos. |
GetVocab() |
Obtiene los tokens de asignación de diccionarios a identificadores. |
GetVocabSize() |
Obtiene el tamaño del diccionario que asigna tokens a Identificadores. |
IdsToOccurrenceRanks(IReadOnlyList<Int32>) |
Convierta una lista de identificadores de tokens en clasificaciones de repeticiones más altas. |
IdsToOccurrenceValues(IReadOnlyList<Int32>) |
Convierta una lista de identificadores de tokens en valores de repetición más altos. |
IdToString(Int32, Boolean) |
Asigne el identificador tokenizado a la cadena original. |
IdToToken(Int32, Boolean) |
Asigne el identificador tokenizado al token. |
IsValidChar(Char) |
Representa el modelo de codificación de par de bytes. |
OccurrenceRanksIds(IReadOnlyList<Int32>) |
Convierta una lista de clasificaciones de repeticiones más altas en la lista de identificadores de tokens . |
Save(String, String) |
Guarde los datos del modelo en los archivos de asignación de vocabulario, combinaciones y repeticiones. |
Tokenize(String) |
Tokenice una cadena de secuencia en una lista de tokens. |
TokenToId(String) |
Asigne el token al identificador tokenizado. |