Compartir a través de


EnglishRoberta Clase

Definición

Representa el modelo de codificación de par de bytes.

public sealed class EnglishRoberta : Microsoft.ML.Tokenizers.Model
type EnglishRoberta = class
    inherit Model
Public NotInheritable Class EnglishRoberta
Inherits Model
Herencia
EnglishRoberta

Constructores

EnglishRoberta(Stream, Stream, Stream)

Construya el objeto tokenizer para usarlo con el modelo robert inglés.

EnglishRoberta(String, String, String)

Construya el objeto tokenizer para usarlo con el modelo robert inglés.

Propiedades

PadIndex

Obtiene el índice del símbolo del panel dentro de la lista de símbolos.

SymbolsCount

Obtiene la longitud de la lista de símbolos.

Métodos

AddMaskSymbol(String)

Agregue el símbolo de máscara a la lista de símbolos.

GetTrainer()

Obtiene un objeto instructor que se va a usar en el entrenamiento del modelo y genera el vocabulario y combina los datos.

GetVocab()

Obtiene los tokens de asignación de diccionarios a identificadores.

GetVocabSize()

Obtiene el tamaño del diccionario que asigna tokens a Identificadores.

IdsToOccurrenceRanks(IReadOnlyList<Int32>)

Convierta una lista de identificadores de tokens en clasificaciones de repeticiones más altas.

IdsToOccurrenceValues(IReadOnlyList<Int32>)

Convierta una lista de identificadores de tokens en valores de repetición más altos.

IdToString(Int32, Boolean)

Asigne el identificador tokenizado a la cadena original.

IdToToken(Int32, Boolean)

Asigne el identificador tokenizado al token.

IsValidChar(Char)

Representa el modelo de codificación de par de bytes.

OccurrenceRanksIds(IReadOnlyList<Int32>)

Convierta una lista de clasificaciones de repeticiones más altas en la lista de identificadores de tokens .

Save(String, String)

Guarde los datos del modelo en los archivos de asignación de vocabulario, combinaciones y repeticiones.

Tokenize(String)

Tokenice una cadena de secuencia en una lista de tokens.

TokenToId(String)

Asigne el token al identificador tokenizado.

Se aplica a