CustomAnalyzer interface
Permite tomar el control sobre el proceso de conversión de texto en tokens indexables o buscables. Se trata de una configuración definida por el usuario que consta de un único tokenizador predefinido y uno o varios filtros. El tokenizador es responsable de dividir el texto en tokens y de los filtros para modificar los tokens emitidos por el tokenizador.
Propiedades
char |
Lista de filtros de caracteres usados para preparar el texto de entrada antes de que el tokenizador lo procese. Por ejemplo, pueden reemplazar determinados caracteres o símbolos. Los filtros se ejecutan en el orden en que se muestran. |
name | Nombre del analizador. Solo puede contener letras, dígitos, espacios, guiones o guiones bajos, debe empezar y acabar con caracteres alfanuméricos y no puede superar los 128 caracteres. |
odatatype | Discriminador polimórfico |
token |
Lista de filtros de token usados para filtrar o modificar los tokens generados por un tokenizador. Por ejemplo, puede especificar un filtro en minúsculas que convierte todos los caracteres a minúsculas. Los filtros se ejecutan en el orden en que se muestran. |
tokenizer |
Nombre del tokenizador que se va a usar para dividir el texto continuo en una secuencia de tokens, como dividir una oración en palabras. KnownTokenizerNames es una enumeración que contiene nombres de tokenizador integrados. |
Detalles de las propiedades
charFilters
Lista de filtros de caracteres usados para preparar el texto de entrada antes de que el tokenizador lo procese. Por ejemplo, pueden reemplazar determinados caracteres o símbolos. Los filtros se ejecutan en el orden en que se muestran.
charFilters?: string[]
Valor de propiedad
string[]
name
Nombre del analizador. Solo puede contener letras, dígitos, espacios, guiones o guiones bajos, debe empezar y acabar con caracteres alfanuméricos y no puede superar los 128 caracteres.
name: string
Valor de propiedad
string
odatatype
Discriminador polimórfico
odatatype: "#Microsoft.Azure.Search.CustomAnalyzer"
Valor de propiedad
"#Microsoft.Azure.Search.CustomAnalyzer"
tokenFilters
Lista de filtros de token usados para filtrar o modificar los tokens generados por un tokenizador. Por ejemplo, puede especificar un filtro en minúsculas que convierte todos los caracteres a minúsculas. Los filtros se ejecutan en el orden en que se muestran.
tokenFilters?: string[]
Valor de propiedad
string[]
tokenizerName
Nombre del tokenizador que se va a usar para dividir el texto continuo en una secuencia de tokens, como dividir una oración en palabras. KnownTokenizerNames es una enumeración que contiene nombres de tokenizador integrados.
tokenizerName: string
Valor de propiedad
string