Partager via


NGramTokenizer interface

Génère des jetons à partir de l’entrée en n-grammes d’une ou plusieurs tailles données. Ce générateur de jetons est implémenté à l’aide d’Apache Lucene.

Extends

Propriétés

maxGram

Longueur maximale de n-grammes. La valeur par défaut est 2. La valeur maximale est de 300.

minGram

Longueur minimale de n-grammes. 1 constitue la valeur par défaut. La valeur maximale est de 300. Doit être inférieure à la valeur de maxGram.

odatatype

Discriminateur polymorphe, qui spécifie les différents types que cet objet peut être

tokenChars

Classes de caractères à conserver dans les jetons.

Propriétés héritées

name

Nom du générateur de jetons. Il doit contenir uniquement des lettres, des chiffres, des espaces, des tirets ou des traits de soulignement. Il doit commencer et se terminer uniquement par des caractères alphanumériques, et ne doit pas dépasser 128 caractères.

Détails de la propriété

maxGram

Longueur maximale de n-grammes. La valeur par défaut est 2. La valeur maximale est de 300.

maxGram?: number

Valeur de propriété

number

minGram

Longueur minimale de n-grammes. 1 constitue la valeur par défaut. La valeur maximale est de 300. Doit être inférieure à la valeur de maxGram.

minGram?: number

Valeur de propriété

number

odatatype

Discriminateur polymorphe, qui spécifie les différents types que cet objet peut être

odatatype: "#Microsoft.Azure.Search.NGramTokenizer"

Valeur de propriété

"#Microsoft.Azure.Search.NGramTokenizer"

tokenChars

Classes de caractères à conserver dans les jetons.

tokenChars?: TokenCharacterKind[]

Valeur de propriété

Détails de la propriété héritée

name

Nom du générateur de jetons. Il doit contenir uniquement des lettres, des chiffres, des espaces, des tirets ou des traits de soulignement. Il doit commencer et se terminer uniquement par des caractères alphanumériques, et ne doit pas dépasser 128 caractères.

name: string

Valeur de propriété

string

Hérité deBaseLexicalTokenizer.name