EdgeNGramTokenizer interface
Tokenise l’entrée d’un bord en n-grammes de la ou des tailles données. Ce générateur de jetons est implémenté à l’aide d’Apache Lucene.
- Extends
Propriétés
max |
Longueur maximale de n-grammes. La valeur par défaut est 2. La valeur maximale est de 300. |
min |
Longueur minimale de n-grammes. 1 constitue la valeur par défaut. La valeur maximale est de 300. Doit être inférieure à la valeur de maxGram. |
odatatype | Discriminateur polymorphe, qui spécifie les différents types que cet objet peut être |
token |
Classes de caractères à conserver dans les jetons. |
Propriétés héritées
name | Nom du générateur de jetons. Il doit contenir uniquement des lettres, des chiffres, des espaces, des tirets ou des traits de soulignement. Il doit commencer et se terminer uniquement par des caractères alphanumériques, et ne doit pas dépasser 128 caractères. |
Détails de la propriété
maxGram
Longueur maximale de n-grammes. La valeur par défaut est 2. La valeur maximale est de 300.
maxGram?: number
Valeur de propriété
number
minGram
Longueur minimale de n-grammes. 1 constitue la valeur par défaut. La valeur maximale est de 300. Doit être inférieure à la valeur de maxGram.
minGram?: number
Valeur de propriété
number
odatatype
Discriminateur polymorphe, qui spécifie les différents types que cet objet peut être
odatatype: "#Microsoft.Azure.Search.EdgeNGramTokenizer"
Valeur de propriété
"#Microsoft.Azure.Search.EdgeNGramTokenizer"
tokenChars
Classes de caractères à conserver dans les jetons.
tokenChars?: TokenCharacterKind[]
Valeur de propriété
Détails de la propriété héritée
name
Nom du générateur de jetons. Il doit contenir uniquement des lettres, des chiffres, des espaces, des tirets ou des traits de soulignement. Il doit commencer et se terminer uniquement par des caractères alphanumériques, et ne doit pas dépasser 128 caractères.
name: string
Valeur de propriété
string
Hérité deBaseLexicalTokenizer.name