Condividi tramite


LuceneStandardTokenizer interface

Interrompe il testo seguendo le regole di segmentazione del testo Unicode. Questo tokenizer viene implementato tramite Apache Lucene.

Proprietà

maxTokenLength

Lunghezza massima del token. Il valore predefinito è 255. I token più lunghi della lunghezza massima vengono suddivisi. La lunghezza massima del token che può essere usata è di 300 caratteri. Valore predefinito: 255.

name

Nome del tokenizer. Deve contenere solo lettere, cifre, spazi, trattini o caratteri di sottolineatura, può iniziare e terminare solo con caratteri alfanumerici ed è limitato a 128 caratteri.

odatatype

Discriminare polimorfico

Dettagli proprietà

maxTokenLength

Lunghezza massima del token. Il valore predefinito è 255. I token più lunghi della lunghezza massima vengono suddivisi. La lunghezza massima del token che può essere usata è di 300 caratteri. Valore predefinito: 255.

maxTokenLength?: number

Valore della proprietà

number

name

Nome del tokenizer. Deve contenere solo lettere, cifre, spazi, trattini o caratteri di sottolineatura, può iniziare e terminare solo con caratteri alfanumerici ed è limitato a 128 caratteri.

name: string

Valore della proprietà

string

odatatype

Discriminare polimorfico

odatatype: "#Microsoft.Azure.Search.StandardTokenizer" | "#Microsoft.Azure.Search.StandardTokenizerV2"

Valore della proprietà

"#Microsoft.Azure.Search.StandardTokenizer" | "#Microsoft.Azure.Search.StandardTokenizerV2"