Delen via


MicrosoftLanguageStemmingTokenizer interface

Verdeelt tekst met behulp van taalspecifieke regels en reduceert woorden tot de basisvormen.

Extends

Eigenschappen

isSearchTokenizer

Een waarde die aangeeft hoe de tokenizer wordt gebruikt. Stel in op true als deze wordt gebruikt als de zoektokenizer, stel in op false als deze wordt gebruikt als de indexeringstokenizer. De standaardinstelling is onwaar.

language

De taal die moet worden gebruikt. De standaardwaarde is Engels.

maxTokenLength

De maximale tokenlengte. Tokens die langer zijn dan de maximale lengte, worden gesplitst. De maximale tokenlengte die kan worden gebruikt, is 300 tekens. Tokens die langer zijn dan 300 tekens worden eerst gesplitst in tokens met een lengte van 300 en vervolgens wordt elk van deze tokens gesplitst op basis van de ingestelde maximale tokenlengte. De standaardwaarde is 255.

odatatype

Polymorfe discriminator, waarmee de verschillende typen dit object kunnen worden opgegeven

Overgenomen eigenschappen

name

De naam van de tokenizer. Het mag alleen letters, cijfers, spaties, streepjes of onderstrepingstekens bevatten, mag alleen beginnen en eindigen met alfanumerieke tekens en is beperkt tot 128 tekens.

Eigenschapdetails

isSearchTokenizer

Een waarde die aangeeft hoe de tokenizer wordt gebruikt. Stel in op true als deze wordt gebruikt als de zoektokenizer, stel in op false als deze wordt gebruikt als de indexeringstokenizer. De standaardinstelling is onwaar.

isSearchTokenizer?: boolean

Waarde van eigenschap

boolean

language

De taal die moet worden gebruikt. De standaardwaarde is Engels.

language?: MicrosoftStemmingTokenizerLanguage

Waarde van eigenschap

maxTokenLength

De maximale tokenlengte. Tokens die langer zijn dan de maximale lengte, worden gesplitst. De maximale tokenlengte die kan worden gebruikt, is 300 tekens. Tokens die langer zijn dan 300 tekens worden eerst gesplitst in tokens met een lengte van 300 en vervolgens wordt elk van deze tokens gesplitst op basis van de ingestelde maximale tokenlengte. De standaardwaarde is 255.

maxTokenLength?: number

Waarde van eigenschap

number

odatatype

Polymorfe discriminator, waarmee de verschillende typen dit object kunnen worden opgegeven

odatatype: "#Microsoft.Azure.Search.MicrosoftLanguageStemmingTokenizer"

Waarde van eigenschap

"#Microsoft.Azure.Search.MicrosoftLanguageStemmingTokenizer"

Details van overgenomen eigenschap

name

De naam van de tokenizer. Het mag alleen letters, cijfers, spaties, streepjes of onderstrepingstekens bevatten, mag alleen beginnen en eindigen met alfanumerieke tekens en is beperkt tot 128 tekens.

name: string

Waarde van eigenschap

string

Overgenomen vanBaseLexicalTokenizer.name