MicrosoftLanguageStemmingTokenizer interface
Verdeelt tekst met behulp van taalspecifieke regels en reduceert woorden tot de basisvormen.
- Extends
Eigenschappen
is |
Een waarde die aangeeft hoe de tokenizer wordt gebruikt. Stel in op true als deze wordt gebruikt als de zoektokenizer, stel in op false als deze wordt gebruikt als de indexeringstokenizer. De standaardinstelling is onwaar. |
language | De taal die moet worden gebruikt. De standaardwaarde is Engels. |
max |
De maximale tokenlengte. Tokens die langer zijn dan de maximale lengte, worden gesplitst. De maximale tokenlengte die kan worden gebruikt, is 300 tekens. Tokens die langer zijn dan 300 tekens worden eerst gesplitst in tokens met een lengte van 300 en vervolgens wordt elk van deze tokens gesplitst op basis van de ingestelde maximale tokenlengte. De standaardwaarde is 255. |
odatatype | Polymorfe discriminator, waarmee de verschillende typen dit object kunnen worden opgegeven |
Overgenomen eigenschappen
name | De naam van de tokenizer. Het mag alleen letters, cijfers, spaties, streepjes of onderstrepingstekens bevatten, mag alleen beginnen en eindigen met alfanumerieke tekens en is beperkt tot 128 tekens. |
Eigenschapdetails
isSearchTokenizer
Een waarde die aangeeft hoe de tokenizer wordt gebruikt. Stel in op true als deze wordt gebruikt als de zoektokenizer, stel in op false als deze wordt gebruikt als de indexeringstokenizer. De standaardinstelling is onwaar.
isSearchTokenizer?: boolean
Waarde van eigenschap
boolean
language
De taal die moet worden gebruikt. De standaardwaarde is Engels.
language?: MicrosoftStemmingTokenizerLanguage
Waarde van eigenschap
maxTokenLength
De maximale tokenlengte. Tokens die langer zijn dan de maximale lengte, worden gesplitst. De maximale tokenlengte die kan worden gebruikt, is 300 tekens. Tokens die langer zijn dan 300 tekens worden eerst gesplitst in tokens met een lengte van 300 en vervolgens wordt elk van deze tokens gesplitst op basis van de ingestelde maximale tokenlengte. De standaardwaarde is 255.
maxTokenLength?: number
Waarde van eigenschap
number
odatatype
Polymorfe discriminator, waarmee de verschillende typen dit object kunnen worden opgegeven
odatatype: "#Microsoft.Azure.Search.MicrosoftLanguageStemmingTokenizer"
Waarde van eigenschap
"#Microsoft.Azure.Search.MicrosoftLanguageStemmingTokenizer"
Details van overgenomen eigenschap
name
De naam van de tokenizer. Het mag alleen letters, cijfers, spaties, streepjes of onderstrepingstekens bevatten, mag alleen beginnen en eindigen met alfanumerieke tekens en is beperkt tot 128 tekens.
name: string
Waarde van eigenschap
string
Overgenomen vanBaseLexicalTokenizer.name