MicrosoftLanguageTokenizer interface

Referentie

Pakket:: @azure/search-documents

Verdeelt tekst met taalspecifieke regels.

Uitbreiding: BaseLexicalTokenizer

Eigenschappen

isSearchTokenizer	Een waarde die aangeeft hoe de tokenizer wordt gebruikt. Ingesteld op true als deze wordt gebruikt als de zoektokenizer, ingesteld op onwaar als deze wordt gebruikt als de indexeringstokenizer. De standaardwaarde is onwaar.
language	De taal die moet worden gebruikt. De standaardwaarde is Engels.
maxTokenLength	De maximale tokenlengte. Tokens die langer zijn dan de maximale lengte, worden gesplitst. De maximale tokenlengte die kan worden gebruikt, is 300 tekens. Tokens die langer zijn dan 300 tekens worden eerst gesplitst in tokens van lengte 300 en vervolgens wordt elk van deze tokens gesplitst op basis van de maximale lengte van het token. De standaardwaarde is 255.
odatatype	Polymorf discriminator, waarmee de verschillende typen dit object kunnen worden opgegeven

Overgenomen eigenschappen

name	De naam van de tokenizer. Deze mag alleen letters, cijfers, spaties, streepjes of onderstrepingstekens bevatten, mag alleen beginnen en eindigen met alfanumerieke tekens en mag maximaal 128 tekens bevatten.

Eigenschapdetails

isSearchTokenizer

Een waarde die aangeeft hoe de tokenizer wordt gebruikt. Ingesteld op true als deze wordt gebruikt als de zoektokenizer, ingesteld op onwaar als deze wordt gebruikt als de indexeringstokenizer. De standaardwaarde is onwaar.

isSearchTokenizer?: boolean

Waarde van eigenschap

boolean

language

De taal die moet worden gebruikt. De standaardwaarde is Engels.

language?: MicrosoftTokenizerLanguage

Waarde van eigenschap

MicrosoftTokenizerLanguage

maxTokenLength

De maximale tokenlengte. Tokens die langer zijn dan de maximale lengte, worden gesplitst. De maximale tokenlengte die kan worden gebruikt, is 300 tekens. Tokens die langer zijn dan 300 tekens worden eerst gesplitst in tokens van lengte 300 en vervolgens wordt elk van deze tokens gesplitst op basis van de maximale lengte van het token. De standaardwaarde is 255.

maxTokenLength?: number

Waarde van eigenschap

number

odatatype

Polymorf discriminator, waarmee de verschillende typen dit object kunnen worden opgegeven

odatatype: "#Microsoft.Azure.Search.MicrosoftLanguageTokenizer"

Waarde van eigenschap

"#Microsoft.Azure.Search.MicrosoftLanguageTokenizer"

Details van overgenomen eigenschap

name

De naam van de tokenizer. Deze mag alleen letters, cijfers, spaties, streepjes of onderstrepingstekens bevatten, mag alleen beginnen en eindigen met alfanumerieke tekens en mag maximaal 128 tekens bevatten.

name: string

Waarde van eigenschap

string

overgenomen vanBaseLexicalTokenizer.name

Delen via

MicrosoftLanguageTokenizer interface

Eigenschappen

Overgenomen eigenschappen

Eigenschapdetails

isSearchTokenizer

Waarde van eigenschap

language

Waarde van eigenschap

maxTokenLength

Waarde van eigenschap

odatatype

Waarde van eigenschap

Details van overgenomen eigenschap

name

Waarde van eigenschap

Aanvullende resources