MicrosoftLanguageStemmingTokenizer interface

Reference

Balíček:: @azure/search-documents

Rozdělí text pomocí pravidel specifických pro jazyk a zmenšuje slova na jejich základní formuláře.

Extends: BaseLexicalTokenizer

Vlastnosti

isSearchTokenizer	Hodnota označující způsob použití tokenizátoru. Pokud se používá jako tokenizátor vyhledávání, nastavte hodnotu false, pokud se používá jako tokenizátor indexování. Výchozí hodnota je false.
language	Jazyk, který se má použít. Výchozí hodnota je angličtina.
maxTokenLength	Maximální délka tokenu. Tokeny delší než maximální délka jsou rozdělené. Maximální délka tokenu, kterou lze použít, je 300 znaků. Tokeny delší než 300 znaků se nejprve rozdělí na tokeny o délce 300 a pak se každý z těchto tokenů rozdělí na základě nastavené maximální délky tokenu. Výchozí hodnota je 255.
odatatype	Polymorfní diskriminátor, který určuje různé typy tohoto objektu

Zděděné vlastnosti

name	Název tokenizátoru. Musí obsahovat pouze písmena, číslice, mezery, pomlčky nebo podtržítka, může začínat a končit alfanumerickými znaky a je omezena na 128 znaků.

Podrobnosti vlastnosti

isSearchTokenizer

Hodnota označující způsob použití tokenizátoru. Pokud se používá jako tokenizátor vyhledávání, nastavte hodnotu false, pokud se používá jako tokenizátor indexování. Výchozí hodnota je false.

isSearchTokenizer?: boolean

Hodnota vlastnosti

boolean

language

Jazyk, který se má použít. Výchozí hodnota je angličtina.

language?: MicrosoftStemmingTokenizerLanguage

Hodnota vlastnosti

MicrosoftStemmingTokenizerLanguage

maxTokenLength

Maximální délka tokenu. Tokeny delší než maximální délka jsou rozdělené. Maximální délka tokenu, kterou lze použít, je 300 znaků. Tokeny delší než 300 znaků se nejprve rozdělí na tokeny o délce 300 a pak se každý z těchto tokenů rozdělí na základě nastavené maximální délky tokenu. Výchozí hodnota je 255.

maxTokenLength?: number

Hodnota vlastnosti

number

odatatype

Polymorfní diskriminátor, který určuje různé typy tohoto objektu

odatatype: "#Microsoft.Azure.Search.MicrosoftLanguageStemmingTokenizer"

Hodnota vlastnosti

"#Microsoft.Azure.Search.MicrosoftLanguageStemmingTokenizer"

Podrobnosti zděděných vlastností

name

Název tokenizátoru. Musí obsahovat pouze písmena, číslice, mezery, pomlčky nebo podtržítka, může začínat a končit alfanumerickými znaky a je omezena na 128 znaků.

name: string

Hodnota vlastnosti

string

zděděno zeBaseLexicalTokenizer.name

Sdílet prostřednictvím

MicrosoftLanguageStemmingTokenizer interface

Vlastnosti

Zděděné vlastnosti

Podrobnosti vlastnosti

isSearchTokenizer

Hodnota vlastnosti

language

Hodnota vlastnosti

maxTokenLength

Hodnota vlastnosti

odatatype

Hodnota vlastnosti

Podrobnosti zděděných vlastností

name

Hodnota vlastnosti

Další materiály