CustomAnalyzer interface
可讓您控制將文字轉換成可編制索引/可搜尋標記的程式。 這是使用者定義的組態,由單一預先定義的 Tokenizer 和一或多個篩選器所組成。 Tokenizer 負責將文字分成權杖,以及修改 Tokenizer 所發出的權杖的篩選準則。
屬性
char |
在權杖化程式處理輸入文字之前,用來準備輸入文字的字元篩選清單。 例如,字元篩選器可能會取代特定字元或符號。 篩選準則會依列出的循序執行。 |
name | 分析器的名稱。 名稱必須包含字母、數字、空格、虛線或底線,同時開頭必須是英數字元,而且不得超過 128 個字元。 |
odatatype | 多型鑒別子 |
token |
用來篩選或修改 Tokenizer 所產生的權杖篩選清單。 例如,您可以指定小寫篩選器,將所有字元轉換成小寫。 篩選準則會依列出的循序執行。 |
tokenizer |
用來將連續文字分割成一連串標記的 Tokenizer 名稱,例如將句子分成單字。 KnownTokenizerNames 是包含內建 Tokenizer 名稱的列舉。 |
屬性詳細資料
charFilters
在權杖化程式處理輸入文字之前,用來準備輸入文字的字元篩選清單。 例如,字元篩選器可能會取代特定字元或符號。 篩選準則會依列出的循序執行。
charFilters?: string[]
屬性值
string[]
name
分析器的名稱。 名稱必須包含字母、數字、空格、虛線或底線,同時開頭必須是英數字元,而且不得超過 128 個字元。
name: string
屬性值
string
odatatype
多型鑒別子
odatatype: "#Microsoft.Azure.Search.CustomAnalyzer"
屬性值
"#Microsoft.Azure.Search.CustomAnalyzer"
tokenFilters
用來篩選或修改 Tokenizer 所產生的權杖篩選清單。 例如,您可以指定小寫篩選器,將所有字元轉換成小寫。 篩選準則會依列出的循序執行。
tokenFilters?: string[]
屬性值
string[]
tokenizerName
用來將連續文字分割成一連串標記的 Tokenizer 名稱,例如將句子分成單字。 KnownTokenizerNames 是包含內建 Tokenizer 名稱的列舉。
tokenizerName: string
屬性值
string