PatternAnalyzer interface
Scheidt tekst flexibel in termen via een normaal expressiepatroon. Deze analyse wordt geïmplementeerd met behulp van Apache Lucene.
Eigenschappen
flags | Reguliere expressievlagmen. Mogelijke waarden zijn: 'CANON_EQ', 'CASE_INSENSITIVE', 'OPMERKINGEN', 'DOTALL', 'LETTERLIJK', 'MULTILINE', 'UNICODE_CASE', 'UNIX_LINES' |
lower |
Een waarde die aangeeft of termen in kleine letters moeten worden gebruikt. De standaardwaarde is waar. Standaardwaarde: true. |
name | De naam van de analyse. Deze mag alleen letters, cijfers, spaties, streepjes of onderstrepingstekens bevatten, mag alleen beginnen en eindigen met alfanumerieke tekens en mag maximaal 128 tekens bevatten. |
odatatype | Polymorf discriminator |
pattern | Een patroon voor reguliere expressies dat overeenkomt met tokenscheidingstekens. Standaard is een expressie die overeenkomt met een of meer witruimtetekens. Standaardwaarde: |
stopwords | Een lijst met stopwoorden. |
Eigenschapdetails
flags
Reguliere expressievlagmen. Mogelijke waarden zijn: 'CANON_EQ', 'CASE_INSENSITIVE', 'OPMERKINGEN', 'DOTALL', 'LETTERLIJK', 'MULTILINE', 'UNICODE_CASE', 'UNIX_LINES'
flags?: ("CANON_EQ" | "CASE_INSENSITIVE" | "COMMENTS" | "DOTALL" | "LITERAL" | "MULTILINE" | "UNICODE_CASE" | "UNIX_LINES")[]
Waarde van eigenschap
("CANON_EQ" | "CASE_INSENSITIVE" | "COMMENTS" | "DOTALL" | "LITERAL" | "MULTILINE" | "UNICODE_CASE" | "UNIX_LINES")[]
lowerCaseTerms
Een waarde die aangeeft of termen in kleine letters moeten worden gebruikt. De standaardwaarde is waar. Standaardwaarde: true.
lowerCaseTerms?: boolean
Waarde van eigenschap
boolean
name
De naam van de analyse. Deze mag alleen letters, cijfers, spaties, streepjes of onderstrepingstekens bevatten, mag alleen beginnen en eindigen met alfanumerieke tekens en mag maximaal 128 tekens bevatten.
name: string
Waarde van eigenschap
string
odatatype
Polymorf discriminator
odatatype: "#Microsoft.Azure.Search.PatternAnalyzer"
Waarde van eigenschap
"#Microsoft.Azure.Search.PatternAnalyzer"
pattern
Een patroon voor reguliere expressies dat overeenkomt met tokenscheidingstekens. Standaard is een expressie die overeenkomt met een of meer witruimtetekens. Standaardwaarde: \W+
.
pattern?: string
Waarde van eigenschap
string
stopwords
Een lijst met stopwoorden.
stopwords?: string[]
Waarde van eigenschap
string[]