MicrosoftLanguageTokenizer Klas
Verdeelt tekst met behulp van taalspecifieke regels.
Alle vereiste parameters moeten worden ingevuld om naar Azure te kunnen worden verzonden.
- Overname
-
azure.search.documents.indexes._generated.models._models_py3.LexicalTokenizerMicrosoftLanguageTokenizer
Constructor
MicrosoftLanguageTokenizer(*, name: str, max_token_length: int = 255, is_search_tokenizer: bool = False, language: str | _models.MicrosoftTokenizerLanguage | None = None, **kwargs: Any)
Keyword-Only Parameters
Name | Description |
---|---|
name
|
De naam van de tokenizer. Het mag alleen letters, cijfers, spaties, streepjes of onderstrepingstekens bevatten, mag alleen beginnen en eindigen met alfanumerieke tekens en is beperkt tot 128 tekens. Vereist. |
max_token_length
|
De maximale tokenlengte. Tokens die langer zijn dan de maximale lengte, worden gesplitst. De maximale tokenlengte die kan worden gebruikt, is 300 tekens. Tokens die langer zijn dan 300 tekens worden eerst gesplitst in tokens met een lengte van 300 en vervolgens wordt elk van deze tokens gesplitst op basis van de ingestelde maximale tokenlengte. De standaardwaarde is 255. standaardwaarde: 255
|
is_search_tokenizer
|
Een waarde die aangeeft hoe de tokenizer wordt gebruikt. Stel in op true als deze wordt gebruikt als de zoektokenizer, stel in op false als deze wordt gebruikt als de indexeringstokenizer. De standaardinstelling is onwaar. |
language
|
str of
<xref:search_service_client.models.MicrosoftTokenizerLanguage>
De taal die moet worden gebruikt. De standaardwaarde is Engels. Bekende waarden zijn: "bangla", "bulgaars", "catalaans", "chineesSimplified", "chineseTraditional", "kroatisch", "tsjechisch", "deens", "nederlands", "engels", "frans", "german", "greek", "gujarati", "hindi", "icelandic", "indonesian", "italian", "japanese", "kannada", "korean", "malay", "malayalam", "marathi", "norwegianBokmaal", "polish", "portuguese", "portugueseBrazilian", "punjabi", "romanian", "russian", "serbianCyrillic", "serbianLatin", "slovenian", "spanish", "swedish", "tamil", "telugu", " thai", "oekraïens", "urdu" en "vietnamees". |
Variabelen
Name | Description |
---|---|
odata_type
|
Een URI-fragment dat het type tokenizer aangeeft. Vereist. |
name
|
De naam van de tokenizer. Het mag alleen letters, cijfers, spaties, streepjes of onderstrepingstekens bevatten, mag alleen beginnen en eindigen met alfanumerieke tekens en is beperkt tot 128 tekens. Vereist. |
max_token_length
|
De maximale tokenlengte. Tokens die langer zijn dan de maximale lengte, worden gesplitst. De maximale tokenlengte die kan worden gebruikt, is 300 tekens. Tokens die langer zijn dan 300 tekens worden eerst gesplitst in tokens met een lengte van 300 en vervolgens wordt elk van deze tokens gesplitst op basis van de ingestelde maximale tokenlengte. De standaardwaarde is 255. |
is_search_tokenizer
|
Een waarde die aangeeft hoe de tokenizer wordt gebruikt. Stel in op true als deze wordt gebruikt als de zoektokenizer, stel in op false als deze wordt gebruikt als de indexeringstokenizer. De standaardinstelling is onwaar. |
language
|
str of
<xref:search_service_client.models.MicrosoftTokenizerLanguage>
De taal die moet worden gebruikt. De standaardwaarde is Engels. Bekende waarden zijn: "bangla", "bulgaars", "catalaans", "chineesSimplified", "chineseTraditional", "kroatisch", "tsjechisch", "deens", "nederlands", "engels", "frans", "german", "greek", "gujarati", "hindi", "icelandic", "indonesian", "italian", "japanese", "kannada", "korean", "malay", "malayalam", "marathi", "norwegianBokmaal", "polish", "portuguese", "portugueseBrazilian", "punjabi", "romanian", "russian", "serbianCyrillic", "serbianLatin", "slovenian", "spanish", "swedish", "tamil", "telugu", " thai", "oekraïens", "urdu" en "vietnamees". |
Methoden
as_dict |
Een dict retourneren dat kan worden geserialiseerd met behulp van json.dump. Geavanceerd gebruik kan desgewenst een callback gebruiken als parameter: Sleutel is de kenmerknaam die wordt gebruikt in Python. Attr_desc is een dict van metagegevens. Bevat momenteel 'type' met het msrest-type en 'key' met de restAPI-gecodeerde sleutel. Waarde is de huidige waarde in dit object. De geretourneerde tekenreeks wordt gebruikt om de sleutel te serialiseren. Als het retourtype een lijst is, wordt dit beschouwd als hiërarchisch resultaatdicteren. Bekijk de drie voorbeelden in dit bestand:
Als u XML-serialisatie wilt, kunt u de kwargs is_xml=True doorgeven. |
deserialize |
Parseert een str met behulp van de RestAPI-syntaxis en retourneert een model. |
enable_additional_properties_sending | |
from_dict |
Een dict parseren met behulp van de opgegeven sleutelextractor retourneert een model. Houd standaard rekening met sleutelextracties (rest_key_case_insensitive_extractor, attribute_key_case_insensitive_extractor en last_rest_key_case_insensitive_extractor) |
is_xml_model | |
serialize |
Retourneert de JSON die vanuit dit model naar de server wordt verzonden. Dit is een alias voor as_dict(full_restapi_key_transformer, keep_readonly=False). Als u XML-serialisatie wilt, kunt u de kwargs is_xml=True doorgeven. |
as_dict
Een dict retourneren dat kan worden geserialiseerd met behulp van json.dump.
Geavanceerd gebruik kan desgewenst een callback gebruiken als parameter:
Sleutel is de kenmerknaam die wordt gebruikt in Python. Attr_desc is een dict van metagegevens. Bevat momenteel 'type' met het msrest-type en 'key' met de restAPI-gecodeerde sleutel. Waarde is de huidige waarde in dit object.
De geretourneerde tekenreeks wordt gebruikt om de sleutel te serialiseren. Als het retourtype een lijst is, wordt dit beschouwd als hiërarchisch resultaatdicteren.
Bekijk de drie voorbeelden in dit bestand:
attribute_transformer
full_restapi_key_transformer
last_restapi_key_transformer
Als u XML-serialisatie wilt, kunt u de kwargs is_xml=True doorgeven.
as_dict(keep_readonly: bool = True, key_transformer: ~typing.Callable[[str, ~typing.Dict[str, ~typing.Any], ~typing.Any], ~typing.Any] = <function attribute_transformer>, **kwargs: ~typing.Any) -> MutableMapping[str, Any]
Parameters
Name | Description |
---|---|
key_transformer
|
<xref:function>
Een sleuteltransformatorfunctie. |
keep_readonly
|
standaardwaarde: True
|
Retouren
Type | Description |
---|---|
Een dict JSON-compatibel object |
deserialize
Parseert een str met behulp van de RestAPI-syntaxis en retourneert een model.
deserialize(data: Any, content_type: str | None = None) -> ModelType
Parameters
Name | Description |
---|---|
data
Vereist
|
Een str met behulp van restAPI-structuur. JSON standaard. |
content_type
|
JSON standaard: stel application/xml in als XML. standaardwaarde: None
|
Retouren
Type | Description |
---|---|
Een exemplaar van dit model |
Uitzonderingen
Type | Description |
---|---|
DeserializationError if something went wrong
|
enable_additional_properties_sending
enable_additional_properties_sending() -> None
from_dict
Een dict parseren met behulp van de opgegeven sleutelextractor retourneert een model.
Houd standaard rekening met sleutelextracties (rest_key_case_insensitive_extractor, attribute_key_case_insensitive_extractor en last_rest_key_case_insensitive_extractor)
from_dict(data: Any, key_extractors: Callable[[str, Dict[str, Any], Any], Any] | None = None, content_type: str | None = None) -> ModelType
Parameters
Name | Description |
---|---|
data
Vereist
|
Een dict met behulp van de RestAPI-structuur |
content_type
|
JSON standaard: stel application/xml in als XML. standaardwaarde: None
|
key_extractors
|
standaardwaarde: None
|
Retouren
Type | Description |
---|---|
Een exemplaar van dit model |
Uitzonderingen
Type | Description |
---|---|
DeserializationError if something went wrong
|
is_xml_model
is_xml_model() -> bool
serialize
Retourneert de JSON die vanuit dit model naar de server wordt verzonden.
Dit is een alias voor as_dict(full_restapi_key_transformer, keep_readonly=False).
Als u XML-serialisatie wilt, kunt u de kwargs is_xml=True doorgeven.
serialize(keep_readonly: bool = False, **kwargs: Any) -> MutableMapping[str, Any]
Parameters
Name | Description |
---|---|
keep_readonly
|
Als u de alleen-lezen kenmerken wilt serialiseren standaardwaarde: False
|
Retouren
Type | Description |
---|---|
Een dict JSON-compatibel object |
Azure SDK for Python