MicrosoftLanguageStemmingTokenizer Constructores
Definición
Importante
Parte de la información hace referencia a la versión preliminar del producto, que puede haberse modificado sustancialmente antes de lanzar la versión definitiva. Microsoft no otorga ninguna garantía, explícita o implícita, con respecto a la información proporcionada aquí.
Sobrecargas
MicrosoftLanguageStemmingTokenizer() |
Inicializa una nueva instancia de la clase MicrosoftLanguageStemmingTokenizer. |
MicrosoftLanguageStemmingTokenizer(String, Nullable<Int32>, Nullable<Boolean>, Nullable<MicrosoftStemmingTokenizerLanguage>) |
Inicializa una nueva instancia de la clase MicrosoftLanguageStemmingTokenizer. |
MicrosoftLanguageStemmingTokenizer()
Inicializa una nueva instancia de la clase MicrosoftLanguageStemmingTokenizer.
public MicrosoftLanguageStemmingTokenizer ();
Public Sub New ()
Se aplica a
MicrosoftLanguageStemmingTokenizer(String, Nullable<Int32>, Nullable<Boolean>, Nullable<MicrosoftStemmingTokenizerLanguage>)
Inicializa una nueva instancia de la clase MicrosoftLanguageStemmingTokenizer.
public MicrosoftLanguageStemmingTokenizer (string name, int? maxTokenLength = default, bool? isSearchTokenizer = default, Microsoft.Azure.Search.Models.MicrosoftStemmingTokenizerLanguage? language = default);
new Microsoft.Azure.Search.Models.MicrosoftLanguageStemmingTokenizer : string * Nullable<int> * Nullable<bool> * Nullable<Microsoft.Azure.Search.Models.MicrosoftStemmingTokenizerLanguage> -> Microsoft.Azure.Search.Models.MicrosoftLanguageStemmingTokenizer
Public Sub New (name As String, Optional maxTokenLength As Nullable(Of Integer) = Nothing, Optional isSearchTokenizer As Nullable(Of Boolean) = Nothing, Optional language As Nullable(Of MicrosoftStemmingTokenizerLanguage) = Nothing)
Parámetros
- name
- String
Nombre del tokenizador. Solo puede contener letras, dígitos, espacios, guiones o guiones bajos, debe empezar y acabar con caracteres alfanuméricos y no puede superar los 128 caracteres.
Longitud máxima del token. Los tokens que sobrepasen la longitud máxima se dividen. La longitud máxima del token que se puede usar es 300 caracteres. Los tokens de más de 300 caracteres se dividen primero en tokens de longitud 300 y, a continuación, cada uno de esos tokens se divide en función del conjunto de longitud máxima del token. El valor predeterminado es 255.
Valor que indica cómo se usa el tokenizador. Se establece en true si se usa como tokenizador de búsqueda, se establece en false si se usa como tokenizador de indexación. El valor predeterminado es False.
- language
- Nullable<MicrosoftStemmingTokenizerLanguage>
Idioma que se va a usar. El valor predeterminado es inglés. Entre los valores posibles se incluyen: 'árabe', 'bangla', 'búlgaro', 'catalán', 'croata', 'checo', 'danés', 'neerlandés', 'inglés', 'estonian', 'finés', 'francés', 'alemán', 'griego', 'gujarati', 'hebreo', 'hindi', 'húngaro', 'islandés', 'islandés', 'indonesia', 'italiano', 'kannada', 'letón', 'lituano', 'malay', 'malayalam', 'marathi', 'norwegianBokmaal', 'polaco', 'portugués', 'portuguésBrazilian', 'punjabi', 'rumano', 'ruso', 'serbianCyrillic', 'serbianLatin', 'eslovaco', 'esloveno', 'español', 'sueco', 'hindi', 'telugu', 'turco', 'ucrania', 'urdu'
Se aplica a
Azure SDK for .NET