Configurar o classificador semântico e retornar legendas nos resultados da pesquisa
A classificação semântica itera sobre um conjunto de resultados inicial, aplicando uma metodologia de classificação L2 que promove os resultados semanticamente mais relevantes para o topo da pilha. Você também pode obter legendas semânticas, com destaques sobre os termos e frases mais relevantes e respostas semânticas.
Este artigo explica como configurar um índice de pesquisa para a reclassificação semântica.
Observação
Se você tiver um código existente que chame versões de API de visualização ou anteriores, veja Migrar código de classificação semântica para obter ajuda na modificação do seu código.
Pré-requisitos
Um serviço de pesquisa em uma camada Básica ou superior, sujeito à disponibilidade de região.
Classificação semântica habilitada em seu serviço de pesquisa.
Um índice de pesquisa existente com conteúdo de rich text. A classificação semântica aplica-se a campos de cadeias de caracteres (não vetores) e funciona melhor em conteúdo informativo ou descritivo.
Selecione um cliente
Você pode especificar uma configuração semântica em índices novos ou existentes, usando qualquer uma das seguintes ferramentas e kits de desenvolvimento de software (SDKs) para adicionar uma configuração semântica:
- Portal do Azure, usando o designer de índice para adicionar uma configuração semântica.
- Visual Studio Code com o cliente REST e uma API de criação ou atualização de índice (REST).
- SDK do Azure para .NET
- SDK do Azure para Python
- SDK do Azure para Java
- SDK do Azure para JavaScript
Adicionar uma configuração semântica
Uma configuração semântica é uma seção no índice que estabelece entradas de campo para classificação semântica. Você pode adicionar ou atualizar uma configuração semântica a qualquer momento, sem a necessidade de recompilar. Se você criar várias configurações, poderá especificar um padrão. No momento da consulta, especifique uma configuração semântica em uma solicitação de consulta ou deixe em branco para usar o padrão.
Uma configuração semântica tem um nome e as seguintes propriedades:
Propriedade | Características |
---|---|
Campo de título | Uma cadeia de caracteres curta, o ideal é menos de 25 palavras. Esse campo pode ser o título de um documento, nome de um produto ou um identificador exclusivo. Se você não tiver um campo adequado, deixe em branco. |
Campos de conteúdo | Partes mais longas de texto no formato de linguagem natural, sujeitas aos limites máximos de entrada de token nos modelos de machine learning. Os exemplos comuns incluem o corpo de um documento, a descrição de um produto ou outro texto de forma livre. |
Campos de palavra-chave | Uma lista de palavras-chave, como as marcas em um documento, ou um termo descritivo, como a categoria de um item. |
Você só pode especificar um campo de título, mas pode ter quantos campos de conteúdo e palavra-chave desejar. Para o conteúdo e os campos de palavra-chave, liste os campos em ordem de prioridade, pois os campos de prioridade mais baixa podem ficar truncados.
Em todas as propriedades de configuração semântica, os campos que você atribuir devem ser:
- Atribuídos como
searchable
eretrievable
- Cadeias de caracteres do tipo
Edm.String
,Collection(Edm.String)
, subcampos da cadeia de caracteres deEdm.ComplexType
Entre no portal do Azure e navegue até um serviço de pesquisa que tenha a classificação semântica habilitada.
Em Índices no painel de navegação à esquerda, selecione um índice.
Selecione Configurações semânticas e, em seguida, selecione Adicionar configuração semântica.
Na página Nova configuração semântica, insira um nome de configuração semântica e selecione os campos a serem usados na configuração semântica. Somente campos de cadeia de caracteres pesquisáveis e recuperáveis são qualificados. Certifique-se de listar campos de conteúdo e campos de palavra-chave em ordem de prioridade.
Selecione Salvar para salvar as definições da configuração.
Selecione Salvar novamente na página de índice para salvar a configuração semântica no índice.
Próximas etapas
Teste sua configuração semântica executando uma consulta semântica.