Partilhar via


Configurar classificadores semânticos e legendas de retorno nos resultados da pesquisa

A classificação semântica itera sobre um conjunto de resultados inicial, aplicando uma metodologia de classificação L2 que promove os resultados semanticamente mais relevantes para o topo da pilha. Você também pode obter legendas semânticas, com destaques sobre os termos e frases mais relevantes, e respostas semânticas.

Este artigo explica como configurar um índice de pesquisa para reclassificação semântica.

Nota

Se você tiver um código existente que chame a visualização ou versões anteriores da API, consulte Migrar código de classificação semântica para obter ajuda com a modificação do código.

Pré-requisitos

  • Um serviço de pesquisa em um nível Básico ou superior, sujeito à disponibilidade da região.

  • Classificador semântico ativado no seu serviço de pesquisa.

  • Um índice de pesquisa existente com conteúdo rich text. A classificação semântica aplica-se a campos de cadeia de caracteres (não vetoriais) e funciona melhor em conteúdo informativo ou descritivo.

Escolha um cliente

Você pode especificar uma configuração semântica em índices novos ou existentes, usando qualquer uma das seguintes ferramentas e kits de desenvolvimento de software (SDKs) para adicionar uma configuração semântica:

Adicionar uma configuração semântica

Uma configuração semântica é uma seção em seu índice que estabelece entradas de campo para classificação semântica. Você pode adicionar ou atualizar uma configuração semântica a qualquer momento, sem necessidade de reconstrução. Se você criar várias configurações, poderá especificar um padrão. No momento da consulta, especifique uma configuração semântica em uma solicitação de consulta ou deixe-a em branco para usar o padrão.

Uma configuração semântica tem um nome e as seguintes propriedades:

Property Características
Campo Título Uma corda curta, idealmente com menos de 25 palavras. Este campo pode ser o título de um documento, o nome de um produto ou um identificador único. Se não tiver um campo adequado, deixe-o em branco.
Campos de conteúdo Blocos mais longos de texto em linguagem natural, sujeitos a limites máximos de entrada de token nos modelos de aprendizado de máquina. Exemplos comuns incluem o corpo de um documento, a descrição de um produto ou outro texto de forma livre.
Campos de palavras-chave Uma lista de palavras-chave, como as tags em um documento, ou um termo descritivo, como a categoria de um item.

Você só pode especificar um campo de título, mas pode ter quantos campos de conteúdo e palavra-chave quiser. Para campos de conteúdo e palavra-chave, liste os campos em ordem de prioridade porque os campos de prioridade mais baixa podem ficar truncados.

Em todas as propriedades de configuração semântica, os campos atribuídos devem ser:

  • Atribuído como searchable e retrievable
  • Strings do tipo Edm.String, Collection(Edm.String), subcampos de string de Edm.ComplexType
  1. Entre no portal do Azure e navegue até um serviço de pesquisa que tenha a classificação semântica habilitada.

  2. Em Índices no painel de navegação esquerdo, selecione um índice.

  3. Selecione Configurações semânticas e, em seguida, selecione Adicionar configuração semântica.

    Captura de ecrã que mostra a opção para adicionar uma configuração semântica no portal do Azure.

  4. Na página Nova configuração semântica, insira um nome de configuração semântica e selecione os campos a serem usados na configuração semântica. Apenas campos de string pesquisáveis e recuperáveis são elegíveis. Certifique-se de listar campos de conteúdo e campos de palavras-chave em ordem de prioridade.

    Captura de tela que mostra como criar uma configuração semântica no portal do Azure.

  5. Selecione Salvar para salvar as definições de configuração.

  6. Selecione Salvar novamente na página de índice para salvar a configuração semântica no índice.

Próximos passos

Teste sua configuração semântica executando uma consulta semântica.