Compartilhar via


Configurar o classificador semântico e retornar legendas nos resultados da pesquisa

A classificação semântica itera sobre um conjunto de resultados inicial, aplicando uma metodologia de classificação L2 que promove os resultados semanticamente mais relevantes para o topo da pilha. Você também pode obter legendas semânticas, com destaques sobre os termos e frases mais relevantes e respostas semânticas.

Este artigo explica como configurar um índice de pesquisa para a reclassificação semântica.

Observação

Se você tiver um código existente que chame versões de API de visualização ou anteriores, veja Migrar código de classificação semântica para obter ajuda na modificação do seu código.

Pré-requisitos

  • Um serviço de pesquisa em uma camada Básica ou superior, sujeito à disponibilidade de região.

  • Classificação semântica habilitada em seu serviço de pesquisa.

  • Um índice de pesquisa existente com conteúdo de rich text. A classificação semântica aplica-se a campos de cadeias de caracteres (não vetores) e funciona melhor em conteúdo informativo ou descritivo.

Selecione um cliente

Você pode especificar uma configuração semântica em índices novos ou existentes, usando qualquer uma das seguintes ferramentas e kits de desenvolvimento de software (SDKs) para adicionar uma configuração semântica:

Adicionar uma configuração semântica

Uma configuração semântica é uma seção no índice que estabelece entradas de campo para classificação semântica. Você pode adicionar ou atualizar uma configuração semântica a qualquer momento, sem a necessidade de recompilar. Se você criar várias configurações, poderá especificar um padrão. No momento da consulta, especifique uma configuração semântica em uma solicitação de consulta ou deixe em branco para usar o padrão.

Uma configuração semântica tem um nome e as seguintes propriedades:

Propriedade Características
Campo de título Uma cadeia de caracteres curta, o ideal é menos de 25 palavras. Esse campo pode ser o título de um documento, nome de um produto ou um identificador exclusivo. Se você não tiver um campo adequado, deixe em branco.
Campos de conteúdo Partes mais longas de texto no formato de linguagem natural, sujeitas aos limites máximos de entrada de token nos modelos de machine learning. Os exemplos comuns incluem o corpo de um documento, a descrição de um produto ou outro texto de forma livre.
Campos de palavra-chave Uma lista de palavras-chave, como as marcas em um documento, ou um termo descritivo, como a categoria de um item.

Você só pode especificar um campo de título, mas pode ter quantos campos de conteúdo e palavra-chave desejar. Para o conteúdo e os campos de palavra-chave, liste os campos em ordem de prioridade, pois os campos de prioridade mais baixa podem ficar truncados.

Em todas as propriedades de configuração semântica, os campos que você atribuir devem ser:

  • Atribuídos como searchable e retrievable
  • Cadeias de caracteres do tipo Edm.String, Collection(Edm.String), subcampos da cadeia de caracteres de Edm.ComplexType
  1. Entre no portal do Azure e navegue até um serviço de pesquisa que tenha a classificação semântica habilitada.

  2. Em Índices no painel de navegação à esquerda, selecione um índice.

  3. Selecione Configurações semânticas e, em seguida, selecione Adicionar configuração semântica.

    Captura de tela que mostra a opção para adicionar uma configuração semântica no portal do Azure.

  4. Na página Nova configuração semântica, insira um nome de configuração semântica e selecione os campos a serem usados na configuração semântica. Somente campos de cadeia de caracteres pesquisáveis e recuperáveis são qualificados. Certifique-se de listar campos de conteúdo e campos de palavra-chave em ordem de prioridade.

    Captura de tela que mostra como criar uma configuração semântica no portal do Azure.

  5. Selecione Salvar para salvar as definições da configuração.

  6. Selecione Salvar novamente na página de índice para salvar a configuração semântica no índice.

Próximas etapas

Teste sua configuração semântica executando uma consulta semântica.