O que é ranking semântico?
A classificação semântica é um recurso dentro da Pesquisa de IA do Azure que visa melhorar a classificação dos resultados da pesquisa. A classificação semântica melhora a classificação dos resultados da pesquisa usando a compreensão do idioma para corresponder com mais precisão ao contexto da consulta original.
Função de classificação BM25
O Azure AI Search usa a função de classificação BM25, por padrão. A função de classificação BM25 classifica os resultados da pesquisa com base na frequência com que o termo de pesquisa aparece num documento. A função de classificação BM25 muitas vezes alcança excelentes resultados de classificação, porque um documento que frequentemente inclui um termo de pesquisa é muitas vezes o mais relevante, no entanto, este nem sempre é o caso. A classificação BM25 não coloca qualquer relevância na semântica da consulta e, por vezes, a classificação pode ser melhorada adicionando compreensão linguística.
Classificação semântica
A classificação semântica tem duas funções; Melhora a classificação dos resultados da consulta com base na compreensão da linguagem e melhora a resposta à consulta fornecendo legendas e respostas nos resultados.
A classificação semântica usa a classificação BM25 e calcula uma nova pontuação de relevância usando a classificação BM25 original combinada com modelos de compreensão de linguagem para extrair o contexto e o significado da consulta.
Legendas semânticas e respostas
As legendas semânticas e as respostas fornecem resultados adicionais juntamente com os resultados de pesquisa classificados que você pode exibir para melhorar a compreensão dos resultados para os usuários.
As legendas semânticas extraem frases resumidas do documento na íntegra e destacam o texto mais relevante nas frases resumidas.
As respostas semânticas são um recurso adicional opcional da classificação semântica que fornece respostas às perguntas. Se a consulta de pesquisa parecer ser uma pergunta e os resultados da pesquisa contiverem texto que pareça ser uma resposta relevante, a resposta semântica será retornada.
Como funciona a classificação semântica
O ranking semântico leva os 50 melhores resultados dos resultados do ranking BM25. Os resultados são divididos em vários campos, conforme definido por uma configuração semântica. Os campos são convertidos em cadeias de texto e cortados para 256 tokens exclusivos. Um token é aproximadamente equivalente a uma palavra no documento.
Uma vez que as cadeias de caracteres são preparadas, elas são passadas para modelos de compreensão de leitura de máquina para encontrar as frases e frases que melhor correspondem à consulta. Os resultados desta frase de resumo são uma legenda semântica e, opcionalmente, uma resposta semântica.
As legendas semânticas agora são classificadas com base na relevância semântica da legenda. Os resultados são então devolvidos por ordem decrescente de relevância.
Capacidades de classificação semântica
Veja o vídeo a seguir para obter uma visão geral dos recursos do AI Search:
Vantagens da classificação semântica
A classificação semântica tem duas vantagens principais em relação aos resultados de pesquisa tradicionais:
- A classificação semântica pode classificar os resultados para corresponder melhor à semântica da consulta original. Isso pode tornar mais provável que os documentos mais úteis apareçam na parte superior dos resultados da pesquisa.
- A classificação semântica pode encontrar cadeias de caracteres nos resultados para renderizar como uma legenda na página de resultados da pesquisa e fornecer uma resposta a uma pergunta.
Limitações de classificação semântica
A classificação semântica é aplicada aos resultados retornados da função de classificação BM25. Embora a classificação semântica possa reclassificar os resultados fornecidos pela função de classificação BM25, ela não fornecerá nenhum documento adicional que não tenha sido retornado pela função de classificação BM25.
A classificação semântica usa os 50 melhores resultados da função de classificação BM25. Se mais de 50 resultados forem retornados, apenas os 50 melhores resultados serão considerados.
Preços de classificação semântica
Estão disponíveis gratuitamente até 1000 consultas de classificação semântica por mês.
Para mais de 1000 consultas por mês, você deve escolher o preço padrão. O custo do preço padrão é baseado no volume de pesquisas, no tipo de pesquisas e na região da pesquisa.
Para obter mais informações sobre preços de classificação semântica, consulte Preços do Azure AI Search