Introdução
A pesquisa semântica aumenta a pesquisa de palavras-chave padrão com semelhança semântica. Esta semelhança significa que uma consulta por "ensolarado" pode corresponder ao texto "luz natural brilhante", mesmo que não haja sobreposição lexical de mais de uma letra. Em vez de semelhança de caracteres, a pesquisa semântica usa vetores de incorporação produzidos por inteligência artificial (IA) para medir a semelhança de consultas e documentos, fornecendo resultados de pesquisa mais relevantes.
Este módulo mostra como habilitar a pesquisa semântica no Banco de Dados do Azure para o servidor flexível PostgreSQL e como usar o Azure OpenAI para gerar incorporações vetoriais.
Cenário
Suponha que você trabalhe em uma empresa que gerencia anúncios de propriedades de férias. Você quer permitir que os clientes pesquisem e reservem anúncios on-line. Um desafio são as muitas palavras diferentes que as pessoas usam para descrever a mesma coisa. Você tem recursos limitados para desenvolver e manter listas de palavras-chave à medida que as descrições mudam e as propriedades vão e vêm, e a entrada manual de palavras-chave é propensa a erros. Você deseja fornecer resultados de pesquisa relevantes sem listas manuais de palavras-chave.
Objetivos de aprendizagem
Você obtém uma visão geral da pesquisa semântica, incorporações e bancos de dados vetoriais. Em seguida, ative as pgvector
extensões e azure_ai
. Com essas extensões, você executará uma pesquisa semântica em colunas vetoriais geradas a partir de incorporações do Azure OpenAI usando a azure_ai
extensão. Por fim, você escreve uma função de pesquisa que recebe uma cadeia de caracteres de consulta, gera incorporações para essa consulta e executa uma pesquisa semântica no banco de dados.
No final desta sessão, você poderá executar pesquisas semânticas usando um banco de dados de servidor flexível do Banco de Dados do Azure para PostgreSQL em relação a incorporações vetoriais geradas pelo Azure OpenAI.